RealNVP - Normalizing Flow 논문 리뷰

This entry is part 12 of 13 in the series Image Generative Model

Image Generative Model

내용 요약

Affine Coupling Layer를 사용하여 Normalizing Flow 모델을 구현한 RealNVP의 핵심 내용을 살펴봅니다.

1. 들어가며

이번 글에서는 2017년 ICLR에 발표된 DENSITY ESTIMATION USING REAL NVP 논문을 리뷰하겠습니다. 이 논문은 RealNVP라고 불리며, 이 글에서도 RealNVP라고 지칭하겠습니다.

Normalizing Flow의 기본 개념과 기존 방법의 문제에 대해서는 딥러닝과 Normalizing Flow 글을 참고 바랍니다.

2. 제안 방법

RealNVP는 NICE모델을 일부 개선한 모델입니다. 바로 제안 방법을 살펴보겠습니다.

2-1. Affine coupling layers의 사용

NICE에서는 coupling layer를 사용하고 내부의 g function으로 additive function을 사용했었습니다. 덕분에 Inversion이 가능하고 Jacobian의 Determinant를 구하기 쉬워 Normalizing Flow를 구현할 수 있었죠. 하지만 내부 함수 g를 단순하게 +를 사용했기에 복잡한 데이터를 표현하기 어렵다는 한계가 있었습니다.

이를 개선하기 위해 RealNVP 에서는 내부 함수 g를 Affine Transformation으로 구성합니다. 이를 Affine Coupling Layer라고 부릅니다. 식은 다음과 같습니다.

덕분에 NICE보다 더 복잡한 데이터를 표현할 수 있게 됩니다.

2-2. Properties

Triangular Matrix의 Determinant는 대각 성분의 곱으로 표현됩니다. 따라서 Affine Transform으로 표현되는 y의 Jacobian을 구해보면 다음과 같습니다.

따라서 det(J)은 다음과 같습니다.

Jacobian의 Determinant가 NICE때 처럼 아주 간단하게 구해지는 모습을 볼 수 있습니다. 게다가 Jacobian의 Determinant를 구할 때 함수 s, t의 Jacobian을 구하지 않아도 되기죠. 따라서 s,t는 복잡한 함수를 사용할 수 있습니다. 그 말은 s, t는 DNN으로 표현할 수 있다는 의미죠.

또한 Inversion이 가능한 함수인지도 확인해야 하는데요. Affine Coupling Layer는 Inversion도 아래와 같이 쉽게 표현됩니다.

4.inverse-function — 그림4. Inverse Function

2-3. Masked convolution

아직 개선해야 할 문제가 남아 있는데요. NICE에서는 Coupling Layer의 Input을 단순히 절반으로 나누었죠. 이렇게 되면 나눈 Input의 절반은 변하지 않고 그대로라는 문제가 있습니다. 이에 RealNVP 모델에서는 Coupling Layer의 Input Split을 위해 Masked Convolution을 사용합니다. 이렇게 되면 다양한 패턴으로 Input을 나눠 Coupling Layer로 구성해줄 수 있겠죠. Masked Convolution의 수식은 다음과 같습니다.