[’23 ICML] TabDDPM: Modelling Tabular Data with Diffusion Models
TabDDPM은 Diffusion Model을 활용하여 Tabular 데이터를 생성하는 새로운 접근 방식입니다. 기존 방법들은 범주형 변수와 연속형 변수를 동시에 다루는 데 어려움을 겪었지만, TabDDPM은 연속형 변수에는 Gaussian Diffusion, 범주형 변수에는 Multinomial Diffusion을 적용하여 보다 안정적인 데이터 생성을 가능하게 했어요. Forward 과정에서는 데이터를 점진적으로 노이즈화하고, Reverse 과정에서는 이를 복원하며 원본 분포를 학습합니다. 이를 통해 기존 GAN이나 VAE보다 더 현실적인 Tabular 데이터를 생성할 수 있으며, 학습 안정성과 일반화 성능도 뛰어납니다.