VAE(변분 오토인코더)는 확률 모델을 기반으로 데이터를 학습하는 딥러닝 모델이다.
기본적인 오토인코더(Autoencoder)와 달리, 데이터의 잠재 공간(latent space)을 확률적 분포로 학습하여 보다 다양한 데이터를 생성하는 데 활용할 수 있다.
오토인코더는 입력 데이터를 저차원의 잠재 공간으로 압축하고 다시 복원하는 신경망 모델이다. 이는 주로 데이터 차원 축소, 노이즈 제거 등에 활용된다.
VAE는 오토인코더의 개념을 확장하여, 잠재 공간을 확률적 분포로 학습한다. 즉, 특정 벡터 값이 아니라 평균(mean)과 분산(variance)을 학습하여 다양한 샘플을 생성할 수 있도록 한다.
VAE는 주로 이미지 생성, 데이터 증강, 차원 축소, 스타일 변환 등의 분야에서 활용된다. 예를 들어, 손글씨 숫자 데이터셋(MNIST)에서 새로운 숫자를 생성하는 데 사용될 수 있다.
2013년 킹마(Kingma)와 웰링(Welling)이 발표한 논문 <Auto-Encoding Variational Bayes>에서 VAE의 기본 개념이 소개되었다.