Comparison between adversarial and contrastive adaptation
출처: DOI:10.1007/s00138-022-01317-7
Contrastive Domain Adaptation (대조 도메인 적응, CDA)과 Adversarial Domain Adaptation (적대적 도메인 적응, ADA)은 모두 레이블이 풍부한 소스 도메인(\( D_S \))에서 학습한 모델을 레이블이 부족한 타겟 도메인(\( D_T \))에 일반화시키기 위해 도메인 이동(Domain Shift) 문제를 해결하는 딥러닝 기법이다.
두 방법은 도메인 간의 특징 분포를 맞추는(Alignment) 방식에서 근본적인 차이를 보인다다.
1) Contrastive Domain Adaptation (CDA, 대조 도메인 적응)
CDA는 대조 학습(Contrastive Learning, CL) 기법을 사용하여 특징 공간(Feature Space)을 조정함으로써 도메인 적응을 수행한다.
📌 핵심 원리 및 작동 방식
핵심 원리:
특징 공간에서 같은 클래스에 속하는 샘플들은 도메인에 상관없이 가깝게 만들고, 다른 클래스에 속하는 샘플들은 멀리 밀어내는 방식으로 특징 표현의 식별력(Discriminativeness)을 강화한다.
대조 손실(Contrastive Loss):
긍정 쌍(Positive Pairs)과 부정 쌍(Negative Pairs)을 정의하고, 이 쌍들 간의 거리를 명시적으로 조절하는 대조 손실을 사용한다.
클래스 인식 정렬:
주로 소스 레이블과 타겟의 가짜 레이블 (Pseudo-Labels) 정보를 활용하여, 도메인이 정렬되면서도 클래스별 클러스터 경계를 명확하게 유지한다.
👍 주요 장점
정확한 정렬:
클래스 정보를 활용하여 식별력 있는 특징 표현을 학습한다.
클래스 혼합 방지:
다른 클래스 샘플까지 섞이는 클래스 간 비정렬 위험을 줄인다.
2) Adversarial Domain Adaptation (ADA, 적대적 도메인 적응)
ADA는 적대적 학습(Adversarial Learning), 즉 GAN(Generative Adversarial Network)의 원리를 응용하여 도메인 적응을 수행한다.
📌 핵심 원리 및 작동 방식
핵심 원리:
특징 추출기(\(G\))와 도메인 판별자(\(D\))라는 두 개의 신경망을 경쟁시킨다. 특징 추출기는 판별자가 구별하지 못하도록 도메인 불변 특징(Domain-Invariant Features)을 생성하도록 학습한다.
목표:
두 도메인(\(D_S\)와 \(D_T\))의 전역적인 특징 분포(Global Feature Distribution)가 동일하게 보이도록 만든다.
구현:
특징 추출기에 Gradient Reversal Layer (GRL)를 추가하는 방식으로 널리 구현된다 (예: DANN).
👎 주요 단점
클래스 혼합 위험:
도메인 분포만 맞추고 클래스 정보를 무시할 경우, 특징 공간에서 다른 클래스에 속하는 샘플들이 섞여 식별력이 저하될 수 있다.