[Home] AI로 돌아가기
🔗 관련 문서:
Wikipedia - Domain Adaptation
Domain Adaptation (도메인 적응)
Domain Adaptation은 소스 도메인(Source Domain)에서 학습된 모델이 타겟 도메인(Target Domain)에서도 높은 성능을 유지할 수 있도록 설계된 전이 학습의 한 형태이다.
두 도메인의 데이터 분포가 다르더라도, 특징을 정렬하거나 적대적 학습을 통해 성능 저하 없이 일반화를 달성하는 것이 목적이다.
(1) 정의와 핵심 개념
Domain Adaptation은 소스 도메인에서 충분한 라벨을 가지고 학습한 모델이, 라벨이 없거나 적은 타겟 도메인에서의 성능을 향상시키기 위한 방법론이다.
주된 문제는 도메인 시프트(domain shift)로, 소스와 타겟 간의 데이터 분포 차이를 어떻게 좁히느냐가 핵심 과제이다.
(2) 주요 방법론
- Feature-based 정렬: 두 도메인의 특징 벡터 분포를 정렬 (예: MMD, CORAL)
- Adversarial 학습: 도메인 분류기를 속이는 특성 학습 (예: DANN)
- 공통 잠재 공간으로 사상하여 표현을 일치시킴
- Self-supervised 방식으로 두 도메인을 동시에 재구성하며 공통 특징을 학습
(3) 활용 사례
- 자율주행: 시뮬레이션 환경에서 학습한 모델 → 실제 도로에 적용
- 의료영상: 한 병원의 X-ray → 다른 병원 데이터에 적용
- 음성인식: 깨끗한 녹음 → 노이즈 환경에서도 작동 가능하게
- OCR: 프린트된 글자 학습 → 손글씨 인식
(4) 장점과 한계
장점
- 레이블이 없는 환경에서도 높은 성능을 기대할 수 있다.
- 데이터 재사용성이 높아져 비용 절감에 효과적이다.
- 다양한 도메인 간 전이가 가능해 응용력이 높다.
한계
- 도메인 차이가 너무 크면 적응이 어려울 수 있다.
- 학습 안정성 확보가 어렵고 과적합 가능성 존재.
- 모델 해석성이 낮아 실제 적용이 까다로울 수 있다.
(5) 개념도
다음 그림은 Domain Adaptation의 개념 흐름을 시각적으로 설명한 예시이다.
그림 1. Example of unsupervised domain adaptation
출처: Scholarly Community Encyclopedia