🔗 관련 문서: Wikipedia - Zero-Shot Learning
Zero-Shot Learning은 학습 과정에서 직접적으로 본 적이 없는 새로운 과업이나 클래스에 대해 추가 학습 없이 추론을 수행하는 기계학습 기법이다.
이는 대규모 사전학습을 통해 일반화된 표현을 학습한 모델이, 새로운 태스크 정의나 텍스트 설명만으로 해당 문제를 해결할 수 있도록 한다는 점에서 기존의 지도 학습과 구별된다.
Zero-Shot은 모델이 학습 데이터에 포함되지 않은 클래스나 태스크를 처리할 수 있는 능력을 말한다. 예를 들어, 텍스트 분류 모델이 특정 감정 레이블(긍정/부정)만으로 학습되었더라도, 추가 학습 없이 새로운 레이블(중립)을 프롬프트나 설명을 통해 이해하고 분류하는 경우가 이에 해당한다.
핵심은 사전학습(pretraining)과 언어적 설명(semantic description)을 활용하여 모델이 보지 못한 개념을 일반화하는 것이다.
zero-shot 은 쉽게 말하면 "모델이 학습 과정에서 배우지 않은 작업을 수행하는 것"을 의미한다. 다음과 같은 생성모델에서의 예시들을 들 수 있다.
이와 같이 모델이 특정한 작업을 수행하도록 학습 과정에서 가르친적이 없는데도 해당 작업을 수행할 수 있도록 하는 것을 zero-shot learning이라고 한다.
장점
한계