[Home] AI로 돌아가기

🔗 관련 문서: Wikipedia - Transformer Model

Decoder - 디코더

디코더(Decoder)인코더에서 추출된 특징을 기반으로 원하는 형태의 출력을 생성하는 모듈이다. 자연어 처리, 이미지 캡셔닝, 음성 합성 등 다양한 분야에서 결과 생성에 필수적인 역할을 한다.

(1) 디코더란?

디코더인코더의 출력을 바탕으로 최종 결과를 생성하는 신경망 구조이다. 입력 데이터의 종류(텍스트, 이미지, 음성 등)와 태스크에 따라 다양한 구조로 설계된다.

일반적으로 Encoder-Decoder 구조에서 사용되며, 언어 모델에서는 이전 출력과 인코더 정보를 조합하여 다음 출력을 예측한다.

(2) 디코더의 역할

(3) 어텐션 메커니즘과의 관계

어텐션 메커니즘은 디코더에서 매우 중요한 역할을 하며, 입력의 어느 부분에 집중할지 결정한다.

Transformer Decoder 어텐션 구조
인코더 #5(스택 내 최상위 인코더)에서 "it"이라는 단어를 인코딩할 때
어텐션 메커니즘의 일부는 "The Animal"에 초점을 맞추고 있었고,
그 표현의 일부를 "it"의 인코딩에 구웠다.
Jalammar의 Transformer 시각화

(4) 디코더의 활용