[Home] AI로 돌아가기

One-Hot Encoding - 원-핫 인코딩

"One-Hot Encoding"은 머신러닝/딥러닝에서 "분류(Classification) 문제"를 다룰 때, "범주형 데이터(Categorical Data)를 벡터(Vector) 형태로 변환하는 기법"이다.

(1) 원-핫 인코딩이란?

"One-Hot Encoding"은 "범주형 데이터를 수치형 데이터로 변환"하는 방법 중 하나이다. 변환된 벡터에서 "단 하나의 값(One)만 1(Hot)"이고, 나머지는 모두 0이므로 "One-Hot"이라는 명칭이 붙었다.

(2) 원-핫 인코딩 예제

다음은 "숫자 데이터"와 "텍스트 데이터(범주형 변수)"를 원-핫 인코딩하는 예제이다.

[0, 0, 0, 1, 0, 0, 0, 0, 0, 0]
    빨강 = [1, 0, 0]
    파랑 = [0, 1, 0]
    초록 = [0, 0, 1]
    

(3) 원-핫 인코딩의 장점과 단점