[Home] AI로 돌아가기
Confusion Matrix - 혼동 행렬
Confusion Matrix(혼동 행렬)는 머신러닝 모델의 성능 평가를 위해 사용되는 행렬로, 실제 값과 예측 값을 비교하여 모델의 성능을 분석하는 데 활용된다.
(1) Confusion Matrix란?
Confusion Matrix는 분류 모델의 예측 성능을 평가하는 데 사용되며, 모델이 얼마나 정확한 예측을 수행했는지 정량적으로 분석하는 데 활용된다.
행은 실제 클래스, 열은 모델이 예측한 클래스를 나타낸다.
(2) Confusion Matrix의 구성 요소
- True Positive (TP): 실제로 긍정이며 모델도 긍정으로 예측한 경우
- True Negative (TN): 실제로 부정이며 모델도 부정으로 예측한 경우
- False Positive (FP, Type I Error): 실제로 부정이지만 모델이 긍정으로 잘못 예측한 경우
- False Negative (FN, Type II Error): 실제로 긍정이지만 모델이 부정으로 잘못 예측한 경우
(3) Confusion Matrix 해석
Confusion Matrix를 기반으로 여러 평가 지표를 계산할 수 있다.
- 정확도 (Accuracy): \( \frac{TP + TN}{TP + TN + FP + FN} \)
- 정밀도 (Precision): \( \frac{TP}{TP + FP} \) - 예측한 Positive 중 실제 Positive의 비율
- 재현율 (Recall): \( \frac{TP}{TP + FN} \) - 실제 Positive 중 모델이 Positive로 예측한 비율
- F1-Score: \( 2 \times \frac{Precision \times Recall}{Precision + Recall} \) - Precision과 Recall의 균형 평가
(4) 예제
아래는 Confusion Matrix의 예제 결과 시각화이다.