[Home] AI로 돌아가기
🔗 관련 문서:
Wikipedia - Machine Learning
Learning - 학습
기계 학습(Learning)은 경험 기반으로 성능을 향상시키는 AI의 핵심 개념이다.
다양한 유형의 학습이 존재하며, 데이터의 레이블 유무나 보상 구조에 따라 구분된다.
지도 학습, 비지도학습, 강화 학습
출처: https://m.blog.naver.com/k0sm0s1/221863569856
(1) 지도 학습 (Supervised Learning)
입력 데이터에 정답(레이블)이 포함된 학습. 예측 결과는 회귀(수치형) 또는 분류(카테고리형)로 나뉜다.
- 대표 기법: Decision Tree, SVM, Logistic Regression
지도학습
출처: 서지영, 난생처음 인공지능 입문(2판), 한빛미디어, 2024
(2) 비지도 학습 (Unsupervised Learning)
레이블이 없는 데이터에서 패턴이나 구조를 발견하는 방식이다.
대표적으로 군집화(Clustering)와 차원 축소가 있다.
- 대표 기법: K-Means, KNN, DBSCAN, PCA
그림 1. 지도 학습 vs 비지도 학습
강화 학습은 행동심리학의 ‘스키너의 상자’ 개념에서 유래되었다. 지렛대를 누를 때마다 먹이를 제공하면, 쥐는 점차 더 자주 지렛대를 누르게 된다.
비지도학습
출처: 서지영, 난생처음 인공지능 입문(2판), 한빛미디어, 2024
에이전트(Agent)가 환경과 상호작용하며 보상(Reward)을 최대화하는 방향으로 학습한다.
- DQN, AlphaGo, 옵티머스 젠2 등이 대표 사례
📌 강화 학습 활용 사례
- AlphaGo Zero: 기존 데이터 없이 자가 학습
- 옵티머스 젠2: 강화 학습으로 달걀을 부수지 않고 집기 가능
- RLHF: ChatGPT가 인간 피드백을 기반으로 정렬
그림 2. 강화 학습 적용 사례 (AlphaGo, 로봇 제어, RLHF)
강화학습
출처: 서지영, 난생처음 인공지능 입문(2판), 한빛미디어, 2024
(4) 적은 데이터 및 문맥 기반 학습
- Zero-shot Learning (ZSL): 학습되지 않은 클래스도 예측 가능
- Few-shot Learning (FSL): 적은 데이터로 새로운 분류 학습
- In-Context Learning (ICL): 문맥 기반 예시로 즉시 응답 생성