[Home] AI로 돌아가기

🔗 관련 문서: Wikipedia - Machine Learning

Learning - 학습

기계 학습(Learning)경험 기반으로 성능을 향상시키는 AI의 핵심 개념이다. 다양한 유형의 학습이 존재하며, 데이터의 레이블 유무나 보상 구조에 따라 구분된다.

(1) 지도 학습 (Supervised Learning)

입력 데이터에 정답(레이블)이 포함된 학습. 예측 결과는 회귀(수치형) 또는 분류(카테고리형)로 나뉜다.

(2) 비지도 학습 (Unsupervised Learning)

레이블이 없는 데이터에서 패턴이나 구조를 발견하는 방식이다. 대표적으로 군집화(Clustering)차원 축소가 있다.

지도학습과 비지도학습
그림 1. 지도 학습 vs 비지도 학습
강화 학습은 행동심리학의 ‘스키너의 상자’ 개념에서 유래되었다. 지렛대를 누를 때마다 먹이를 제공하면, 쥐는 점차 더 자주 지렛대를 누르게 된다.

(3) 강화 학습 (Reinforcement Learning, RL)

에이전트(Agent)환경과 상호작용하며 보상(Reward)을 최대화하는 방향으로 학습한다.

📌 강화 학습 활용 사례

강화 학습 적용 사례
그림 2. 강화 학습 적용 사례 (AlphaGo, 로봇 제어, RLHF)

(4) 적은 데이터 및 문맥 기반 학습