머신러닝(Machine Learning, ML)은 "주어진 데이터의 특성과 패턴을 학습하여 새로운 데이터에 대한 결과를 예측하는 기술"이다. 데이터 마이닝(Data Mining)은 데이터 간의 상관관계를 찾는 것이 주 목적이지만, 머신러닝은 이를 활용해 새로운 데이터를 예측하는 것에 초점을 둔다.
(1) 머신러닝의 종류
지도 학습(Supervised Learning): 입력 데이터와 정답(Label)을 학습하여 새로운 데이터 예측 (예: 선형 회귀, 의사결정나무, 랜덤 포레스트)
비지도 학습(Unsupervised Learning): 정답이 없는 데이터를 군집화하거나 패턴을 찾음 (예: K-Means, PCA, DBSCAN)
강화 학습(Reinforcement Learning): 보상 시스템을 통해 최적의 행동을 학습 (예: AlphaGo, 강화 학습 기반 로봇 제어)
(2) 머신러닝의 학습 과정
데이터 수집 및 전처리: 데이터 정제 및 정규화
특성 엔지니어링(Feature Engineering): 중요한 변수 선택 및 생성
모델 학습(Training): 지도학습 또는 비지도 학습 방법 적용
모델 평가(Evaluation): 정확도, 정밀도, 재현율 등 성능 지표 확인
모델 배포 및 최적화(Deployment & Optimization): 실제 환경에서 적용 및 지속적인 개선