카카오AI 부트캠프
0712_이론
jihuSunbae
2024. 7. 12. 10:55
1. 머신러닝
(1) 지도학습
- 관련 모델: 선형회귀, 로지스틱 회귀, 의사결정 나무, K-NN
- 지도학습은 회귀와 분류로 나눌 수 있음
- 회귀: 특정 값을 예측 e.g. 집값 예측
- 단순 선형 회귀: x1과 Y의 관계를 모델링하는 함수
- 다중 선형 회귀: (x1, ..., xN)과 Y관계를 모델링하는 함수
- 분류: 확률론 기반으로 클래스를 분류하는 문제 e.g. 스팸메일 분류
- 로지스틱 회귀 cf) 선형회귀
- SVM, KNN
- 회귀: 특정 값을 예측 e.g. 집값 예측
선형 회귀
(2) 비지도 학습
- k-means, PCA, DBSCAN, 계층적 군집화
- DBSCAN: 밀도 기반 군집화
- 계층적 군집화: 계층적 구조를 탐색하는 알고리즘
(3) 강화 학습
: 에이전트에게 주어진 환경에서 보상을 최대화하는 행동(Policy)를 학습하는 방법
특장점
- 순차적 의사결정 문제 해결: 시퀀스 기반의 문제에서 최적의 행동을 찾는 데 유리
- 적응성: 변화하는 환경에 대해 지속적으로 학습하고 적응할 수 있음
단점
- 복잡성: 학습 과정이 복잡 + 많은 자원이 필요
- 보상 설계: 적절한 보상 함수 설계가 어려울 수 있다.
주요 도전 과제
-
- 보상의 희소성: 특정 행동에 대한 보상이 드물 경우, 학습이 어려울 수 있음
- 고차원 상태 공간: 상태 공간이 매우 크거나 복잡할 경우, 학습이 어려울 수 있음
- 장기 의존성 문제: 긴 시퀀스의 의사결정에서 발생하는 의존성을 처리하는 것이 어려움
- 안정성: 학습 과정의 안정성을 확보하는 것이 중요하며, 불안정한 학습은 잘못된 정책으로 이어질 수 있음