jihuSunbae 2024. 7. 12. 10:55

 

 

1. 머신러닝

(1) 지도학습

  • 관련 모델: 선형회귀, 로지스틱 회귀, 의사결정 나무, K-NN

 

  • 지도학습은 회귀와 분류로 나눌 수 있음
    • 회귀: 특정 값을 예측 e.g. 집값 예측
      • 단순 선형 회귀: x1과 Y의 관계를 모델링하는 함수 
      • 다중 선형 회귀: (x1, ..., xN)과 Y관계를 모델링하는 함수
    • 분류: 확률론 기반으로 클래스를 분류하는 문제 e.g. 스팸메일 분류
      • 로지스틱 회귀 cf) 선형회귀
      • SVM, KNN
선형 회귀 

(2) 비지도 학습

  • k-means, PCA, DBSCAN, 계층적 군집화 
    • DBSCAN: 밀도 기반 군집화
    • 계층적 군집화: 계층적 구조를 탐색하는 알고리즘 

지도학습과 비지도 학습의 장단점!!

(3) 강화 학습 

: 에이전트에게 주어진 환경에서 보상을 최대화하는 행동(Policy)를 학습하는 방법

구성요소

 

특장점

  • 차적 의사결정 문제 해결: 시퀀스 기반의 문제에서 적의 행동을 찾는 데
  • 성: 변화하는 환에 대해 지속적으로 학습하고 적할 수 있

 

단점

  • 복잡성: 학습 과정이 복잡 + 많은 자원이 필요
  • 보상 설계: 적절한 보상 함수 설계가 어려울 수 있다. 

 

주요 도전 과제

    • 보상의 소성: 특정 행동에 대한 보상이 드물 경우, 학습이 어려울 수 있
    • 고차원 상공간: 상공간이 매우 크거나 복잡할 경우, 학습이 어려울 수 있
    • 장기 의존성 문제: 퀀스의 의사결정에서 생하는 의존성을 처리하는 이 어려움
    • 정성: 학습 과정의 정성을 확보하는 요하, 불안정한 학습된 정으로 이어질 수 있