Data Science/머신러닝

지도학습과 비지도학습 나만의 정리

코딩은 잼있어 2020. 6. 26. 21:16
728x90

지도학습, 비지도학습

Machine Learning Type

  • 지도학습(Supervised): 어떤 종류의 미래값을 예측하냐에따라 2가지로 나뉨
    • 회귀(Regression)
    • 분류(Classification)
  • 비지도 학습Unsupervised): 정답은 없고 입력값만 있다는것이 지도학습과의 가장 큰 차이
    • 군집화(Clustering): 정답이 없기때문에 군집화로 사용됨

1. 지도학습

  • 지도학습(Supervised Learning)은 입력 값(x)과 정답(t, label)을 포함하는 Training Data를 이용하여 학습하고, 그 학습된 결과를 바탕으로 미지의 데이터(Test Data)에 대해 미래 값을 예측하는 방법 ==> 대부분 머신러닝 문제는 지도학습에 해당됨

    • 예1) 시험공부 시간(입력)과 Pass/Fail 을이용하여 당락 여부 예측

    • 예2) 집 평수(입력)와 가격데이터(정답) 이용하여 임의의 평수 가격 예측

(1) 회귀(Regression)

  • 회귀는 Training Data를 이용하여 연속적인 값을 예측하는 것을 말하며, 집평수와 가격관계, 공부시간과 시험성적 등의 관계임

(2) 분류

  • 분류는 Training Data를 이용하여 주어진 입력값이 어떤 종류의 값인지 구별하는 것을 지칭함 (Pass/ Fail 예측)

2. 비지도 학습

  • 비지도학습은 Training Data에 정답은 없고 입력 데이터만 있기 때문에, 입력에 대한 정답을 찾는 것이 아닌 입력데이터의 패턴, 특성 등을 학습을 통해 발견하는 방법을 말함
  • ex) 군집화 알고리즘을 이용한 뉴스 그룹팽, 백화점의 상품 추천시스템 등

지도학습과 비지도학습의 비교

img

  • 지도학습의 분류(Classification)는 입력에 대응되는 결과를 알고있기 때문에 이러한 정답을 가장 잘 나타낼수 있는 임의의 직선을 찾아내 그 직선을 기준으로 나눌수 있다

    • Test Data를 통해 유사한 결과값을 예측할수 있다.
  • 비지도학습의 군집화(Clustering)의 경우 입력에 대응되는 가격만 할수있다. 이처럼 비지도 학습에선 정답이 없는 입력데이터만 있기 때문에 이러한 입력데이터의 특성과 분포를 주제 or 유사한 특성끼리 묶는 군집화 알고리즘의 특성을 보인다.

728x90