728x90
지도학습, 비지도학습
Machine Learning Type
- 지도학습(Supervised): 어떤 종류의 미래값을 예측하냐에따라 2가지로 나뉨
- 회귀(Regression)
- 분류(Classification)
- 비지도 학습Unsupervised): 정답은 없고 입력값만 있다는것이 지도학습과의 가장 큰 차이
- 군집화(Clustering): 정답이 없기때문에 군집화로 사용됨
1. 지도학습
지도학습(Supervised Learning)은 입력 값(x)과 정답(t, label)을 포함하는 Training Data를 이용하여 학습하고, 그 학습된 결과를 바탕으로
미지의 데이터(Test Data)에 대해 미래 값을 예측
하는 방법 ==> 대부분 머신러닝 문제는 지도학습에 해당됨예1) 시험공부 시간(입력)과 Pass/Fail 을이용하여 당락 여부 예측
예2) 집 평수(입력)와 가격데이터(정답) 이용하여 임의의 평수 가격 예측
(1) 회귀(Regression)
- 회귀는 Training Data를 이용하여 연속적인 값을 예측하는 것을 말하며, 집평수와 가격관계, 공부시간과 시험성적 등의 관계임
(2) 분류
- 분류는 Training Data를 이용하여 주어진 입력값이 어떤 종류의 값인지 구별하는 것을 지칭함 (Pass/ Fail 예측)
2. 비지도 학습
- 비지도학습은 Training Data에 정답은 없고 입력 데이터만 있기 때문에, 입력에 대한 정답을 찾는 것이 아닌 입력데이터의
패턴, 특성 등을 학습을 통해 발견하는 방법
을 말함 - ex) 군집화 알고리즘을 이용한 뉴스 그룹팽, 백화점의 상품 추천시스템 등
지도학습과 비지도학습의 비교
지도학습의 분류(Classification)는 입력에 대응되는 결과를 알고있기 때문에 이러한 정답을 가장 잘 나타낼수 있는 임의의 직선을 찾아내 그 직선을 기준으로 나눌수 있다
- Test Data를 통해 유사한 결과값을 예측할수 있다.
비지도학습의 군집화(Clustering)의 경우 입력에 대응되는 가격만 할수있다. 이처럼 비지도 학습에선 정답이 없는 입력데이터만 있기 때문에 이러한 입력데이터의 특성과 분포를 주제 or 유사한 특성끼리 묶는 군집화 알고리즘의 특성을 보인다.
728x90
'Data Science > 머신러닝' 카테고리의 다른 글
딥러닝 기초 나만의 정리 2 (0) | 2020.09.16 |
---|---|
딥러닝 기초 나만의 정리 (0) | 2020.07.08 |
LSTM으로 IMDB 리뷰 감성 분류하기 (0) | 2020.07.02 |
Logistic Regression(Classification) 나만의 정리 (0) | 2020.06.28 |
Linear Regression 나만의 정리 (2) | 2020.06.27 |
수치미분 나만의 정리 (0) | 2020.06.26 |
matplotlib 라이브러리 (0) | 2020.06.25 |
numpy 라이브러리 (1) | 2020.06.24 |