Supervised Learning
Supervised Learning(지도 학습)은 레이블(정답)이 지정된 데이터셋을 사용하여 정의되는 머신 러닝 접근 방식이다.
지도 학습은 아래 두 가지 유형의 문제로 구분한다.
Classification(분류)
- 분류 문제는 알고리즘을 사용하여 개와 고양이를 분리하는 것과 같이 데이터를 특정 범주에 할당한다.
- Linear classifiers, support vector machines, decision trees, random forest 등...
Regression(회귀)
- 회귀는 예측하는 값이 Continuous 한 것을 말한다.
- 수치 값을 예측하는데 유용하다.
- linear regression, logistic regression, polynomial regression 등...
Unsupervised Learning
unsupervised Learning(비지도 학습)은 머신러닝 알고리즘을 사용하여 레이블(정답)이 없는 데이터셋을 분석하고 클러스터링 한다.
이러한 알고리즘은 사람의 개입 없이 데이터에서 숨겨진 패턴을 발견한다. (감독되지 않음)
비지도 학습은 클러스터링, 연관 및 차원 축소 세 가지 주요 작업에 사용된다.
Clustering(클러스터링)
- 레이블이 지정되지 않은 데이터를 그룹화하는 데이터 마이닝 기술.
- K-Mean 클러스터링 등...
Association(연관)
- 다양한 규칙을 사용하여 주어진 데이터셋에서 변수 간의 관계를 찾는 기술.
- 추천 알고리즘
Dimensionality reduction(차원 축소)
- 주어진 데이터셋의 특징(or 차원) 수가 너무 많을 때 사용되는 기술.
- 데이터 무결성을 유지하면서 데이터 입력 수를 관리 가능한 크기로 줄인다.
주요 차이점
두 접근 방식의 주요 차이점은 레이블이 지정된 데이터셋을 사용한다는 것이다.
지도 학습은 레이블이 지정된 입력 및 출력 데이터를 사용하는 반면, 비지도 학습은 사용하지 않는다.
지도 학습에서는 알고리즘이 데이터에 대해 반복적으로 예측하고 정답을 조정하여 훈련 데이터셋에서 "학습"을 한다.
지도 학습은 비지도 학습보다 정확한 경향이 있지만 데이터에 적절하게 레이블을 지정해야 한다는 단점이 있다.
비지도 학습은 모델이 자체적으로 작동하여 레이블이 없는 데이터의 고유 구조를 "발견"한다.
하지만 출력 변수를 검증하려면 사람의 개입이 필요하다. (ex: 추천 엔진이 추천한 내용이 타당한지 검증)
'DeepLearning > Concept' 카테고리의 다른 글
손실 함수 (Loss Function) (0) | 2024.07.10 |
---|---|
1x1 Convolution Layer (0) | 2021.08.17 |
Dropout (0) | 2021.07.16 |
Dilated Convolution(Atrous convolution) (0) | 2021.01.20 |
mAP(mean Average Precision) (0) | 2021.01.06 |