[DS] 0. Introduction
Types of Machine Learning
크게 3가지로 분류
- Supervised Learning:
Input에 대해. 모든 정답 Label이 있는 경우
(e.g. 강아지 사진 분류 (Output: O나 X)) - Unsupervised Learning:
궁극적인 Label (Output)이 없음
(패턴 찾기(clustering), feature learning) - Reinforcement Learning
Semi- / Weakly-Supervised Learning
- Semi-supervised learning
(small portion of) labeled data + (Many) unlabeled data - Weakly-supervised learning
원하는 Task에 대한 label이 아닌, 도움이 되는 label이 있는 경우
Self-supervised Learning
자가학습
Data Preparation
- Data exploration
EDA(Exploratory data analysis, 탐색적 데이터 분석) - Data quality
Data error check - Missing values
- Handling outliers
- Data transformation
- Feature selection
- Data sampling