Data Science/AI

핸즈온 머신러닝 1~2장 흐름 정리

토마토. 2021. 7. 22. 16:56

1. 

문제를 정의한다. 

 

2. 

상황을 판단하기 위한 평가 지표를 마련한다. 

 

3. 

데이터를 가져온다. 

 

4. 

테스트 세트 만들기(데이터 스누핑 편향, 표본의 대표성, 계층적 샘플링)

 

5.

데이터 탐색 - 데이터 시각화, 상관관계 조사

 

6. 

데이터 준비 - 데이터 정제(결측치 처리), 

 

7.

특성 스케일링