Data Science/AI
핸즈온 머신러닝 1~2장 흐름 정리
토마토.
2021. 7. 22. 16:56
1.
문제를 정의한다.
2.
상황을 판단하기 위한 평가 지표를 마련한다.
3.
데이터를 가져온다.
4.
테스트 세트 만들기(데이터 스누핑 편향, 표본의 대표성, 계층적 샘플링)
5.
데이터 탐색 - 데이터 시각화, 상관관계 조사
6.
데이터 준비 - 데이터 정제(결측치 처리),
7.
특성 스케일링