이 글은 서울대학교 Open Courseware의 데이터마이닝개론 강의 자료를 읽고 풀어쓴 글입니다. 서울대학교 OCW 홈페이지 -> SNU OPEN COURSEWARE | SEOUL NATIONAL UNIVERSITY 왜 데이터 마이닝인가 오늘날 쏟아지는 데이터에는 지식과 가치가 숨어있다. 생성된 데이터에서 지식을 추출해내기 위해서는, 그 전에 데이터를 저장하고 처리하고 분석하는 과정을 거쳐야한다. 데이터 마이닝은 이 중 '분석' 단계에 집중하는 분야이다. 데이터 마이닝이란 데이터 마이닝은 대용량 데이터에서 패턴과 모델을 찾는 기법과 이론을 의미한다. 이때 분석은 타당성(valid), 유용성(useful), 독창성(unexpected), 이해 가능성(understandable)을 갖추어야 한다. 타당성..