Data Science 52

인공지능 #3 | K-nearest neighbor 알고리즘, 선형 회귀, 릿지 회귀, 라쏘 회귀

3. 회귀 알고리즘과 모델 규제¶ 지도 학습 알고리즘은 크게 분류와 회귀로 나뉨 회귀 : 두 변수 사이의 상관관계 분석, 임의의 어떤 숫자를 예측하는 문제 3-1. K-최근접 이웃 회귀¶ 가장 가까운 샘플 k개를 선택 k개의 샘플들의 평균으로 예측값 도출하기 In [3]: import numpy as np # 농어의 길이 perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 2..

Data Science/AI 2023.03.06

인공지능 #2 | 훈련 셋과 테스트 셋, 데이터 전처리

2. 데이터 다루기¶ 2-1. 훈련 세트와 테스트 세트¶ 지도 학습 Supervised Learning : target(정답)을 맞히도록 학습 비지도 학습 Unsupervised Learning : target 없이 입력 데이터만으로 학습 훈련 세트 : 훈련에 사용하는 데이터 테스트 세트 : 평가에 사용하는 데이터 전체 데이터 -> 각 객체는 sample In [9]: fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 3..

Data Science/AI 2023.03.06

인공지능 #1 | 인공지능과 머신러닝, 딥러닝

마켓과 머신러닝¶ 이미지 분류 문제¶ Kaggle 데이터셋 도미 데이터 준비하기 In [23]: # 도미 길이/무게 데이터 - feature bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, ..

Data Science/AI 2023.03.06

[에러 해결] jupyter-nbconvert not found 해결하기

python - VScode fails to export Jupyter notebook to HTML - 'jupyter-nbconvert` not found - Stack Overflow jupyter notebook을 html로 전환하기 — 작은 발자국들의 위대한 여정 (tistory.com) 요즘 로컬에서 주피터 노트북으로 공부한 내용을 기록하고 있다. 주피터 노트북을 html로 변환하여 티스토리에 업로드하려던 중 에러가 발생했다. 에러 로그는 다음과 같다. $ jupyter nbconvert Chapter5.ipynb --to html Traceback (most recent call last): File "/usr/bin/jupyter", line 11, in load_entry_point('j..

Data Science/AI 2023.03.06

MLOps | MLOps의 필요성, 개념과 MLOps 관련 상용 서비스(MakinaRocks Link)

Introduction to MLOps 서울대학교 컴퓨터공학부 데이터마이닝개론 특강(2022학년도, 강유 교수님)을 정리한 내용입니다. 강연자 소개 Yongsub Lim co-founder & chief data scientist of MakinaRocks Yongsub Lim Making industrial technology intelligent 목차 advance of AI/ML Capabilities Why MLOps What is MLOps When MLEs use MLOps MakinaRocks Link with Demo AI/ML의 진보 Number of Publications in NeurIPS 10년 동안 6배 이상 증가함 Accuracy of Image Classification Ima..

데이터마이닝 #0 | 데이터 마이닝이란? 데이터마이닝의 주제, 분야, 응용

이 글은 서울대학교 Open Courseware의 데이터마이닝개론 강의 자료를 읽고 풀어쓴 글입니다. 서울대학교 OCW 홈페이지 -> SNU OPEN COURSEWARE | SEOUL NATIONAL UNIVERSITY 왜 데이터 마이닝인가 오늘날 쏟아지는 데이터에는 지식과 가치가 숨어있다. 생성된 데이터에서 지식을 추출해내기 위해서는, 그 전에 데이터를 저장하고 처리하고 분석하는 과정을 거쳐야한다. 데이터 마이닝은 이 중 '분석' 단계에 집중하는 분야이다. 데이터 마이닝이란 데이터 마이닝은 대용량 데이터에서 패턴과 모델을 찾는 기법과 이론을 의미한다. 이때 분석은 타당성(valid), 유용성(useful), 독창성(unexpected), 이해 가능성(understandable)을 갖추어야 한다. 타당성..

서울대학교 AI연구원 근로 장학생 합격 후기

1. 지원 동기 2022년 2학기에 교육학과 과사무실에서 근로장학을 했다. 근장으로 과사무실에 드나들면서 교육학과가 어떤 곳인지 알 수 있었다. - 교육학과의 재정 상태 - 교육학과 조교 일, 대학원 생활 - 등등등 나는 내부자가 아니라서 윗공대를 잘 모르는 게 취약점이다보니 1학기 때 윗공대를 파악할 수 있는 방법이 될 것이라고 생각해서 AI연구원에 지원했다. 2. 신청 방법 & 자기소개서 우선 마이스누에서 신청한 뒤에, 자기소개서를 작성해서 담당 직원분께 보냈다. 근로장학을 통해 AI연구원의 구성원이 되어 홍보와 운영에 기여하고 싶습니다. * AI연구원에서 근로하고 싶습니다. 저는 수학과 인공지능을 좋아하며, 연합전공 인공지능에 선발되어 수업을 듣고 있습니다. AI 원천 기술부터 응용까지 연구하는 A..

Data Science 2022.02.21

MySQL | CRUD를 위한 기본 문법

쿼리 목록 CREATE DATABASE stock USE stock SHOW DATABASES SELECT * FROM stock_name CREATE TABLE stock_name ( Date DATE, Open float, High float, Low float, Close float, Volume INT ) DESC INSERT INTO %s (Date, Open, High, Low, Close, Volume)" % (stock_name) + "VALUES ('%s', %f, %f, %f, %f, %i) MySQL 구문 일반적으로 세미콜론을 붙인다. 대소문자를 구분하지 않는다. 주석 # 주석 -- 주석 /* 주석 */ 주요 구문 CREATE DATABASE CREATE TABLE INSERT INT..

Data Science 2021.12.28

window에서 koNLPy 사용하기

사용자 등록 단어 사용하고 싶으면 형태소 분석기 Mecab 사용하기 A to Z(설치부터 단어 우선순위 등록까지) (velog.io) 형태소 분석기 Mecab 사용하기 A to Z(설치부터 단어 우선순위 등록까지) 사전 사용이 까다로워서 정리해보고자 한다. velog.io 엑세스 에러 발생시 (나의 경우, visual studio code에서 해당 파일을 사용중이라 엑세스 거부 떴음) Tomcat 서버 에러-Could not delete[파일이름]. May be locked by another process. (tistory.com) Tomcat 서버 에러-Could not delete[파일이름]. May be locked by another process. 아아 일하다가 갑자기 tomcat 서버 오류가..

Data Science 2021.12.23