전체 글 477

인공지능 #5 | 결정 트리, 교차 검증, Grid Search, Random Search, 앙상블 학습(Ensemble Learning), 랜덤 포레스트(Random Forest)

5. 트리 알고리즘¶ 문제 = 알코올 도수, pH, 당도 값으로 와인 종류 구별하기 접근법 1. 아는 것으로 풀어보기 (로지스틱 회귀 분석 적용)¶ step 1. 데이터 가공하기 In [1]: import pandas as pd wine = pd.read_csv("https://bit.ly/wine_csv_data") wine.head() Out[1]: alcohol sugar pH class 0 9.4 1.9 3.51 0.0 1 9.8 2.6 3.20 0.0 2 9.8 2.3 3.26 0.0 3 9.8 1.9 3.16 0.0 4 9.4 1.9 3.51 0.0 In [2]: # describe() 메소드 wine.describe() Out[2]: alcohol sugar pH class count 649..

Data Science/AI 2023.03.06

인공지능 #4 | 로지스틱 회귀, 시그모이드 함수, 확률적 경사 하강법 Stochastic Gradient Descent

4. 다양한 분류 알고리즘¶ 로지스틱 회귀, 확률적 경사 하강법 이진 분류, 다중 분류의 차이 4-1. 로지스틱 회귀¶ 접근 1. 아는 걸로 접근해볼까? k-nearest neighbors¶ 즉, 주변 이웃의 클래스 비율을 확률으로 나타내기 데이터 준비하기 In [1]: # 데이터 가져오기 import pandas as pd fish = pd.read_csv("https://bit.ly/fish_csv_data") fish.head() Out[1]: Species Weight Length Diagonal Height Width 0 Bream 242.0 25.4 30.0 11.5200 4.0200 1 Bream 290.0 26.3 31.2 12.4800 4.3056 2 Bream 340.0 26.5 31...

Data Science/AI 2023.03.06

인공지능 #3 | K-nearest neighbor 알고리즘, 선형 회귀, 릿지 회귀, 라쏘 회귀

3. 회귀 알고리즘과 모델 규제¶ 지도 학습 알고리즘은 크게 분류와 회귀로 나뉨 회귀 : 두 변수 사이의 상관관계 분석, 임의의 어떤 숫자를 예측하는 문제 3-1. K-최근접 이웃 회귀¶ 가장 가까운 샘플 k개를 선택 k개의 샘플들의 평균으로 예측값 도출하기 In [3]: import numpy as np # 농어의 길이 perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 2..

Data Science/AI 2023.03.06

인공지능 #2 | 훈련 셋과 테스트 셋, 데이터 전처리

2. 데이터 다루기¶ 2-1. 훈련 세트와 테스트 세트¶ 지도 학습 Supervised Learning : target(정답)을 맞히도록 학습 비지도 학습 Unsupervised Learning : target 없이 입력 데이터만으로 학습 훈련 세트 : 훈련에 사용하는 데이터 테스트 세트 : 평가에 사용하는 데이터 전체 데이터 -> 각 객체는 sample In [9]: fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 3..

Data Science/AI 2023.03.06

인공지능 #1 | 인공지능과 머신러닝, 딥러닝

마켓과 머신러닝¶ 이미지 분류 문제¶ Kaggle 데이터셋 도미 데이터 준비하기 In [23]: # 도미 길이/무게 데이터 - feature bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, ..

Data Science/AI 2023.03.06

[에러 해결] jupyter-nbconvert not found 해결하기

python - VScode fails to export Jupyter notebook to HTML - 'jupyter-nbconvert` not found - Stack Overflow jupyter notebook을 html로 전환하기 — 작은 발자국들의 위대한 여정 (tistory.com) 요즘 로컬에서 주피터 노트북으로 공부한 내용을 기록하고 있다. 주피터 노트북을 html로 변환하여 티스토리에 업로드하려던 중 에러가 발생했다. 에러 로그는 다음과 같다. $ jupyter nbconvert Chapter5.ipynb --to html Traceback (most recent call last): File "/usr/bin/jupyter", line 11, in load_entry_point('j..

Data Science/AI 2023.03.06

백준 Java | 백준 1463번 1로 만들기 (DP)

1463번: 1로 만들기 (acmicpc.net) 1463번: 1로 만들기 첫째 줄에 1보다 크거나 같고, 106보다 작거나 같은 정수 N이 주어진다. www.acmicpc.net Bottom-up 방식으로 DP 배열을 완성해주었다. package DP.P1463; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; public class Main { static int N; static int[] DP; public static void main(String[] args) throws IOException { BufferedReader br = new BufferedReader(new In..

카테고리 없음 2023.02.20

백준 Java | 세그먼트 트리 문제 풀이(BOJ 1275번 커피숍2)

1275번: 커피숍2 (acmicpc.net) 1275번: 커피숍2 첫째 줄에 수의 개수 N과 턴의 개수 Q가 주어진다.(1 ≤ N, Q ≤ 100,000) 둘째 줄에는 처음 배열에 들어가 있는 정수 N개가 주어진다. 세 번째 줄에서 Q+2번째 줄까지는 x y a b의 형식으로 x~y까지의 합 www.acmicpc.net 세그먼트 트리는 3단계로 구성된다. 1. 트리 만들기 2. 트리 업데이트하기 3. 트리 쿼리(누적합 구하기) 처음에 잘못했던 것 - 트리 업데이트에서는 트리 배열 뿐만 아니라 원본 데이터도 값을 업데이트해주어야 한다. package SegmentTree.P1275; import java.io.BufferedReader; import java.io.IOException; import ja..