Data Science/AI

인공지능 #6-3 | 비지도학습 - 차원 축소, PCA(주성분 분석)

토마토. 2023. 3. 7. 15:25

Chapter6-3

6. 비지도 학습¶

6-3. 주성분 분석 PCA으로 차원 축소하기¶

차원, 차원 축소¶

feature 하나하나가 데이터의 차원이 된다
feature가 많으면 훈련 데이터에 쉽게 오버피팅된다
주성분 분석 Principal Component Analysis가 대표적인 차원 축소 알고리즘

PCA Principal Component Analysis¶

널리 사용되는 차원 축소 기법 중 하나
데이터 분포를 최대한 보존하면서 데이터를 저차원으로 변환한다
기존의 변수를 조합하여 서로 연관이 없는 새로운 변수(PC, principal component)를 만들어낸다

PCA 클래스

In [23]:

import numpy as np
fruits = np.load("fruits_300.npy")
fruits_2d = fruits.reshape(-1, 100*100)

In [24]:

# PCA 클래스
from sklearn.decomposition import PCA
pca = PCA(n_components=50)
pca.fit(fruits_2d)

print(pca.components_.shape)

draw_fruits(pca.components_.reshape(-1, 100, 100))

(50, 10000)

원본 데이터 재구성

In [25]:

fruits_pca = pca.transform(fruits_2d)

fruits_inverse = pca.inverse_transform(fruits_pca)
print(fruits_inverse.shape)

fruits_reconstruct = fruits_inverse.reshape(-1, 100, 100)
for start in [0, 100, 200]:
    draw_fruits(fruits_reconstruct[start:start+100])
    print()

(300, 10000)

설명된 분산: 주성분이 원본 데이터의 분산을 얼마나 잘 나타내는지 기록한 값

In [26]:

print(np.sum(pca.explained_variance_ratio_))

plt.plot(pca.explained_variance_ratio_)
plt.show()

0.9215172267796036

다른 알고리즘과 함께 사용하기

In [27]:

from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()

target = np.array([0]*100 + [1]*100 + [2]*100)

from sklearn.model_selection import cross_validate
scores = cross_validate(lr, fruits_2d, target)
print(np.mean(scores["test_score"]))
print(np.mean(scores["fit_time"]))

0.9966666666666667
0.7626250267028809

In [ ]:

'Data Science > AI' 카테고리의 다른 글

인공지능 #7-2 \| 심층 신경망 DNN, ReLU, 옵티마이저 (0)	2023.03.08
인공지능 #7-1 \| 인공 신경망 ANN, 텐서플로, dense layer (0)	2023.03.08
인공지능 #6-2 \| 비지도학습 - K Means 알고리즘, 센트로이드, 엘보우 방법 (0)	2023.03.07
인공지능 #6-1 \| 비지도학습 - 클러스터링, 히스토그림 (0)	2023.03.07
[에러 해결] ValueError: Cannot load file containing pickled data when allow_pickle=False 해결하기 (0)	2023.03.07

현재글인공지능 #6-3 | 비지도학습 - 차원 축소, PCA(주성분 분석)

HappyTomatoLife

기록하는 토마토

linked stack, 함수형 언어, linked Queue, binary search, Expression evaluation, linear DS, 조건문, 교육상담, REACT, OCaml, react.js, 반복문, 자료구조, SQL, Doubly Linked List, Deque, DS, maze problem, JavaScript, singly linked list,

Today :
Yesterday :

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

HappyTomatoLife

인공지능 #6-3 | 비지도학습 - 차원 축소, PCA(주성분 분석)

6. 비지도 학습¶

6-3. 주성분 분석 PCA으로 차원 축소하기¶

차원, 차원 축소¶

PCA Principal Component Analysis¶

'Data Science > AI' 카테고리의 다른 글

'Data Science/AI'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

2025. 04
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

인공지능 #6-3 | 비지도학습 - 차원 축소, PCA(주성분 분석)

6. 비지도 학습¶

6-3. 주성분 분석 PCA으로 차원 축소하기¶

차원, 차원 축소¶

PCA Principal Component Analysis¶

'Data Science > AI' 카테고리의 다른 글

'Data Science/AI'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역