All thing of the world!

사이킷런(scikit-learn) fit 메서드 설명 본문

IT/인공지능(AI)

사이킷런(scikit-learn) fit 메서드 설명

WorldSeeker 2021. 5. 15. 22:00

머신러닝에 활용되는 사이킷런(scikit-lean) 패키지의 fit 메서드(method) 설명입니다. 

스크립트는 파이썬 스크립트 입니다.

훈련 데이터가 준비되었다면, 머신러닝의 목적에 맞게 훈련을 시켜야 하는데요. 

"훈련하라"에 해당하는게 fit입니다. 

사용법

import sklearn.neighbors import KNeighborsClassifier

kn = KNeighborsClassifier()

kn.fit($input, $target)

1번째 줄은 사이킷런 패키지에서 k-최근접 이웃 알고리즘 클래스인 KNeighborsClassifier를 임포트하여 사용하겠다.

2번째 줄은 KNeighborsClassifier 클래스를 kn 객체로 만들어 사용하겠다.

3번째 줄은 KNeighborsClassifier의 fit 메소드를 사용하여 훈련시키겠다.

 

$input data란 훈련할 데이터 중 어떤 대상에 대한 2차원 리스트로 만든 feature 데이터를 말합니다. 

예를 들면, A라는 곤충은 다리가 2개고 날개가 2개다, B라는 곤충은 다리가 4개가 날개가 없다.

이런 fact 데이터를 말하는 것이구요.

학습할 만한 충분한 데이터를 데이터셋으로 만들어 입력해 주어야 합니다. 

그래야 신뢰도 높은 머신러닝을 만들 수 있겠죠?

 

$target data란 훈련데이터로 제공한 각 데이터셋($input data)을 사람이 판단하여 알려준 데이터셋 입니다. 

어떤 데이터를 주고 파리인지 아닌지 판단하라는 것을 만든다고 했을 때,

input data로 준 첫번째 데이터가 A라 파리가 맞다면 1, 파리가 아니라면 0 이렇게 세팅해 주는 것이지요. 

 

맺음말

이상 간단하고 핵심만 요약한 사이킷런 fit 메서드 사용방법이였습니다. 

참고로, fit으로 훈련을 시켰다면, 훈련시킨 데이터의 정확도를 알아내는 메서드는 score입니다.

predict 메서드는 이렇게 훈련시킨 모델에 데이터를 주고 맞춰(예측)보라고 하는 것입니다.

 

 

 

 

Comments