일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Google vs MicorSoft
- 갤럭시탭 with Pen
- Python
- chatgpt vs bard
- robux
- PostgreSQL
- 파이썬 TypeError
- 주상복합용지 분양
- 데이터 리터러시
- 나는 어디로?
- 소형주택 세액감면
- 임대소득외 추가소득이 있을 경우
- 오라클 데이터베이스 내장함수
- 상업시설용지 분양
- 2룸 오피스텔 투자
- chatgpt 100% 신뢰금지
- 종합소득세
- 다주택임대
- 종합과세
- 가장 많이 사용되는 파이썬 패키지
- 가장 많이 사용되는 파이썬 라이브러리
- 오피스텔투자
- 전세보증보험
- 주택임대사업자
- bard 100% 신뢰금지
- 가장 인기있는 파이썬 패키지
- 라이브러리 vs 패키지
- 공개서적
- 가장 인기있는 파이썬 라이브러리
- Google vs OpenAI
All thing of the world!
사이킷런(scikit-learn) fit 메서드 설명 본문
머신러닝에 활용되는 사이킷런(scikit-lean) 패키지의 fit 메서드(method) 설명입니다.
스크립트는 파이썬 스크립트 입니다.
훈련 데이터가 준비되었다면, 머신러닝의 목적에 맞게 훈련을 시켜야 하는데요.
"훈련하라"에 해당하는게 fit입니다.
사용법
import sklearn.neighbors import KNeighborsClassifier
kn = KNeighborsClassifier()
kn.fit($input, $target)
1번째 줄은 사이킷런 패키지에서 k-최근접 이웃 알고리즘 클래스인 KNeighborsClassifier를 임포트하여 사용하겠다.
2번째 줄은 KNeighborsClassifier 클래스를 kn 객체로 만들어 사용하겠다.
3번째 줄은 KNeighborsClassifier의 fit 메소드를 사용하여 훈련시키겠다.
$input data란 훈련할 데이터 중 어떤 대상에 대한 2차원 리스트로 만든 feature 데이터를 말합니다.
예를 들면, A라는 곤충은 다리가 2개고 날개가 2개다, B라는 곤충은 다리가 4개가 날개가 없다.
이런 fact 데이터를 말하는 것이구요.
학습할 만한 충분한 데이터를 데이터셋으로 만들어 입력해 주어야 합니다.
그래야 신뢰도 높은 머신러닝을 만들 수 있겠죠?
$target data란 훈련데이터로 제공한 각 데이터셋($input data)을 사람이 판단하여 알려준 데이터셋 입니다.
어떤 데이터를 주고 파리인지 아닌지 판단하라는 것을 만든다고 했을 때,
input data로 준 첫번째 데이터가 A라 파리가 맞다면 1, 파리가 아니라면 0 이렇게 세팅해 주는 것이지요.
맺음말
이상 간단하고 핵심만 요약한 사이킷런 fit 메서드 사용방법이였습니다.
참고로, fit으로 훈련을 시켰다면, 훈련시킨 데이터의 정확도를 알아내는 메서드는 score입니다.
predict 메서드는 이렇게 훈련시킨 모델에 데이터를 주고 맞춰(예측)보라고 하는 것입니다.
'IT > 인공지능(AI)' 카테고리의 다른 글
데이터 분석, 인공지능(머신러닝/딥러닝)의 대중화 (0) | 2021.05.22 |
---|---|
사이킷런(scikit-learn) KNeighborsClassifier 위주 간단 정리 (0) | 2021.05.16 |