머신 러닝으로 할 수 있는 것
- 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별
- 의료 영상 이미지에 기반한, 종양 판단
- 의심되는 신용카드 거래 감지
- 블로그 글의 주제 분류
- 고객들을 취향이 비슷한 그룹으로 묶기
문제와 데이터 이해하기
- 가지고 이는 데이터가 내가 원하는 문제의 답을 가지고 있는가?
- 내 문제를 가장 잘 해결할 수 있는 머신러닝 방법은 무엇인가
- 문제를 풀기에 충분한 데이터를 모았는가?
- 머신러닝의 성과를 어떻게 측정할 것인가
내 문제를 가장 잘 해결할 수 있는 머신러닝 방법은 무엇인가_에 대한 부분은 항상 밑에 표를 머리 속으로 생각해야한다
Supervised Learning
- 레이블을 가지고 학습시키는 방법인 지도 학습
----------------------------------------------------------------
- Regression(회귀) : 어떠한 숫자 정보(수치)를 사용하여 학습시킨다
예 ) 어떤 사람의 교육수준, 나이, 주거지를 바탕으로 연간 소득을 예측하는 것
예 ) 옥수수 농장에서 전년도 수확량과 날씨, 고용 인원수 등으로 올해 수확량을 예측하는 것
- Classidiation : 맞는가 아닌가, 몇가지 선택사항 중에 뭐가 정답인가를 학습시킨다
예) 웹사이트가 어떤 언어로 되어있는가
예) 사진을 보고, 고양이 인지 강아지 인지, 소인지 분류
Training 과 Test
- 훈련이란, 데이터를 입력하고, 그 결과인 레이블이 나오도록 만드는 과정.
즉, 데이터와 레이블을 통해 학습을 시키는 과정이다
- 테스트란, 학습이 완료된 분류기에, 학습에 사용하지 않은 데이터를 넣어서, 정답을 맞추는지 확인하는 작업
머신러닝을 만들기만 하는 것이 아니라 꼭 제대로된 성능 테스트를 완료 해야한다!!
'MACHINE | DEEP LEARNING > Machine Learning Project' 카테고리의 다른 글
[AI] 머신 러닝 Multiple Linear Regression 순서 및 과정 (0) | 2024.04.14 |
---|---|
[AI] 머신 러닝 Simple Linear Regression 순서 및 과정 (0) | 2024.04.14 |
[AI] 머신러닝 Feature Scaling(StandardScaler(), MinMaxScaler()) / Dataset을 Training과 Test로 나누는 방법 (2) | 2024.04.12 |
[AI] 머신러닝 문자열 데이터를 숫자로 바꾸는 방법_Label Encoding, One Hot Encoding (0) | 2024.04.12 |
[AI] 머신러닝 import dataset, NaN 처리(dropna(), fillna()), X, y 데이터 분리 (1) | 2024.04.12 |