본문 바로가기

MACHINE | DEEP LEARNING/Machine Learning Project16

[AI] 머신 러닝 피처 스케일링, train test 만들기, LogisticRegression 모델링 시작하기 전 임폴트! # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd import seaborn as sb 이번 포스팅에서 사용 할 데이터 df df = pd.read_csv('Social_Network_Ads.csv') df.head() 나이와 연봉으로 분석해서, 물건을 구매할지 안할지를 분류해보자 1. 데이터에 NaN이 있는지 확인해야한다 df.isna().sum() >>> User ID 0 Gender 0 Age 0 EstimatedSalary 0 Purchased 0 dtype: int64 2. X와 y 값 분리해주기 - 내가 구하고 싶은 곳은 'Purchased' 이고 예.. 2024. 4. 15.
[AI] 머신 러닝 Logistic Regression _ 시그모이드(sigmoid) 함수 에측 서비스를 만들 때 선택에 문제를 예측 해야 하는 경우, 기존의 직선의 방정식 함수는 오차가 많아서, 시그노이드함수를 적용하여 정리하기로 했다 이것을 '로지스틱 리그레이션(Logistic Regression)' 이라고 한다 확률값은, 위에서의 시그모이드 함수를 적용한 식을 통해 나온 값이다 예측 값을 0과 1로 나눌수 있는데, 0과 1 사이에 기준이 되는 수인 기준점을 'treshold' 라고 한다 2024. 4. 15.
[AI] 머신러닝 Supervised. 학습된 인공지능을 가지고, 신규 데이터 처리 방법 신규 데이터가 왔을 때 처리 하는 방법 - 학습된 인공지능을 저장했을 때와 같은 라이브러리를 임폴트해서 학습된 인공지능을 가져온다 - 임폴트 joblib import joblib regressor = joblib.load('regressor.pkl') ct = joblib.load('ct.pkl') regressor ct 학습(fit) 시킨 인공지능 regressor 학습(fit) 시킨 ct 새로 들어온 데이터 - 임폴트 pandas import pandas as pd - 'State'는 캘리포니아, 연구비 18만, 운영비 20만, 마케팅비 15만 일때 이회사의 수익은 얼마일까요? - 새로운 데이터를 2차원 데이터로 만들어준다 new_data = pd.DataFrame({'R&D Spend':[18000.. 2024. 4. 14.
[AI] 머신 러닝 Linear Regression 후 메모리 파일 저장 _joblib, 피클파일 저장 Linear Regression 을 하고 나면, 컴퓨터를 끄고 켰을 때나 다른 서버에서 사용 해야하는 메모리가 있다 다른 서버에서도 내가 만든 Regression이 동작할 수 있도록 해야 한다 메모리에 있는 인공지능을 파일로 저장하여 사용하면 된다 서비스 배포하기 위한 파일 저장 방법 - 임폴트 joblib import joblib - 실서버에 인공지능을 활용하려면 2개의 파일이 필요하다 - 데이터를 이용해 내가 학습시킨 인공지능인 regressor - 문자열로 작성되어 있던 컬럼을 숫자로 바꿔주는 ct _기초 데이터로 교육 시켜져 있다 - joblib를 이용하여 피클 파일로 저장한다 joblib.dump( regressor, 'regressor.pkl') joblib.dump( ct, 'ct.pkl').. 2024. 4. 14.
[AI] 머신 러닝 Multiple Linear Regression 순서 및 과정 여러개의 변수가 있을때의 leaner regression - 2차원에서는 선 이지만, 3차원에서는 평면이 된다. - 구해야 할 b 가 많다 이제 하나의 예시 데이터로 Multiple Linear Regression 을 해보자 기본 임폴트 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd 기본 데이터 - Profit 수익을 예측하려 한다. df = pd.read_csv('50_Startups.csv') df.head() 1. nan 처리 - isna().sum() 을 통해 각 컬럼 마다 nan의 갯수를 확인한다 - nan 이 있으면 dorpna() 또는 fillna() 를 사용하여 해.. 2024. 4. 14.
[AI] 머신 러닝 Simple Linear Regression 순서 및 과정 데이터셋으로 X, y 의 값은 이미 주어져있다 b0, b1 의 값을 찾아 가는 과정을 학습이라고 부른다 학습이란??? 바로 error(오차)를 줄여 나가는 것이다 모든 관측점(Observation) 에서의 y값의 error(오차)가 존재하고, 이 오차들의 총 합을 줄여 나가면 된다. 이제 하나의 예시 데이터로 Simple Linear Regression 을 해보자 기본 임폴트 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd 기본 데이터 - 경력과 연봉의 관계 분석을 통해, 누군가 입사했을 때, 그사람의 경력에 맞는 연봉을 제시해 줄 수 있도록 합니다. df = pd.read_csv.. 2024. 4. 14.