본문 바로가기

분류 전체보기208

[AI] 머신 러닝 Logistic Regression _ 시그모이드(sigmoid) 함수 에측 서비스를 만들 때 선택에 문제를 예측 해야 하는 경우, 기존의 직선의 방정식 함수는 오차가 많아서, 시그노이드함수를 적용하여 정리하기로 했다 이것을 '로지스틱 리그레이션(Logistic Regression)' 이라고 한다 확률값은, 위에서의 시그모이드 함수를 적용한 식을 통해 나온 값이다 예측 값을 0과 1로 나눌수 있는데, 0과 1 사이에 기준이 되는 수인 기준점을 'treshold' 라고 한다 2024. 4. 15.
[Python] 판다스 데이터프레임에서 원하는 데이터 엑세스하기 _[], loc[], iloc[] 데이터 프레임에서 원하는 데이터를 엑세스 하는 방법은 총 3가지가 있다 기초 데이터 프레임 df 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용한다 _리스트에서 사용하던 방법 - 대괄호 안에 원하는 컬럼이름 적기. 1차원으로 가져오면 시리즈라고 함 df['bikes'] >>> store1 20 store2 15 Name: bikes, dtype: int64 2차원 데이터 프레임으로 엑세스 하기 df[ ['bikes', 'watches'] ] >>> bikeswatches store12035 store21510 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 - .loc[ , ] 로 가져오는 방법 : 사람이 보기 좋게 만들어진 데이터 프레임의 인덱스와 컬럼으로 데이터를 엑세.. 2024. 4. 15.
[AI] 머신러닝 Supervised. 학습된 인공지능을 가지고, 신규 데이터 처리 방법 신규 데이터가 왔을 때 처리 하는 방법 - 학습된 인공지능을 저장했을 때와 같은 라이브러리를 임폴트해서 학습된 인공지능을 가져온다 - 임폴트 joblib import joblib regressor = joblib.load('regressor.pkl') ct = joblib.load('ct.pkl') regressor ct 학습(fit) 시킨 인공지능 regressor 학습(fit) 시킨 ct 새로 들어온 데이터 - 임폴트 pandas import pandas as pd - 'State'는 캘리포니아, 연구비 18만, 운영비 20만, 마케팅비 15만 일때 이회사의 수익은 얼마일까요? - 새로운 데이터를 2차원 데이터로 만들어준다 new_data = pd.DataFrame({'R&D Spend':[18000.. 2024. 4. 14.
[AI] 머신 러닝 Linear Regression 후 메모리 파일 저장 _joblib, 피클파일 저장 Linear Regression 을 하고 나면, 컴퓨터를 끄고 켰을 때나 다른 서버에서 사용 해야하는 메모리가 있다 다른 서버에서도 내가 만든 Regression이 동작할 수 있도록 해야 한다 메모리에 있는 인공지능을 파일로 저장하여 사용하면 된다 서비스 배포하기 위한 파일 저장 방법 - 임폴트 joblib import joblib - 실서버에 인공지능을 활용하려면 2개의 파일이 필요하다 - 데이터를 이용해 내가 학습시킨 인공지능인 regressor - 문자열로 작성되어 있던 컬럼을 숫자로 바꿔주는 ct _기초 데이터로 교육 시켜져 있다 - joblib를 이용하여 피클 파일로 저장한다 joblib.dump( regressor, 'regressor.pkl') joblib.dump( ct, 'ct.pkl').. 2024. 4. 14.
[AI] 머신 러닝 Multiple Linear Regression 순서 및 과정 여러개의 변수가 있을때의 leaner regression - 2차원에서는 선 이지만, 3차원에서는 평면이 된다. - 구해야 할 b 가 많다 이제 하나의 예시 데이터로 Multiple Linear Regression 을 해보자 기본 임폴트 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd 기본 데이터 - Profit 수익을 예측하려 한다. df = pd.read_csv('50_Startups.csv') df.head() 1. nan 처리 - isna().sum() 을 통해 각 컬럼 마다 nan의 갯수를 확인한다 - nan 이 있으면 dorpna() 또는 fillna() 를 사용하여 해.. 2024. 4. 14.
[AI] 머신 러닝 Simple Linear Regression 순서 및 과정 데이터셋으로 X, y 의 값은 이미 주어져있다 b0, b1 의 값을 찾아 가는 과정을 학습이라고 부른다 학습이란??? 바로 error(오차)를 줄여 나가는 것이다 모든 관측점(Observation) 에서의 y값의 error(오차)가 존재하고, 이 오차들의 총 합을 줄여 나가면 된다. 이제 하나의 예시 데이터로 Simple Linear Regression 을 해보자 기본 임폴트 # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd 기본 데이터 - 경력과 연봉의 관계 분석을 통해, 누군가 입사했을 때, 그사람의 경력에 맞는 연봉을 제시해 줄 수 있도록 합니다. df = pd.read_csv.. 2024. 4. 14.