본문 바로가기

분류 전체보기208

[AI] 딥러닝 분류의 문제 ANN TensorFlow 모델링 딥러닝 분류의 문제인 ANN 텐서플로우 모델링 필요한 라이브러리 임폴트 import tensorflow as tf from tensorflow import keras from keras.models import Sequential from keras.layers import Dense 학습시킨 비어있는 인공 지능 model을 Sequential()로 만들어, add 함수로 히든 레이어를 추가하고 아웃풋 레이어도 추가한다 - 동그란모양의 노드를 이어주는 선을 웨이트나 파라미터라고 한다 activation= (함수) 에 sigmoid와 tanh는 기울기 소실때문에 히든레이어에 잘 사용하지 않는다 # 레이어를 담을 수 있는 비어있는 틀을 만든다 model = Sequential() # 비어있는 틀에 히든레이어.. 2024. 4. 17.
[AI] 딥러닝 Oprimizer 종류 옵티마이저(Oprimizer) 종류 - Optimizer란 loss function을 통해 구한 차이를 사용해 기울기를 구하고 Network의 parameter(W, b)를 학습에 어떻게 반영할 것인지를 결정하는 방법이다 - 현재 가장 많이 사용하는 옵티마이저는 Adam 이다 2024. 4. 16.
[AI] 데이터 불균형 맞추기 _SMOTE() 데이터 불균형 맞추기 필요한 라이브러리 임폴트 - 설치 안되어 있을 경우 pip install 검색 _ 구글에 pypi 검색해서 사이트에서 필요한 라이브러리 설치 명령어 찾기 from imblearn.over_sampling import SMOTE SMOTE() - 균형이 맞게 데이터 늘리거나 삭제하는 방법이 있는데, 일반적으로 늘리는 방법을 사용한다 - 늘리는 방법으로 코드를 작성해보자 # 변수에 저장하여 사용 sm = SMOTE(random_state=2) X, y = sm.fit_resample(X, y) 2024. 4. 16.
[AI] Training, Test용 데이터 나누기 _train_test_split() 트레이닝용과 테스트용 데이터 나누기 필요한 라이브러리 임폴트 from sklearn.model_selection import train_test_split train_test_split() - 데이터셋을 학습용과 테스트용으로 나눠준다 train_test_split(X, y, test_size= 0.2, random_state=3) # test_size= 0.2 테스트에 20% 사용하겠다 일반적으로 0.2 나 0.25 사용한다 # 각 변수에 저장(순서대로 입력) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.2, random_state=3) 2024. 4. 16.
[AI] 데이터 정규화, 표준화 Feature Scaling 숫자 데이터 범위를 맞춰주는 피처스케일링 필요한 라이브러리 임폴트 from sklearn.preprocessing import StandardScaler, MinMaxScaler StandardScaler() : 데이터 표준화 # 변수에 저장해서 사용 >>> s_scaler_x = StandardScaler() >>> s_scaler_x.fit_transform(X) MinMaxScaler() : 데이터 정규화(값이 0과 1사이로 나옴) # 변수에 저장해서 사용 >>> m_scaler_x = MinMaxScaler() >>> m_scaler_x.fit_transform(X) 2024. 4. 16.
[AI] 데이터 레이블 인코딩, 원핫 인코딩 하기 _LabelEncoder(), OneHotEncoder() 문자열 데이터를 레이블 인코딩 또는 원핫 인코딩 하기 (LabelEncoder(), OneHotEncoder()) 데이터를 학습하기 위해서는 방정식에 대입되어야 하는데방정식은 수학식이므로 데이터는 모두 숫자로 되어 있어야 한다따라서 문자열 데이터를 숫자로 바꿔줘야 한다 필요한 라이브러리 임폴트import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.preprocessing import LabelEncoder, OneHotEncoderfrom sklearn.compose import ColumnTransformer LabelEncoder() : 문자열 데이터를 정렬해서 순서대로 0부터 시작하는 숫자로 바꿔준다  - 카테.. 2024. 4. 16.