트레이닝용과 테스트용 데이터 나누기
필요한 라이브러리 임폴트
from sklearn.model_selection import train_test_split
train_test_split()
- 데이터셋을 학습용과 테스트용으로 나눠준다
train_test_split(X, y, test_size= 0.2, random_state=3)
# test_size= 0.2 테스트에 20% 사용하겠다 일반적으로 0.2 나 0.25 사용한다
# 각 변수에 저장(순서대로 입력)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.2, random_state=3)
'MACHINE | DEEP LEARNING > Data Preprocessing' 카테고리의 다른 글
[AI] date 컬럼 오브젝트에서 datetime으로 변경하기, 요일 정보 컬럼으로 넣기 _판다스 to_datetime() (0) | 2024.04.24 |
---|---|
[AI] 데이터 불균형 맞추기 _SMOTE() (0) | 2024.04.16 |
[AI] 데이터 정규화, 표준화 Feature Scaling (0) | 2024.04.16 |
[AI] 데이터 레이블 인코딩, 원핫 인코딩 하기 _LabelEncoder(), OneHotEncoder() (0) | 2024.04.16 |
[AI] 인공지능 만들기 전 데이터 처리하기 (0) | 2024.04.16 |