개발학습일지

[AI] Training, Test용 데이터 나누기 _train_test_split() 본문

AI/데이터 전처리

[AI] Training, Test용 데이터 나누기 _train_test_split()

처카푸 2024. 4. 16. 17:41

트레이닝용과 테스트용 데이터 나누기

 

필요한 라이브러리 임폴트

from sklearn.model_selection import train_test_split

 

train_test_split()

- 데이터셋을 학습용과 테스트용으로 나눠준다

train_test_split(X, y, test_size= 0.2, random_state=3)
# test_size= 0.2 테스트에 20% 사용하겠다 일반적으로 0.2 나 0.25 사용한다

# 각 변수에 저장(순서대로 입력)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.2, random_state=3)