데이터 불균형 맞추기
필요한 라이브러리 임폴트
- 설치 안되어 있을 경우 pip install 검색 _ 구글에 pypi 검색해서 사이트에서 필요한 라이브러리 설치 명령어 찾기
from imblearn.over_sampling import SMOTE
SMOTE()
- 균형이 맞게 데이터 늘리거나 삭제하는 방법이 있는데,
일반적으로 늘리는 방법을 사용한다
- 늘리는 방법으로 코드를 작성해보자
# 변수에 저장하여 사용
sm = SMOTE(random_state=2)
X, y = sm.fit_resample(X, y)
'MACHINE | DEEP LEARNING > Data Preprocessing' 카테고리의 다른 글
[AI] date 컬럼 오브젝트에서 datetime으로 변경하기, 요일 정보 컬럼으로 넣기 _판다스 to_datetime() (0) | 2024.04.24 |
---|---|
[AI] Training, Test용 데이터 나누기 _train_test_split() (0) | 2024.04.16 |
[AI] 데이터 정규화, 표준화 Feature Scaling (0) | 2024.04.16 |
[AI] 데이터 레이블 인코딩, 원핫 인코딩 하기 _LabelEncoder(), OneHotEncoder() (0) | 2024.04.16 |
[AI] 인공지능 만들기 전 데이터 처리하기 (0) | 2024.04.16 |