더미 베리어블 트랩 (Dummy variable trap)
: 딥러닝에서는 컬럼 하나가 연산에 아주 크게 작용하므로, 굳이 없어도 되는 불필요한 컬럼을 없애는 것이다
원핫 인코딩한 결과에서, 가장 왼쪽의 컬럼은 삭제해도 데이터를 표현하는 것에 있어서 아무 문제가 없다.
- France, Germerny, Spain 3개 컬럼으로 원핫 인코딩 되는데
1 0 0
0 1 0
0 0 1
맨 왼쪽 France 컬럼을 삭제해도,
Germerny, Spain
0 0 => France
1 0 => Germeny
0 1 => Spain
잘 입력 된다
1. 넘파이 어레이에서 첫 행빼고 억세스 하기
X = X[ : , 1: ]
2. 데이터 프레임으로 변환하여 드랍
X = pd.DataFrame(X).drop(0, axis=1).values
'MACHINE | DEEP LEARNING > Deep Learning Project' 카테고리의 다른 글
[AI] 딥러닝 ANN 수치 예측 TensorFlow Regression 문제 모델링 (0) | 2024.04.17 |
---|---|
[AI] 딥러닝 최적의 하이퍼 파라미터 찾기 _TensorFlow GridSearch (0) | 2024.04.17 |
[AI] 딥러닝 인공지능 학습시킬 때 에포크(epoch)와 배치사이즈(batch_size) 설정 (0) | 2024.04.17 |
[AI] 딥러닝 분류의 문제 ANN TensorFlow 모델링 (0) | 2024.04.17 |
[AI] 딥러닝 Oprimizer 종류 (0) | 2024.04.16 |