MACHINE | DEEP LEARNING/Deep Learning Project
[AI] 딥러닝 더미 베리어블 트랩 (Dummy variable trap)
처카푸
2024. 4. 17. 17:33
더미 베리어블 트랩 (Dummy variable trap)
: 딥러닝에서는 컬럼 하나가 연산에 아주 크게 작용하므로, 굳이 없어도 되는 불필요한 컬럼을 없애는 것이다
원핫 인코딩한 결과에서, 가장 왼쪽의 컬럼은 삭제해도 데이터를 표현하는 것에 있어서 아무 문제가 없다.
- France, Germerny, Spain 3개 컬럼으로 원핫 인코딩 되는데
1 0 0
0 1 0
0 0 1
맨 왼쪽 France 컬럼을 삭제해도,
Germerny, Spain
0 0 => France
1 0 => Germeny
0 1 => Spain
잘 입력 된다
1. 넘파이 어레이에서 첫 행빼고 억세스 하기
X = X[ : , 1: ]
2. 데이터 프레임으로 변환하여 드랍
X = pd.DataFrame(X).drop(0, axis=1).values