개발학습일지

[AI] 딥러닝 더미 베리어블 트랩 (Dummy variable trap) 본문

AI/Deep Learning

[AI] 딥러닝 더미 베리어블 트랩 (Dummy variable trap)

처카푸 2024. 4. 17. 17:33

더미 베리어블 트랩 (Dummy variable trap)

:  딥러닝에서는 컬럼 하나가 연산에 아주 크게 작용하므로, 굳이 없어도 되는 불필요한 컬럼을 없애는 것이다

 

원핫 인코딩한 결과에서, 가장 왼쪽의 컬럼은 삭제해도 데이터를 표현하는 것에 있어서 아무 문제가 없다.

- France, Germerny, Spain 3개 컬럼으로 원핫 인코딩 되는데
       1                  0                 0
       0                  1                 0
       0                  0                 1
  맨 왼쪽 France 컬럼을 삭제해도,

  Germerny, Spain
            0               0   => France
            1               0   => Germeny
            0               1   => Spain

  잘 입력 된다

 

1. 넘파이 어레이에서 첫 행빼고 억세스 하기

X = X[ : , 1: ]

 

2. 데이터 프레임으로 변환하여 드랍

X = pd.DataFrame(X).drop(0, axis=1).values