본문 바로가기

Programming Language/Pandas Library8

[Python] 판다스 데이터프레임 컬럼을 인덱스로, 인덱스를 컬럼으로 만들기 _set_index, reset_index 컬럼을 인덱스로 만들어 보자 - set_index() 사용한다 df.set_index('name', inplace=True) df 인덱스를 컬럼으로 만들어 보자 - reset_index() 사용한다 df.reset_index(inplace=True) df - 인덱스가 컬럼으로 올라왔을때 그 컬럼을 바로 없애고 싶다면 drop= 파라미터를 사용한다 df.reset_index(drop=True, inplace=True) 2024. 4. 16.
[Python] 판다스 데이터프레임 인덱스명 변경, 컬럼명 변경(rename) 인덱스 이름, 컬럼 이름을 변경하는 방법은 rename 함수를 사용한다 인덱스 명을 바꾸는 방법 - store3 를 last store로 변경해보자 df.rename( index= { 'store3' : 'last store' }, inplace=True ) df 컬럼 명을 바꾸는 방법 - bikes => hat, suits => shoes 으로 변경해 보자 df.rename( columns= { 'bikes':'hat', 'suits':'shoes' }, inplace=True ) df 새로운 컬럼을 만들고 벨류 값을 넣어주는 방법 - 새로운 컬럼 name 을 만들되, A, B, C 라고 넣자 df['name'] = ['A','B','C'] df 2024. 4. 16.
[Python] 판다스 데이터프레임 합치기(concat), 행 열 삭제하기(drop()), inplace=True 데이터프레임 합치기(concat) : 새로운 판다스 데이터 프레임을 만들어, 기존에 있는 데이터 프레임에 합쳐 보자 - 새로운 데이터프레임을 만든다 new_item = [ {'bikes':20, 'pants':30, 'watches':35, 'glasses':4 } ] new_store_df=pd.DataFrame(data=new_item, index=['store3']) - 기존 데이터프레임 df에 새로운 데이터프레임 new_store_df 합친다 - 비어 있는 컬럼 값은 NaN으로 입력된다 df = pd.concat( [ df, new_store_df ] ) df 데이터 삭제하는 방법 : 행 삭제, 열 삭제 : drop() 함수를 이용하고, axis 만 설정해 주면 된다 - 데이터(인덱스) 행 삭제 .. 2024. 4. 16.
[Python] 판다스 데이터프레임 데이터 값 변경, 데이터 값끼리 연산하여 새로운 컬럼 추가 오늘 포스팅에 사용 할 기초데이터 df 데이터프레임 데이터 값 변경 - 판다스이기 때문에 원하는 값 엑세스 후 연산 기호를 사용해준다 - 데이터 엑세스는 .loc[] 또는 .iloc[]를 사용한다 # 스토어 2의 watches 데이터를 , 20으로 변경 해주세여 df.iloc[ 1, 2 ] = df.iloc[ 1, 2 ]+10 df df.loc[ 'store2', 'watches' ] = 20 df 데이터프레임에 새로운 컬럼을 만들고 데이터를 넣어 보자 - shirts 라는 컬럼을 만들고, store1 에는 15개, sotres2에는 2개로 만들어 보자 df['shirts'] = [15, 2] df - pants 값과 shirts 값을 더해서 suits 라는 컬럼을 만들어 보자 df['suits'] = .. 2024. 4. 16.
[Python] 판다스 데이터프레임에서 원하는 데이터 엑세스하기 _[], loc[], iloc[] 데이터 프레임에서 원하는 데이터를 엑세스 하는 방법은 총 3가지가 있다 기초 데이터 프레임 df 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용한다 _리스트에서 사용하던 방법 - 대괄호 안에 원하는 컬럼이름 적기. 1차원으로 가져오면 시리즈라고 함 df['bikes'] >>> store1 20 store2 15 Name: bikes, dtype: int64 2차원 데이터 프레임으로 엑세스 하기 df[ ['bikes', 'watches'] ] >>> bikeswatches store12035 store21510 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 - .loc[ , ] 로 가져오는 방법 : 사람이 보기 좋게 만들어진 데이터 프레임의 인덱스와 컬럼으로 데이터를 엑세.. 2024. 4. 15.
[Python] 판다스 2차원 데이터, 데이터프레임(DataFrame) 판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다 (DataFrame) 실제 데이터 분석에서는 CSV 파일을 판다스의 '데이터 프레임'으로 읽어와서 작업한다. 변수 명 df = 데이터프레임 약자로 저장 많이 한다 데이터프레임(DataFrame)을 레이블로 생성하기 import pandas as pd # We c# reate a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])} df .. 2024. 4. 11.