본문 바로가기

Programming Language28

[Python] 판다스 데이터프레임 인덱스명 변경, 컬럼명 변경(rename) 인덱스 이름, 컬럼 이름을 변경하는 방법은 rename 함수를 사용한다 인덱스 명을 바꾸는 방법 - store3 를 last store로 변경해보자 df.rename( index= { 'store3' : 'last store' }, inplace=True ) df 컬럼 명을 바꾸는 방법 - bikes => hat, suits => shoes 으로 변경해 보자 df.rename( columns= { 'bikes':'hat', 'suits':'shoes' }, inplace=True ) df 새로운 컬럼을 만들고 벨류 값을 넣어주는 방법 - 새로운 컬럼 name 을 만들되, A, B, C 라고 넣자 df['name'] = ['A','B','C'] df 2024. 4. 16.
[Python] 판다스 데이터프레임 합치기(concat), 행 열 삭제하기(drop()), inplace=True 데이터프레임 합치기(concat) : 새로운 판다스 데이터 프레임을 만들어, 기존에 있는 데이터 프레임에 합쳐 보자 - 새로운 데이터프레임을 만든다 new_item = [ {'bikes':20, 'pants':30, 'watches':35, 'glasses':4 } ] new_store_df=pd.DataFrame(data=new_item, index=['store3']) - 기존 데이터프레임 df에 새로운 데이터프레임 new_store_df 합친다 - 비어 있는 컬럼 값은 NaN으로 입력된다 df = pd.concat( [ df, new_store_df ] ) df 데이터 삭제하는 방법 : 행 삭제, 열 삭제 : drop() 함수를 이용하고, axis 만 설정해 주면 된다 - 데이터(인덱스) 행 삭제 .. 2024. 4. 16.
[Python] 판다스 데이터프레임 데이터 값 변경, 데이터 값끼리 연산하여 새로운 컬럼 추가 오늘 포스팅에 사용 할 기초데이터 df 데이터프레임 데이터 값 변경 - 판다스이기 때문에 원하는 값 엑세스 후 연산 기호를 사용해준다 - 데이터 엑세스는 .loc[] 또는 .iloc[]를 사용한다 # 스토어 2의 watches 데이터를 , 20으로 변경 해주세여 df.iloc[ 1, 2 ] = df.iloc[ 1, 2 ]+10 df df.loc[ 'store2', 'watches' ] = 20 df 데이터프레임에 새로운 컬럼을 만들고 데이터를 넣어 보자 - shirts 라는 컬럼을 만들고, store1 에는 15개, sotres2에는 2개로 만들어 보자 df['shirts'] = [15, 2] df - pants 값과 shirts 값을 더해서 suits 라는 컬럼을 만들어 보자 df['suits'] = .. 2024. 4. 16.
[Python] 판다스 데이터프레임에서 원하는 데이터 엑세스하기 _[], loc[], iloc[] 데이터 프레임에서 원하는 데이터를 엑세스 하는 방법은 총 3가지가 있다 기초 데이터 프레임 df 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용한다 _리스트에서 사용하던 방법 - 대괄호 안에 원하는 컬럼이름 적기. 1차원으로 가져오면 시리즈라고 함 df['bikes'] >>> store1 20 store2 15 Name: bikes, dtype: int64 2차원 데이터 프레임으로 엑세스 하기 df[ ['bikes', 'watches'] ] >>> bikeswatches store12035 store21510 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 - .loc[ , ] 로 가져오는 방법 : 사람이 보기 좋게 만들어진 데이터 프레임의 인덱스와 컬럼으로 데이터를 엑세.. 2024. 4. 15.
[Python] 판다스 2차원 데이터, 데이터프레임(DataFrame) 판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다 (DataFrame) 실제 데이터 분석에서는 CSV 파일을 판다스의 '데이터 프레임'으로 읽어와서 작업한다. 변수 명 df = 데이터프레임 약자로 저장 많이 한다 데이터프레임(DataFrame)을 레이블로 생성하기 import pandas as pd # We c# reate a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])} df .. 2024. 4. 11.
[Python] 판다스 시리즈 연산 _더하기, 빼기, 나누기, Boolean indexing (부등호 값 찾기) 판다스 시리즈 연산 _더하기, 빼기 연산 시리즈 데이터 index = ['apples', 'oranges', 'bananas'] data = [10, 6, 3,] fruits = pd.Series(index=index, data= data) fruits >>> apples 10 oranges 6 bananas 3 dtype: int64 - 더하기 : 전체 물품이 입고되었다 모든 물품 +5 해주자 fruits = fruits + 5 fruits >>> apples 15 oranges 11 bananas 8 dtype: int64 - 빼기 : 오렌지가 2개 팔렸다 오렌지만 -2 해주자 fruits['oranges'] = fruits['oranges'] -2 fruits >>> apples 15 oranges.. 2024. 4. 9.