본문 바로가기
Programming Language/Pandas Library

[Python] 판다스 2차원 데이터, 데이터프레임(DataFrame)

by 처카푸 2024. 4. 11.

판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다 (DataFrame)
실제 데이터 분석에서는 CSV 파일을 판다스의 '데이터 프레임'으로 읽어와서 작업한다.

변수 명 df = 데이터프레임 약자로 저장 많이 한다

 

데이터프레임(DataFrame)을 레이블로 생성하기

import pandas as pd

# We c# reate a dictionary of Pandas Series 
items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']),
         'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])}
df = pd.DataFrame(data=items)
df

 

 

레이블로 만든 df

 

- 왼쪽 진한 글씨 : 인덱스 (index) => 사람용!!!!!!!!
-  위쪽 진한 글씨 : 컬럼 (column)
-  안쪽에 위치한 데이터 : values

 

데이터프레임 확인하기

- index

- columns

- values

- shape

- ndim : 차원 알려준다

- info() : 정보를 할려준다

df.index
# Index(['bike', 'book', 'glasses', 'pants', 'watch'], dtype='object')
df.columns
# Index(['Bob', 'Alice'], dtype='object')
df.values
>>>
    array([[245., 500.],
           [ nan,  40.],
           [ nan, 110.],
           [ 25.,  45.],
           [ 55.,  nan]])
df.shape
# (5, 2)
df.ndim   # 차원을 알려주는 함수
# 2
df.info()
>>>
    <class 'pandas.core.frame.DataFrame'>
    Index: 5 entries, bike to watch
    Data columns (total 2 columns):
     #   Column  Non-Null Count  Dtype  
    ---  ------  --------------  -----  
     0   Bob     3 non-null      float64
     1   Alice   4 non-null      float64
    dtypes: float64(2)
    memory usage: 120.0+ bytes