Programming Language/Pandas Library
[Python] 판다스 2차원 데이터, 데이터프레임(DataFrame)
처카푸
2024. 4. 11. 11:47
판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다 (DataFrame)
실제 데이터 분석에서는 CSV 파일을 판다스의 '데이터 프레임'으로 읽어와서 작업한다.
변수 명 df = 데이터프레임 약자로 저장 많이 한다
데이터프레임(DataFrame)을 레이블로 생성하기
import pandas as pd
# We c# reate a dictionary of Pandas Series
items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']),
'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])}
df = pd.DataFrame(data=items)
df
레이블로 만든 df
- 왼쪽 진한 글씨 : 인덱스 (index) => 사람용!!!!!!!!
- 위쪽 진한 글씨 : 컬럼 (column)
- 안쪽에 위치한 데이터 : values
데이터프레임 확인하기
- index
- columns
- values
- shape
- ndim : 차원 알려준다
- info() : 정보를 할려준다
df.index
# Index(['bike', 'book', 'glasses', 'pants', 'watch'], dtype='object')
df.columns
# Index(['Bob', 'Alice'], dtype='object')
df.values
>>>
array([[245., 500.],
[ nan, 40.],
[ nan, 110.],
[ 25., 45.],
[ 55., nan]])
df.shape
# (5, 2)
df.ndim # 차원을 알려주는 함수
# 2
df.info()
>>>
<class 'pandas.core.frame.DataFrame'>
Index: 5 entries, bike to watch
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Bob 3 non-null float64
1 Alice 4 non-null float64
dtypes: float64(2)
memory usage: 120.0+ bytes