판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다 (DataFrame)
실제 데이터 분석에서는 CSV 파일을 판다스의 '데이터 프레임'으로 읽어와서 작업한다.
변수 명 df = 데이터프레임 약자로 저장 많이 한다
데이터프레임(DataFrame)을 레이블로 생성하기
import pandas as pd
# We c# reate a dictionary of Pandas Series
items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']),
'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])}
df = pd.DataFrame(data=items)
df
레이블로 만든 df
- 왼쪽 진한 글씨 : 인덱스 (index) => 사람용!!!!!!!!
- 위쪽 진한 글씨 : 컬럼 (column)
- 안쪽에 위치한 데이터 : values
데이터프레임 확인하기
- index
- columns
- values
- shape
- ndim : 차원 알려준다
- info() : 정보를 할려준다
df.index
# Index(['bike', 'book', 'glasses', 'pants', 'watch'], dtype='object')
df.columns
# Index(['Bob', 'Alice'], dtype='object')
df.values
>>>
array([[245., 500.],
[ nan, 40.],
[ nan, 110.],
[ 25., 45.],
[ 55., nan]])
df.shape
# (5, 2)
df.ndim # 차원을 알려주는 함수
# 2
df.info()
>>>
<class 'pandas.core.frame.DataFrame'>
Index: 5 entries, bike to watch
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Bob 3 non-null float64
1 Alice 4 non-null float64
dtypes: float64(2)
memory usage: 120.0+ bytes
'Programming Language > Pandas Library' 카테고리의 다른 글
[Python] 판다스 데이터프레임 합치기(concat), 행 열 삭제하기(drop()), inplace=True (0) | 2024.04.16 |
---|---|
[Python] 판다스 데이터프레임 데이터 값 변경, 데이터 값끼리 연산하여 새로운 컬럼 추가 (0) | 2024.04.16 |
[Python] 판다스 데이터프레임에서 원하는 데이터 엑세스하기 _[], loc[], iloc[] (2) | 2024.04.15 |
[Python] 판다스 시리즈 연산 _더하기, 빼기, 나누기, Boolean indexing (부등호 값 찾기) (2) | 2024.04.09 |
[Python] 판다스 데이터 생성 시리즈의 기초 데이터 확인 및 in .values (0) | 2024.04.08 |