개발학습일지

[Python] 판다스 데이터 생성 시리즈의 기초 데이터 확인 및 in .values 본문

Python/Pandas

[Python] 판다스 데이터 생성 시리즈의 기초 데이터 확인 및 in .values

처카푸 2024. 4. 8. 15:28

판다스 용어 암기는 필수!

판다스의 1차원 데이터 => 시리즈(Serise) 이다

 

판다스 배우기 전까지의 인덱스라는 용어는 : 컴퓨터가 자동으로 매기는 0부터 시작하는 수 이자만

판다스에서는 인덱스라는 용어가 따로 존재한다. 

판다스의 인덱스는, 왼쪽에 행부분에 붙어있는 글자이다

컴퓨터가 자동으로 매기는 인덱스 VS 판다스의 인덱스

index = ['eggs', 'apples', 'milk', 'bread']
data = [30, 6, 'Yes', 'No']

pd.Series(data = data)
# 0     30
# 1      6
# 2    Yes
# 3     No
# dtype: object

^ 판다스의 1차원 데이터인 시리즈! 사람이 억세스 하기 편하게 인덱스 번호를 옆에 써준다

 

- 인덱스 정보 알기 : .index

x.index
# RangeIndex(start=0, stop=4, step=1)

- 벨류 데이터 정보 얻기 : .values

x.values
# array([30, 6, 'Yes', 'No'], dtype=object)

- 쉐입 정보 알기 : .shape

x.shape
# (4,)

- 차원 정보 얻기 : .ndim

x.ndim
# 1

- 몇개의 데이터가 있는지 알기 : .size

x.size
# 4

- 데이터 타입 정보 얻기 : .dtype

x.dtype
dtype('O')

 

- 벨류 값 변수 안에 있는지 확인하기

'Yes' in groceries.values
# True
'eggs' in groceries.values
#False