Programming Language/Pandas Library
[Python] 판다스 데이터 생성 시리즈의 기초 데이터 확인 및 in .values
처카푸
2024. 4. 8. 15:28
판다스 용어 암기는 필수!
판다스의 1차원 데이터 => 시리즈(Serise) 이다
판다스 배우기 전까지의 인덱스라는 용어는 : 컴퓨터가 자동으로 매기는 0부터 시작하는 수 이자만
판다스에서는 인덱스라는 용어가 따로 존재한다.
판다스의 인덱스는, 왼쪽에 행부분에 붙어있는 글자이다
컴퓨터가 자동으로 매기는 인덱스 VS 판다스의 인덱스
index = ['eggs', 'apples', 'milk', 'bread']
data = [30, 6, 'Yes', 'No']
pd.Series(data = data)
# 0 30
# 1 6
# 2 Yes
# 3 No
# dtype: object
^ 판다스의 1차원 데이터인 시리즈! 사람이 억세스 하기 편하게 인덱스 번호를 옆에 써준다
- 인덱스 정보 알기 : .index
x.index
# RangeIndex(start=0, stop=4, step=1)
- 벨류 데이터 정보 얻기 : .values
x.values
# array([30, 6, 'Yes', 'No'], dtype=object)
- 쉐입 정보 알기 : .shape
x.shape
# (4,)
- 차원 정보 얻기 : .ndim
x.ndim
# 1
- 몇개의 데이터가 있는지 알기 : .size
x.size
# 4
- 데이터 타입 정보 얻기 : .dtype
x.dtype
dtype('O')
- 벨류 값 변수 안에 있는지 확인하기
'Yes' in groceries.values
# True
'eggs' in groceries.values
#False