본문 바로가기

Programming Language28

[Python] 판다스 데이터 생성 시리즈의 기초 데이터 확인 및 in .values 판다스 용어 암기는 필수! 판다스의 1차원 데이터 => 시리즈(Serise) 이다 판다스 배우기 전까지의 인덱스라는 용어는 : 컴퓨터가 자동으로 매기는 0부터 시작하는 수 이자만 판다스에서는 인덱스라는 용어가 따로 존재한다. 판다스의 인덱스는, 왼쪽에 행부분에 붙어있는 글자이다 컴퓨터가 자동으로 매기는 인덱스 VS 판다스의 인덱스 index = ['eggs', 'apples', 'milk', 'bread'] data = [30, 6, 'Yes', 'No'] pd.Series(data = data) # 0 30 # 1 6 # 2 Yes # 3 No # dtype: object ^ 판다스의 1차원 데이터인 시리즈! 사람이 억세스 하기 편하게 인덱스 번호를 옆에 써준다 - 인덱스 정보 알기 : .index x.. 2024. 4. 8.
[Python] 넘파이 1차원 , 2차원 배열 연산과 브로드캐스팅 1차원 배열의 연산 data = [10, 20, 5, 8, 10, 33, 56, 9, 11, 45, 87, 9, 22, 548, 362, 92] data 의 모든 정보에 +5 를 해라 - 넘파이가 아닌 기본 data 리스트를 사용한 1차원 배열 연산 new_data = [ ] # 새로운 리스트 생성 for item in data : # 데이터 안에서 하나씩 꺼내서 저장할 item 변수 생성 new_data.append(item+5) # item 변수에 +5를 하고 새로운 리스트에 더한 값을 넣어라 new_data # [15, 25, 10, 13, 15, 38, 61, 14, 16, 50, 92, 14, 27, 553, 367, 97] - 넘파이가 아닌 기본 data 리스트를 사용한 리스트 컴프레이션 ne.. 2024. 4. 7.
[Python] 넘파이 슬라이싱, boolean 연산 _ & 그리고, | 또는 사용 boolean 연산은 잘 알고있어야 데이터 분석을 정확하게 할 수 있다. - 변수 X 만들기 X = np.random.randint(1, 100, (4,5)) X # array([[ 9, 25, 68, 88, 80], # [49, 11, 95, 53, 99], # [54, 67, 99, 15, 35], # [25, 16, 61, 59, 17]]) 변수 X에서 80 보다 큰 데이터를 가져와 보자. X>80 # array([[False, False, False, True, False], # [False, False, True, False, True], # [False, False, True, False, False], # [False, False, False, False, False]]) # 불리언으로 확인.. 2024. 4. 7.
[Python] 넘파이 슬라이싱 할 때, 주의 해야 하는 점 넘파이 어레이된 변수 X 는 그래로 두고, 변수 X에서 슬라이싱 한 정보만 따로 저장하여 바꾸고 싶은 경우 X # array([[ 1, 70, 70, 75], # [100, 73, 79, 58], # [ 82, 30, 89, 70]]) Y = X[ : , 1: ] Y # array([[70, 70, 75], # [73, 79, 58], # [30, 89, 70]]) Y[ 2, 2 ]=100 Y # array([[ 70, 70, 75], # [ 73, 79, 58], # [ 30, 89, 100]]) X # array([[ 1, 70, 70, 75], # [100, 73, 79, 58], # [ 82, 30, 89, 100]]) 이렇게 하면 변수 X도 변수 Y에서 수정한 것과 같이 같이 정보가 변경된다 이.. 2024. 4. 7.
[Python] 넘파이 배열(어레이) 인덱싱, 슬라이싱 _변수[ ], 한 줄 띄기, 중복 제거 다차원배열의 인덱스 접근 - 변수[행][열] : 인덱스 번호 입력 - 변수[행, 열] : 인덱스 번호 입력 X = np.random.randint(1, 100, (4,5)) # array([[53, 80, 81, 34, 65], # [40, 45, 64, 96, 17], # [53, 38, 54, 86, 26], # [35, 9, 19, 78, 58]]) X[1][2] # 64 X[1, 2] # 64 슬라이싱(Slicing) - 잘라서 가져오기 - 사람의 언어로 A 부터 B 까지 = A ~ B / 컴퓨터의 언어로 A 부터 B 까지 = A : B - 변수[A:B] : A 부터 B 까지 _인덱스 번호 입력 - 변수[A: ] : A부터 끝까지 # 1) 글자 변수 fullname = '홍길동' fullname[.. 2024. 4. 7.
[Python] 넘파이 최대값, 최소값, 전체합, 전체평균, 표준편차, axis 활용 이번 학습에서 사용 할 배열 X = np.random.randint(1, 100, (4,5)) X # array([79, 36, 16, 10, 93], # [84, 62, 46, 18, 44], # [83, 59, 51, 21, 94], # [79, 96, 20, 46, 12]]) 최대값 - .max( ) X.max() # 96 최소값 - .min( ) X.min() # 10 전체합 - .sum( ) X.sum() # 1049 전체평균 - .mean( ) X.mean() # 52.45 표준편차 - .std( ) X.std() # 29.294154707040107 axis 활용 - 각 행별 또는 각 열별로 데이터를 분석 할 때는 축이 필요하다 - axis = 를 적어서 사용하면 된다 - 열 axis = 1.. 2024. 4. 5.