목록Python (33)
개발학습일지
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/7wc9u/btsGVe95BQB/fKHDgPZMHJWKvqDD9MZ7Rk/img.png)
Python Streamlit 설치하는 방법 스프림릿( Streamlit ) 이란?Python 으로 데이터 분석을 위한 앱을 쉽게 만들어주는 라이브러리이다 설치 방법: 공식사이트(https://streamlit.io/) 접속해 인스톨 카피 후 아나콘다 프롬프트에 입력해 설치 후 사용 설치 명령어 : pip install streamlit 설치 확인- VSCode 에서 코드를 작성 후 저장# 스트림릿 라이브러리를 사용하기 위한 임포트import streamlit as st# 웹 대시보드 개발 라이브러리인, 스트림릿은 # main 함수가 있어야 한다.def main() : passif __name__ == '__main__': main()- 터미널에 명령어 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cuKE3h/btsGUM0lgQD/kOV6dkk8zigicKgOd3QfKk/img.png)
문제 상황: seaborn으로 히트맵을 그리는데, annot=True로 설정해도 숫자가 맨 윗줄만 나온다문제 원인: seaborn 의 버전 오류버전 확인 명령어 : pip show seaborn사용 하던 버전은 0.12.2 이다해당 버전은 오류가 잘 난다고 한다 문제 해결: 버전 업그레이드를 하면 된다버전 업그레이드 명령어 : pip install seaborn --upgrade업그레이드 확인 해결 완료!
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/3B4a1/btsGDIxWhE1/SjpFyKHHFN4C5KHbvBGfx1/img.png)
컬럼을 인덱스로 만들어 보자 - set_index() 사용한다 df.set_index('name', inplace=True) df 인덱스를 컬럼으로 만들어 보자 - reset_index() 사용한다 df.reset_index(inplace=True) df - 인덱스가 컬럼으로 올라왔을때 그 컬럼을 바로 없애고 싶다면 drop= 파라미터를 사용한다 df.reset_index(drop=True, inplace=True)
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/oLkNb/btsGFmt2LoZ/NeuKNXuw0D6RoDLiy1kBOK/img.png)
인덱스 이름, 컬럼 이름을 변경하는 방법은 rename 함수를 사용한다 인덱스 명을 바꾸는 방법 - store3 를 last store로 변경해보자 df.rename( index= { 'store3' : 'last store' }, inplace=True ) df 컬럼 명을 바꾸는 방법 - bikes => hat, suits => shoes 으로 변경해 보자 df.rename( columns= { 'bikes':'hat', 'suits':'shoes' }, inplace=True ) df 새로운 컬럼을 만들고 벨류 값을 넣어주는 방법 - 새로운 컬럼 name 을 만들되, A, B, C 라고 넣자 df['name'] = ['A','B','C'] df
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bVnF8Z/btsGE5ziBbi/FFcsbBTmN0ORpKBJYMJxTK/img.png)
데이터프레임 합치기(concat) : 새로운 판다스 데이터 프레임을 만들어, 기존에 있는 데이터 프레임에 합쳐 보자 - 새로운 데이터프레임을 만든다 new_item = [ {'bikes':20, 'pants':30, 'watches':35, 'glasses':4 } ] new_store_df=pd.DataFrame(data=new_item, index=['store3']) - 기존 데이터프레임 df에 새로운 데이터프레임 new_store_df 합친다 - 비어 있는 컬럼 값은 NaN으로 입력된다 df = pd.concat( [ df, new_store_df ] ) df 데이터 삭제하는 방법 : 행 삭제, 열 삭제 : drop() 함수를 이용하고, axis 만 설정해 주면 된다 - 데이터(인덱스) 행 삭제 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/p4DzD/btsGBQXbOnc/4DvShiQI5bTIkg6nH8Yz71/img.png)
오늘 포스팅에 사용 할 기초데이터 df 데이터프레임 데이터 값 변경 - 판다스이기 때문에 원하는 값 엑세스 후 연산 기호를 사용해준다 - 데이터 엑세스는 .loc[] 또는 .iloc[]를 사용한다 # 스토어 2의 watches 데이터를 , 20으로 변경 해주세여 df.iloc[ 1, 2 ] = df.iloc[ 1, 2 ]+10 df df.loc[ 'store2', 'watches' ] = 20 df 데이터프레임에 새로운 컬럼을 만들고 데이터를 넣어 보자 - shirts 라는 컬럼을 만들고, store1 에는 15개, sotres2에는 2개로 만들어 보자 df['shirts'] = [15, 2] df - pants 값과 shirts 값을 더해서 suits 라는 컬럼을 만들어 보자 df['suits'] = ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/kGu8B/btsGBQbNDQV/QMeamahypgu7PEC4q1Pd0K/img.png)
데이터 프레임에서 원하는 데이터를 엑세스 하는 방법은 총 3가지가 있다 기초 데이터 프레임 df 1. 컬럼의 데이터를 가져오는 방법 : 변수명 바로 오른쪽에 대괄호 사용한다 _리스트에서 사용하던 방법 - 대괄호 안에 원하는 컬럼이름 적기. 1차원으로 가져오면 시리즈라고 함 df['bikes'] >>> store1 20 store2 15 Name: bikes, dtype: int64 2차원 데이터 프레임으로 엑세스 하기 df[ ['bikes', 'watches'] ] >>> bikeswatches store12035 store21510 2. 행과 열의 정보로, 원하는 데이터를 가져오는 방법 - .loc[ , ] 로 가져오는 방법 : 사람이 보기 좋게 만들어진 데이터 프레임의 인덱스와 컬럼으로 데이터를 엑세..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/6DdLz/btsGq85mGLF/uypQVEkEgITPoDUsARoGE0/img.png)
판다스의 2차원 데이터 처리는, 데이터 프레임으로 한다 (DataFrame) 실제 데이터 분석에서는 CSV 파일을 판다스의 '데이터 프레임'으로 읽어와서 작업한다. 변수 명 df = 데이터프레임 약자로 저장 많이 한다 데이터프레임(DataFrame)을 레이블로 생성하기 import pandas as pd # We c# reate a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants'])} df ..