댓글 쓰기 권한이 없습니다. 로그인 하시겠습니까?
Python
2019.03.06 15:47
pandas, matplot 자주사용하는 코드
조회 수 7340 댓글 0
import 구문 import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression, LogisticRegression from sklearn.model_selection import cross_val_score, train_test_split jupyter notebook에서 파일에 바로 내용을 써 넣어서 채우고 싶을 때 #test2 파일에 쓰기 %%writefile test2 1,2,3,4,5 2,3,4,5,6 7,8,9,0,1 그래프 한글폰트 설정 # 운영 체제마다 한글이 보이게 하는 설정 # 윈도우 import matplotlib.font_manager if platform.system() == 'Windows': path = "c:\Windows\Fonts\malgun.ttf" font_name = matplotlib.font_manager.FontProperties(fname=path).get_name() plt.rc('font', family=font_name) # 맥 elif platform.system() == 'Darwin': rc('font', family='AppleGothic') # 리눅스 elif platform.system() == 'Linux': rc('font', family='NanumBarunGothic') datetime 데이터 분해하는 코드 train["d-year"] = train["datetime"].dt.year train["d-month"] = train["datetime"].dt.month train["d-day"] = train["datetime"].dt.day train["d-hour"] = train["datetime"].dt.hour train["d-minute"] = train["datetime"].dt.minute train["d-second"] = train["datetime"].dt.second train[["datetime", "d-year", "d-month", "d-day", "d-hour", "d-minute", "d-second"]].head() zip파일 압축풀기 local_zip = './data/cats_and_dogs_filtered.zip' zip_ref = zipfile.ZipFile(local_zip, 'r') zip_ref.extractall('./data') zip_ref.close() 폴더 없으면 폴더 만들기. 그리고 wget if not os.path.exists("./data"): os.makedirs("./data") if not os.path.exists("./data/cats_and_dogs_filtered.zip"): !wget --no-check-certificate \ https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip \ -O ./data/cats_and_dogs_filtered.zip csv 파일 읽기 import pandas as pd df_train = pd.read_csv('data/ratings_train.txt', delimiter='\t', keep_default_na=False) df_test = pd.read_csv('data/ratings_test.txt', delimiter='\t', keep_default_na=False) df_train.head() 학습 데이터, 테스트 데이터로 분리하기 import numpy as np from sklearn.model_selection import train_test_split X = [[0,1],[2,3],[4,5],[6,7],[8,9]] Y = [0,1,2,3,4] # 데이터(X)만 넣었을 경우 X_train, X_test = train_test_split(X, test_size=0.2, random_state=123) # X_train : [[0,1],[6,7],[8,9],[2,3]] # X_test : [[4,5]] # 데이터(X)와 레이블(Y)을 넣었을 경우 X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.33, random_state=321) # X_train : [[4,5],[0,1],[6,7]] # Y_train : [2,0,3] # X_test : [[2,3],[8,9]] # Y_test : [1,4] Dreamy의 코드 스크랩내가 모으고 내가 보는
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Designed by sketchbooks.co.kr / sketchbook5 board skin
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5
Sketchbook5, 스케치북5