AI
-
pickle 모듈AI 2019. 8. 21. 15:02
Pickle 데이터를 저장하고 불러올때 매우 유용한 라이브러리 클래스 자체를 파일로 저장했다가 그것을 그대로 불러올 수 있다. 원하는 데이터를 자료형의 변경없이 파일로 저장하여 그대로 로드할 수 있다. 데이터를 저장하거나 불러올때 바이트 형식으로 읽거나 쓴다(wb, rb). binary형태로 저장되기 때문에 용량이 작아진다. import pickle # save data = ['a', 'b', 'c'] with open('data.txt', 'wb') as f: pickle.dump(data, f) # load with open('data.txt', 'rb') as f: data = pickle.load(f) 참고 pickle 모듈_Blog python snippets_pickle 파이썬 객체 직렬화
-
Mean squared errorAI 2019. 8. 21. 14:57
MSE(평균 제곱 오차, Mean squared error) 손실함수는 정답에 대한 오류를 숫자로 나타내는 것으로 오답에 가까울수록 큰 값이 나온다. 반대로 정답에 가까울수록 작은 값이 나온다. 알기 쉽고 계산하기도 쉬워서 추청한 값에 대한 정확도 측정을 위해 주로 사용된다. from sklearn.metrics import mean_squared_error y_true = [[0.5, 1],[-1, 1],[7, -6]] y_pred = [[0, 2],[-1, 2],[8, -5]] mean_squared_error(y_true, y_pred) 참고 딥러닝 손실함수_Blog scikit-learn_mean_squared_error()
-
Scikit-learn의 LinearRegression() 함수AI 2019. 8. 21. 14:49
LinearRegression() scikit-learn 패키지를 사용하여 선형 회귀분석을 하는 경우 linear_model 서브 패키지의 LinearRegression 클래스를 사용한다. LinearRegression 클래스 객체 생성 from sklearn.linear_model import LinearRegression lrmodel = LinearRegression() lrmodel.fit(X_train, Y_train) fit 메서드로 모형 추정. 상수항 결합을 자동으로 해주므로 사용자가 직접 add_constant 등의 명령를 써서 상수항 결합을 할 필요는 없다. coef 추정된 가중치 벡터 가중치들을 보여준다. lrmodel.coef_ intercept 추정된 상수항 절편을 나타낸다. lrm..
-
Scikit-learn의 train_test_split() 사용법AI 2019. 8. 21. 14:47
train_test_split() 다양한 기계학습과 데이터 분석 툴을 제공하는 scikit-learn 패키지 중 model_selection에는 데이터 분할을 위한 train_test_split 함수가 있다. train_test_split 함수는 전체 데이터셋 배열을 받아서 랜덤하게 test/train 데이터 셋으로 분리해주는 함수이다. 클래스 값을 포함하여 하나의 데이터로 받는 경우 df_train, df_test = train_test_split(df, test_size=0.4, random_state=0) 클래스를 개별의 배열로 받는 경우 train_x, test_x, train_y, test_y = train_test_split(X, Y, test_size = 0.5) from sklearn.mo..
-
CSV파일 읽기AI 2019. 8. 21. 14:37
CSV(Comma Separated Values) 몇 가지 필드들을 쉼표( , )로 구분한 텍스트 데이터 및 텍스트 파일 확장자: .csv 비슷한 포맷으로는 TSV(탭으로 구분) 나 SSV(반각 스페이스로 구분)가 있다. 엑셀 양식의 데이터를 프로그램에 상관없이 쓰기 위한 데이터 형식 아래는 csv 파일을 읽는 코드의 예시이다. import csv f = open('advertising.csv', 'r', encoding='utf-8') rdr = csv.reader(f) for line in rdr: print(line) f.close() 파일을 계속 열고 있을 필요가 없으므로 with as 문을 이용해서 파일을 닫는 과정을 생략하기도 한다. with open('advertising.csv') as c..