Bayesian Optimization
베이지안 최적화 불필요한 하이퍼 파라미터 반복 탐색을 줄여 빠르게 최적의 하이퍼 파라미터를 찾을 수 있는 방법 하이퍼 파라미터를 선택하는 문제에 대하여 정형화된 방법을 찾지 못해, 경험에 의해서 선택해야 함 사용하는 이유 그리드 서치 or 랜덤 서치는 도출된 하이퍼 파라미터 값을 일일이 모델에 적용한 뒤 성능 비교를 해야 하는 부분이 존재하지만 베이지안
베이지안 최적화 불필요한 하이퍼 파라미터 반복 탐색을 줄여 빠르게 최적의 하이퍼 파라미터를 찾을 수 있는 방법 하이퍼 파라미터를 선택하는 문제에 대하여 정형화된 방법을 찾지 못해, 경험에 의해서 선택해야 함 사용하는 이유 그리드 서치 or 랜덤 서치는 도출된 하이퍼 파라미터 값을 일일이 모델에 적용한 뒤 성능 비교를 해야 하는 부분이 존재하지만 베이지안
설정 matplotlib 그래프를 인라인으로 출력 그림을 저장하는 함수 12345678910111213141516171819202122232425262728293031323334353637383940# 파이썬 ≥3.5 필수import sysassert sys.version_info >= (3, 5)# 사이킷런 ≥0.20 필수import sklearn
데이터 수집 시각화 -> 변수 간의 조합 기초통계 : Feature Engineering Feature Engineering 이상치 처리, 중복값 제거, 문자 데이터 –> 수치 (인코딩) 정규화, 표준화, 도출 변수 및 불필요한 삭제 PCA(차원 축소),EFA 결측치 확인 : 1) 결측치 제거 : 2) 결측치 채우기 - 중간값,
Pandas new usersimport12import numpy as npimport pandas as pd 객체 생성123s = pd.Series([1,3,5,np.nan,6,8])s 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 DataFrameDatetime 인덱
리스트와 튜플12list = [1, 2, "a", 3, 4] # 리스트의 형태tuple = (5, 6, "b", 7, 8) # 튜플의 형태 두 타입 모두 요소의 순서를 관리하지만 기술적으로 유일한 차이점이 있다. 리스트는 가변(mutable)성 튜플은 불변(immutable)성 즉 튜플은 append, insert,