Home

0

Team_Project_No.1

Team_project 11. Tabular Playground Series - Apr 2021 언어 및 작업툴: Python 인원: 3명 기간: 2021.04.19 - 2021.05.01 내용가공된 타이타닉 생존자 데이터를 사용하여 해당 데이터에 맞는 생존자 예측하기 기여: pycaret모델 만들기 및 파라미터 모델튜닝 결과: 1,244팀중 348등(T

0

Bayesian Optimization

베이지안 최적화 불필요한 하이퍼 파라미터 반복 탐색을 줄여 빠르게 최적의 하이퍼 파라미터를 찾을 수 있는 방법 하이퍼 파라미터를 선택하는 문제에 대하여 정형화된 방법을 찾지 못해, 경험에 의해서 선택해야 함 사용하는 이유 그리드 서치 or 랜덤 서치는 도출된 하이퍼 파라미터 값을 일일이 모델에 적용한 뒤 성능 비교를 해야 하는 부분이 존재하지만 베이지안

0

상자안의 텍스트

상자 안의 텍스트출력 입력받은 수 만큼 양 옆의 공백을 만든 뒤 *로 텍스트를 감싼다. 1234567891011121314151617181920212223242526272829303132333435363738394041424344#include <iostream>#include <string>using namespace std;int

0

다중 분류

다중 분류 둘 이상의 클래스를 분류하는 것 다중 분류기를 구현하는 기법으로는 SGD 분류기, 랜덤 포레스트 분류기, 나이브 베이즈분류기 같은 알고리즘으로 여러 개의 클래스를 직접 처리하거나, 이진 분류기(로지스틱 회귀, 서포트 벡터 머신 분류기 등)을 여러 개 사용해 다중 클래스를 분류하는 방법이 있다 이진 분류기를 여러개를 사용하여 다중 클래스를 분류할

0

회귀 평가

회귀 평가회귀 평가 지표 실제 값과 예측값의 차이를 기반으로 함 MAE, MSE, RMSE, RMSLE는 값이 작을수록 회귀 성능이 좋은 것 값이 작을수록 예측값과 실제값의 차이가 없다는 것을 의미 MSE(Mean Squared Error) 실제 값과 예측 값의 차이를 제곱해 평균한 것 MAE(Mean Absolue Error) 실제 값과 예측 값의 차

0

성능 측정

성능 측정 정확도 혼동 행렬 정밀도 재현율 F1 Score ROC curve AUC 정확도(Accuracy) 전체 값 중에 올바르게 예측한 값이 몇 개인지 판단 직관적으로 모델 예측 성능을 나타내는 평가 지표 예측결과가 동일한 데이터 건수 / 전체 예측 데이터 건수 혼동 행렬(Confusion matrix) 모델의 성능을 평가할 때 사용되는 지표 예측

0

기초통계 자료

https://github.com/KJM94/R_prac/tree/main/2021_04_05_%EA%B8%B0%EC%B4%88%ED%86%B5%EA%B3%84%EB%B0%9C%ED%91%9C

0

로지스틱 회귀

로지스틱 회귀 분석 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘 독립변수와 종속변수의 관계를 찾음으로써, 새로운 독립변수의 집합이 주어졌을 때, 종속 변수의 값을 예측할 수 있음 이항 로지스틱 회귀와 다항 로지스틱 회귀 이항 로지

0

회귀분석

회귀분석 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 기법 변수들 사이의 인과관계를 밝히고 모형을 적합(fit)하여 관심 있는 변수를 예측하거나 추론하기 위한 분석 방법 독립 변수와 종속변수의 개수 및 특성에 따라 단순 회귀, 다중 회귀, 다항 회귀, 곡선 회귀, 로지스틱 회귀, 비선형 회귀로 분류 회귀분석의 요소 독립변수(x)

0

상관분석

상관분석 연속 변수로 측정된 두 변수간의 선형 관계를 분석하는 기법 두 변수 중 적어도 하나의 변수는 정규분포일 것 연속형 두 변수 간에는 선형적인 관계일 것 공분산 2개의 확률 변수의 상관 정도를 나타내는 값 만약 하나의 값이 상승하는 경향을 보이면서 다른 값도 상승 -> 공분산 값은 양수, 반대면 음수를 보임 공분산 값만으로는 상승, 하강