Archive: 2024

0

Single_Project_No.3

KPI 도출 비즈니스 전략 아이디어 경진대회 고객 이탈률 이탈 가능성이 높은 고객을 식별하여 이를 줄이기 위한 프로모션 및 할인 제공고객 만족도 조사를 통한 이탈 이유 파악 후 서비스 개선 월별 활성 사용자 수 새로운 제품 또는 서비스 출시를 통한 사용자 유입 확대개인화된 추천 시스템 도입을 통한 사용자 이탈 방지 및 재이용 유도 제품 카테고리별 매출 비중

0

Single_Project_No.2

모델 튜닝 챌린지 : RF 하이퍼파라미터 최적화 경진대회 언어 및 작업툴: Python 내용 RF(랜덤포레스트) 하이퍼파라미터 최적화 결과: 436명 중 104등 최종점수 - 0.80758 상세 페이지 : https://dacon.io/competitions/official/236229/overview/description 코드 : https://gi

0

Single_Project_No.1

소득 예측 AI 해커톤 언어 및 작업툴: Python 내용 개인 특성 데이터를 활용하여 개인 소득 수준을 예측하는 AI 모델 개발 결과: 1,164명 중 416등 최종점수 - 590.56939 상세페이지 : https://dacon.io/competitions/official/236230/overview/description 코드 : https://g

0

Mysql_Pivot

PIVOT 데이터 회전 테이블의 데이터를 행에서 열로 변환 MySQL에는 피벗 테이블을 생성하는 함수가 없음 따라서 사용자가 직접 쿼리문 작성 할 필요가 있음 다음은 필자의 간단한 예시 12345678910111213141516171819202122232425use world;-- 예시 데이터CREATE TABLE sales ( product

0

Pytorch

Pytorch 딥 러닝 오픈 소스 라이브러리 동적 계산 그래프 제공 신경망 훈련 및 딥 러닝 앱 작업 텐서 계산, 자동 미분 지원 ex) 신경망 생성 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162

0

Keras

Keras 딥러닝 모델 구축, 학습 인터페이스 Tensorflow와 함께 사용되며, 간편한 구성과 확장성 제공 ex) 선형회귀 예시(입력 변수와 출력 변수 간의 선형 관계 모델링) 123456789101112131415161718192021222324252627import numpy as npimport tensorflow as tffrom tensorf

0

ANOVA

분산 분석 세 개 이상의 독립 그룹의 평균 간에 통계적으로 유의미한 차이 여부 평가 그룹 간 변동성, 그룹 내 변동성 귀무가설(H0) 모든 그룹의 평균이 동일하다고 가정 대립가설(H1) 적어도 하나의 그룹 평균이 다른 그룹 평균과 다름 F-통계 분산의 비율 값이 크다면 그룹 간 병동성이 그룹 내 변동성보다 크다는 것을 나타냄 자유도 그룹 간 자유도는

0

Random Forest

랜덤 포레스트의사결정 트리를 구성하여 개별 트리의 클래스 분류 또는 회귀 분석 앙상블 학습 알고리즘 의사결정 트리 각 트리는 특성의 하위 집합과 데이터의 무작위 하위 집합을 사용하여 구성 부트스트랩 의사결정 트리를 독립적으로 학습시키는 배깅 기술 사용 각 트리에 대해 원본 데이터 세트의 무작위 샘플이 사용 무작위 기능 하위 집합 각 트리는 임의의 기능

0

K-Means Clustering

K-평균 군집화 비지도 머신러닝 알고리즘 데이터 세트를 K개의 클러스터로 분할하는 것이 목표 각 군집은 서로 유사한 데이터 그룹 중심 클러스터의 중심을 나타내는 특징, 공간의 지점인 K개의 중심을 식별 처음에는 중심이 데이터에서 무작위로 선택 배정 단계 각 데이터는 중심에서 가까운 군집에 할당(유클리드 거리 사용) 업데이트 데이터를 할당 후 데이터의

0

ARIMA

ARIMA(자기회귀 통합 이동 평균)자기회귀(AR) 구성요소(p) 자기회귀 구성 요소는 관찰과 일부 지연된 관찰(이전 시간 단계)간의 관계 캡처 “p”라는 용어는 자기회귀 구성요소의 순서를 나타내며, 고려되는 지연된 관측치 수 통합(I) 구성요소(d) 통합 구성 요소에는 시계열 데이터를 차별화하여 고정시키는 작업이 포함, 정상성은 평균, 분산 등 시계열의