statistical

통계기법

기본적인 통계기법 정리

기술통계

  • 중심 경향 측정 : 평균, 중앙값, 최빈값
  • 분산 측정 : 범위, 분산, 표준 편차
  • 분위수 및 백분위수

추론통계

  • 가설 테스트 : 그룹 간에 유의미한 차이가 있는지 또는 관찰된 효과가 실제인지 확인
  • 신뢰 구간 : 모집단 매개변수가 속할 가능성이 있는 값 범위를 제공
  • 회귀 분석 : 하나 이상의 독립 변수와 종속 변수 간의 관계 조사
  • 분산분석(ANOVA) : 세 개 이상의 독립 그룹의 평균 간에 통계적으로 유의미한 차이가 있는지 테스트
  • 카이제곱 검정 : 범주형 변수 간의 연관성 평가

확률 분포

  • 정규 분포 : 통계 분석에 자주 사용되는 대칭 종 모양 곡선 설명
  • 이항 분포 : 고정된 횟수의 독립적 베르누이 시행에서 성공 횟수 모델링
  • 포아송 분포 : 고정된 시간 또는 공간 간격에서 발생하는 사건의 수 모델링

베이지안 통계

  • 베이지안 추론 : 베이즈 정리를 사용하여 새로운 증거나 데이터를 기반으로 확률 업데이트
  • 베이지안 네트워크 : 변수 집합 간의 확률적 관계를 나타내는 그래픽 모델

비모수적 통계

  • 윌콕슨 순위합 검정 : 두 독립 표본 간의 분포에 차이가 있는지 여부 평가
  • 만위트니 검정 : 두 개의 독립 표본 간에 차이가 있는지 확인하기 위한 비모수 검정
  • Kruskal-Wallis 테스트 : 두 개 이상의 독립적인 그룹을 비교하기 위한 ANOVA의 비모수적 대안

시계열 분석

  • 자기회귀 통합 이동 평균(ARIMA) : 시계열 예측에 사용되는 모델
  • 지수 평활법 : 시간이 지남에 따라 가중치가 감소하면서 과거 관측치를 평균화하는 예측 방법

머신러닝 알고리즘

  • K-평균 군집화 : 유사한 데이터 포인트를 군집으로 그룹화하는 비지도 학습 방법
  • 의사결정 트리 : 분류 및 회귀를 위한 지도 학습 방법
  • 랜덤 포레스트 : 정확도 향상을 위해 여러 의사결정 트리를 결합한 앙상블 학습 방법

생존 분석

  • Kaplan-Meier 추정기 : 일련의 평생 데이터에서 생존 함수 추정
  • Cox 비례 위험 모델 : 다양한 공변량의 위험률 분석

데이터의 성격, 연구, 기본 가정에 따라 어느 방법을 활용할지 결정해야 할 것

Share