Skip to content
This repository has been archived by the owner on Sep 19, 2022. It is now read-only.

Latest commit

 

History

History
211 lines (163 loc) · 14.4 KB

README.md

File metadata and controls

211 lines (163 loc) · 14.4 KB

Research Archive

논문과 책, 웹사이트 등을 통해 공부하고 연구한 것들을 아카이브합니다.

그리고, 그 외 Data Science를 할 때 알아두면 좋다고 생각되는 것들도 아카이브합니다.

참고 문헌과 스터디 노트, 그리고 가능하다면 재현가능한 코드 또는 재현가능한 간략한 튜토리얼을 함께 제공하고자 합니다.

공부하고 연구했던 큰 주제들입니다:

Time Series

1 추론 모델링 · Regression

Spurious regression

  • 나종화. R 응용 시계열분석. 자유아카데미. 2020.
  • 여러 시계열로 회귀를 수행할 때, 꼭 주의해야 할 알아두어야할 사항
  • 🔗 스터디 노트
  • 🔗 R 튜토리얼: CCF 분석의 허구적 상관 확인 과정 참고

Regression with ARIMA errors

Distributed lag model

  • 나종화. R 응용 시계열분석. 자유아카데미. 2020.
  • 🔗 스터디 노트

Distributed lag non-linear model

2 예측모델링 · Forecasting

Exponential Smoothing

ARIMA model

  • 나종화. R 응용 시계열분석. 자유아카데미. 2020.
  • 🔗 스터디 노트

Prophet

Hierarchical Time Series Forecasting

  • Athanasopoulos, George, Roman A. Ahmed, and Rob J. Hyndman. “Hierarchical Forecasts for Australian Domestic Tourism.” International Journal of Forecasting 25, no. 1 (January 1, 2009): 146–66. https://doi.org/10.1016/j.ijforecast.2008.07.004.
  • Athanasopoulos, George, Rob Hyndman, Roman Ahmed, and Han Lin Shang. “Optimal Combination Forecasts for Hierarchical.” Computational Statistics & Data Analysis 55 (September 1, 2011): 2579–89. https://doi.org/10.1016/j.csda.2011.03.006.
  • Hyndman, Rob J, George Athanasopoulos, and Han Lin Shang. “Hts: An R Package for Forecasting Hierarchical or Grouped Time Series,” n.d., 12.
  • 🔗 스터디 노트
  • 🔗 R 튜토리얼

3 Other techniques

Intervention analysis (Interrupted Time Series)

Dynamic Time Warping (DTW)

  • Berndt, Donald J., and James Clifford. “Using Dynamic Time Warping to Find Patterns in Time Series.” In Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining, 359–70. AAAIWS’94. Seattle, WA: AAAI Press, 1994.
  • 선행 또는 후행하는 시계열, 시차가 존재하나 유사한 패턴이 존재하는 두 시계열을 잡아낼 수 있게끔 해주는 비유사성 측도(거리 측도) 알고리즘
  • DTW distance를 이용해 계층적 군집 분석 수행 가능
  • 🔗 스터디 노트
  • 🔗 R 튜토리얼

Discrete Wavelet Transform (DWT)

  • Graps, Amara. “An Introduction to Wavelets.” IEEE Comp. Sci. Engi. 2 (February 1, 1995): 50–61. https://doi.org/10.1109/99.388960.
  • Li, Daoyuan, Tegawendé F. Bissyandé, Jacques Klein, and Y. L. Traon. “Time Series Classification with Discrete Wavelet Transformed Data: Insights from an Empirical Study.” In SEKE, 2016. https://doi.org/10.18293/SEKE2016-067.
  • 시계열들을 데이터의 열로 나열하여 classification을 수행할 때, 효과적인 차원 감소 방법
  • 일종의 시계열 Feature engineering 기법에 해당
  • 🔗 스터디 노트
  • 🔗 R 튜토리얼

Machine Learning and Statistical Learning

Prerequisite

Ensemble methods

Logistic regression

Generalized Linear Model (GLM) and Generalized Additive Model (GAM)

Deep Learning

Prerequisites

High-Dimensional Data Analysis

  • Breheny, Patrick. High-Dimensional Data Analysis. The University of Iowa, 2016. https://myweb.uiowa.edu/pbreheny/7600/s16/index.html.
    • R 소스코드 및 예제 Dataset 제공
  • 일반적인 기계학습 기반의 예측 모델링으로 접근하기 어려운 n -> p 또는 n < p 인 자료의 예측 모델링에 관한 방법론(여기서 n은 관측치의 수, p는 예측변수의 수)
  • 꼭 고차원 자료가 아닌, 회귀모형의 예측 성능을 높이기 위해서도 사용되는 방법론들에 해당
  • 통계적 가설검정 관점에서 가설 검정시 발생하는 고차원 문제에 관한 솔루션 또한 제공함

1 고차원 자료에 관한 예측 모델링

Prerequisites

Ridge regression

Lasso regression

Bias reduction of Lasso estimator

Variance reduction of Lasso eistimator

Penalized logistic regression

Penalized robust regression

2 통계적 가설검정 관점의 고차원 문제

Prerequisites

Family-Wise Error Rates (FWER)

False Discovery Rates (FDR)

Statistics

  • 통계학, 통계적 가설검정과 관련한 것들을 아카이브 합니다.

구간추정의 해석에 대한 고전적 관점(Frequentist)과 베이지안 관점

검정력(power)과 검정력 함수에 대해

자유도(Degrees of Freedom)

표준편차와 표준오차

"대립가설이 옳다."라는 식의 주장을 지양해야하는 이유

중심극한정리의 의미

Fixed effect와 random effect

Miscellaneous

결정론적 SIR 모형을 이용한 감염병 유행 모델링