실생활의 불안정한 환경에 적합한 효율적인 장기 시계열 예측 모델 연구
A study of an efficient long-term time series forecasting model considering unstable fluctuation in real life.
Global Architecture

모델 기본 구조 출처) D-Linear https://github.com/cure-lab/LTSF-Linear
Background IDEA:
-
실생활의 환경은 과거와 전혀 다른 양상(스케일, 변동성)을 보일 수 있는 매우 불안정한 환경이기에 예측 시점의 추세를 잘 반영해야 한다. (EX. COVID-19으로 인한 매출 급감 등)
-
실생활의 시계열은 매우 복잡한 패턴으로 얽혀있다.
Solution IDEA:
-
실생활의 불안정한 환경에 대응하기 위해 적절한 trend와 그에 따른 scale(locality)을 잘 포착하도록 하자.
-
복잡한 변동을 분해(Decomposition)하여 각 변동 요소의 명확한 패턴을 학습하고, 각 요소의 영향력을 가중치로 환산하여 반영하자.
Previous works:
-
트랜스포머는 Temporal Relation, Trend를 적절하게 포착하지 못한다. (어텐션 매커니즘이 순서와 무관하게 동작한다.)
-
최근에는 하나의 Layer, MLP 구조의 단순한 모델이 트랜스포머의 성능을 뛰어넘는 결과를 보이고 있다.
-
트랜스포머 변형 모델들의 주장과 달리, 여전히 메모리와 시간의 비효율성이 개선되지 못했다.
이에 위와 같은 아이디어를 구체화하여 시계열의 변동들을 효과적으로 파악하는 모델을 디자인한다.
GD-MLP
본 연구에서는 실생활의 특성을 고려한 LSTF 모델을 연구하였다.
이를 위해 최근의 연구 결과를 바탕으로 트랜스포머 구조가 아닌 MLP 구조를 기반으로 한 GD-MLP(Gated Decomposition MLP) 모델을 디자인하였다.
이 모델의 핵심은 두 가지 Gate로,
Input Gate는 인풋 시리즈의 각 포인트의 가중치를 산출하며, Output Gate는 trend와 residual을 가중합하는 데 쓰이는 가중치를 산출하는 역할을 한다.
이때 Output Gate의 결과값은 각각 a와 1-a로 설정하여 서로의 영향력을 공유하도록 했다.
Data
데이터: 벤치마크 데이터 + 서대문구 상권 데이터 (2020년) (target: 유동인구, 매출 건수)
서대문구 상권 데이터, 코로나로 인해 매출의 추세가 매우 불안정했던 2020년의 시계열을 예측한다. 약 (2200개 포인트)
Experiment (🔥 진행 중 )
-
Univariate 예측
-
Multivariate 예측
-
파라미터 최적화
-
Gate, MLP 활성화 함수에 따른 파라미터 최적화
-
Ma의 커널 사이즈, 은닉층 노드 수 등 하이퍼 파라미터 최적화
-
로컬 회귀로 추세 변동 추출하기
https://reign2121.notion.site/GD-MLP-e6154d388eb14c1bbdc5f2bfdd0ecfb0 (실험일지 참조)