다중 회귀 모델에서, 목표 예상 변수(forecast variable)의 선형 조합을 이용해, 관심 있는 변수를 예측한다. 

자기 회귀(autoregressive) 모델에서는, 변수의 과거 값의 선형 조합을 이용하여 관심 있는 변수를 예측한다.

autoregressive라는 단어에는 자기 자신에 대한 변수의 회귀라는 의미가 있다.

 

따라서, 차수 p의 자기회귀 모델(autoregressive models)은 다음과 같은 수학적 공식을 따른다.

y(t)의 시차 값을 예측변수(predictor)로 다루는 것만 제외하면 다중 회귀와 비슷하다.

 

다중회귀 모델

위 자기회귀 모델을 p 자기회귀 모델인 AR(p) 모델이라 부르자.

 

자기회귀 모델(autoregressive model)은 다양한 종류의 서로 다른 시계열 패턴을 매우 유연하게 다루는 장점이 있다.

매개변수를 다르게 설정한 자기회귀 모델로부터 얻은 데이터의 두가지 예.

AR(1): Yt=18-0.8Y(t-1)+E(t)

AR(2): Yt=8+1.3Y(t-1)-0.7Y(t-2)+E(t)

*두 모델 모두, E(t)는 평균이 0, 분산이 1인 정규 분포를 따르는 백색잡음(White noise)이다.

두 시계열은 AR(1) 모델과 AR(2)모델로 얻은 시계열이다. 매개변수 ϕ1,…,ϕp 을 바꾸면 다른 시계열 패턴이 나온다.

오차항 εt의 분산은 시계열의 패턴이 아니라 눈금만 바꿀 것이다.

 

AR(1) 모델은:

  • ϕ1=0일 때, yt는 백색잡음과 같다.
  • ϕ1=1이고 c=0일 때, yt는 확률보행 모델과 같다;
  • ϕ1=1이고 c≠0일 때, yt는 표류가 있는 확률보행 모델과 같다.
  • ϕ1<0일 때, yt는 평균값을 중심으로 진동하는 경향을 나타낸다.

보통은 자기회귀 모델을 정상성을 나타내는 데이터에만 사용한다. 이 경우, 매개변수 값에 대한 몇몇 제한조건이 필요하다.

  • AR(1) 모델의 경우: −1<ϕ1<1
  • AR(2) 모델의 경우: −1<ϕ2<1, ϕ1+ϕ2<1, ϕ2−ϕ1<1

p>=3일 때는, 제한조건이 훨씬 복잡하다. 

모델을 다룰 때 R이나 파이썬에서 이러한 제한조건을 처리해준다.

 

[출처:otexts.com/fppkr/MA.html]

+ Recent posts