Friday, 23 March 2018

1 차 이동 평균 모델


유한 자동 회귀 근사를 통한 일차 이동 평균 모델의 추정. 일부 점근선 결과. Ral Pedro Mentz. University of Tucumn, Tucumn, Argentina. A 온라인 : 2002 년 3 월 1 일. 모델 추정에서 우리는 Durbin Biometrika 1969 이것은 k 차의 자기 회귀를 데이터에 맞추어 거기에서 유도하는 것으로 구성되어있다. 확률 한계와 한계 정규 분포의 분산은 표본 크기 T가 k가 고정 된 채로 자세하게 논의되고 논의된다 결과 값과 최우 추정량에 해당하는 값의 차이는 지수 함수 적으로 감소하는 함수이다. 평가자의 몇 가지 수정은 일관성이 있지만 점근 적으로 비효율적이다. 이 연구는학과의 박사 학위 논문의 일부이다 스탠포드 대학의 감사관은 TW 앤더슨 교수에게 관대 한 조언을 주었다. 이 작업을 감독하는 동안 도움이됩니다. 스탠포드에서의 작업은 해군 연구 계약 사무국 N00014-75-C-0442, NR-042-034, TW 앤더슨, 프로젝트 디렉터와의 연구 계약에 의해 지원되었습니다. Copyright 1977 Elsevier B V. 인용 문헌 ARIMA nonseasonal models에 대한 소개. ARIMA p, d, q 예측 방정식 ARIMA 모형은 이론적으로 시계열을 예측하기위한 가장 일반적인 종류의 모형으로 필요에 따라 차분하여 고정 될 수있다. 필요한 경우 로깅 또는 수축과 같은 비선형 변환과 함께 통계적 성질이 모두 일정한 경우 시계열 인 확률 변수는 정적입니다. 고정 된 시리즈는 추세가없고 평균 주위의 변동은 일정한 진폭을 가지며 흔들립니다 일관된 방식, 즉 단기간의 무작위 시간 패턴은 항상 통계적 의미에서 동일하게 보입니다. 후자의 조건은 자기 상관 관계가 자체의 이전 편차 f 시간이 지남에 따라 평균은 일정하게 유지되거나 시간에 따라 그 파워 스펙트럼이 일정하게 유지된다. 이 형태의 무작위 변수는 신호와 노이즈의 조합으로 볼 수 있으며, 신호가 분명하다면 그 신호는 ARIMA 모델은 노이즈와 신호를 분리하려고하는 필터로 볼 수 있으며, 신호는 다음으로 추정됩니다. 고정 된 시계열에 대한 ARIMA 예측 방정식은 선형 변수 즉, 예측 변수가 종속 변수의 시차와 예측 오차의 시차로 구성되는 회귀 식 방정식입니다. 예측값 Y 상수 및 / 또는 Y의 하나 이상의 최근 값들의 가중 합 또는 에러들의 하나 이상의 최신 값들의 가중 합 (weighted sum)을 포함 할 수있다. 예측 자들이 Y의 지연된 값들로만 구성되는 경우, 그것은 순수 자기 회귀 자기 - 예를 들어, Y에 대한 1 차 자동 회귀 AR 1 모델은 독립 변수가 단지 Y 차수 인 간단한 회귀 모델이다. 한 기간 LAG Y, Statgraphics의 경우 1, RegressIt의 경우 YLAG1 예측 변수 중 일부가 오류의 래그 인 경우 ARIMA 모델은 선형 회귀 모델이 아닙니다. 독립 변수로 마지막 기간을 지정하는 방법이 없으므로 모델이 데이터에 적합 할 때 기간별로 오류를 계산해야합니다 기술적 인 관점에서 지연 변수를 예측 변수로 사용하는 문제는 모델의 예측이 계수의 선형 함수가 아니라는 것입니다. 과거 데이터의 선형 함수 따라서 래깅 된 오류를 포함하는 ARIMA 모델의 계수는 방정식 시스템을 해결하는 것보다는 비 등산적인 최적화 방법으로 힐 클라이밍으로 추정해야합니다. m ARIMA는 자동 회귀 적 통합 이동 평균을 나타냅니다. 예측 방정식에서 stationarized 계열의 Lag를 자동 회귀 항이라고 부르며 예측 오차의 시차를 이동 평균 항이라고 부르며 고정하기 위해 차감해야하는 시계열을 말합니다 고정식 시리즈의 통합 버전 무작위 산책 및 임의 추세 모델, 자동 회귀 모델 및 지수 평활 모델은 모두 ARIMA 모델의 특수 사례입니다. 비 계절 ARIMA 모델은 ARIMA p, d, q 모델로 분류됩니다..p는 자기 회귀 성 항의 수이고, d는 확률에 필요한 비 계절적 차이의 수이고, q는 예측 방정식의 지연 예측 오차의 수이다. 예측 방정식은 다음과 같이 구성된다. 먼저, y를 d Y의 차이, 즉 Y의 두 번째 차이가 d 2 경우가 2 시간 이전과의 차이가 아니라는 점을 유의하십시오. 오히려 첫 번째 차이점은 d 2 차 미분의 iscrete analog, 즉 지역 경향보다는 직렬의 국부 가속도. y의 관점에서 일반적인 예측 방정식은 다음과 같습니다. 이동 평균 매개 변수 s는 다음과 같이 방정식에서 부호가 음수가되도록 정의됩니다. Box and Jenkins가 소개 한 R 프로그래밍 언어를 포함한 일부 저작자와 소프트웨어는 더하기 기호를 대신 정의합니다. 실제 숫자가 방정식에 연결되면 모호성은 없지만 소프트웨어가 사용할 때 어떤 규칙을 사용할지를 아는 것이 중요합니다 당신은 출력을 읽는 중입니다. 매개 변수는 AR 1, AR 2, MA 1, MA 2 등으로 표시됩니다. Y에 대한 적절한 ARIMA 모델을 식별하려면 일련을 스테레오 라이즈 할 필요가있는 차분 d의 순서를 결정하는 것으로 시작하십시오 로깅 (logging)이나 수축 (deflating)과 같은 분산 - 안정화 (variance-stabilizing) 변환과 함께 계절성의 총체적인 특징을 제거 할 수 있습니다. 이 시점에서 중단하고 diffe 그러나 임의의 보행렬 또는 무작위 추세 모델에 고정 시켰을 수도 있습니다. 그러나 stationarized 계열은 여전히 ​​자기 상관 오차를 가질 수 있습니다. AR 항 p1 및 / 또는 MA 항 q1의 일부 수가 예측에 필요하다는 것을 암시합니다 주어진 시계열에 가장 잘 맞는 p, d, q의 값을 결정하는 과정은 링크가이 페이지의 상단에있는 노트의 이후 섹션에서 논의되지만 일부 유형의 미리보기 일반적으로 발생하는 비 계절 ARIMA 모델의 예가 아래에 나와 있습니다. ARIMA 1,0,0 1 차 자동 회귀 모델은 시리즈가 고정되어 있고 자기 상관되는 경우, 아마도 자체의 이전 값의 배수와 상수로 예측 될 수 있습니다. 예측 이 경우의 방정식은입니다. Y는 그 자체가 한주기만큼 뒤떨어져 있습니다. 이것은 ARIMA 1,0,0 상수 모델입니다. Y의 평균이 0이면 상수 항이 포함되지 않습니다. 기울기 계수 1이 긍정적이고보다 적다 1 인 경우 크기가 1보다 작아야합니다. Y는 고정되어 있으면 다음 기간의 값이이 기간의 값과 같이 평균에서 1 배가 될 것으로 예측되어야하는 평균 복귀 동작을 설명합니다. 음의 값을 가지면 부호가 교대로 나타나는 평균 되돌리기 행동을 예측합니다. 즉, 이 기간보다 평균 이상이면 Y가 평균 다음 기간보다 낮을 것으로 예측합니다 .2 차 자동 회귀 모델 ARIMA 2,0,0에서는 오른쪽의 Y t-2 항이 될 것입니다. 계수의 부호와 크기에 따라 ARIMA 2,0,0 모델은 평균 반향이 사인파 진동 방식으로 발생하는 시스템을 나타낼 수 있습니다. 무작위 적으로 걸림. 시리즈 Y가 정지 상태가 아니라면 가장 간단한 모델은 무작위 걸음 걸이 모델로, 이것은 무작위 걷기 모델로 간주 될 수 있습니다. 자기 회귀 계수가 다음과 같은 AR 1 모델의 제한된 경우 1, iea 시리즈는 무한히 느린 평균 반향을 갖는다. 이 모델의 예측 방정식은 다음과 같이 쓸 수있다. 여기서 상수 항은 평균 기간 - 주기 변화, 즉 Y에서의 장기간의 드리프트이다. 이 모델은 노 - 인터셉트 회귀 모형에서 Y의 첫 번째 차이가 종속 변수 인 경우 nonseasonal difference와 상수 항만을 포함하기 때문에 ARIMA 0,1,0 모델로 분류됩니다. 무작위 walk-without-drift 모델은 상수가없는 ARIMA 0,1,0 모델이 될 수 있습니다. ARIMA 1,1,0 차이가있는 1 차 자동 회귀 모델 임의의 보행 모델의 오류가 자동 상관되는 경우, 종속 변수의 한 지연을 추가하여 문제를 해결할 수 있습니다 예측 방정식 - 즉, Y의 첫 번째 차이를 1주기만큼 후퇴시킴으로써 이것은 다음 예측 방정식을 산출 할 수 있습니다. 이것은 재 배열 될 수 있습니다. 이것은 1 계단의 비 회귀 차감 모델과 co nstant term - 즉, ARIMA 1,1,0 모델. ARIMA 0,1,1, 일정한 단순한 지수 평활화가없는 경우 임의의 보행 모델에서 자동 상관 오류를 수정하기위한 또 다른 전략은 간단한 지수 평활화 모델에 의해 제안됩니다. 예를 들어 천천히 변하는 평균 주위의 시끄러운 요동을 나타내는 일련의 무작위 걸음 모델은 과거 값의 이동 평균뿐만 아니라 수행하지 않습니다. 즉, 가장 최근의 관측치를 다음 관측치의 예측치로 사용하는 대신 잡음을 필터링하고 국부 평균을 더 정확하게 추정하기 위해 마지막 몇 가지 관측치의 평균을 사용하는 것이 더 낫습니다. 간단한 지수 평활화 모델은이 효과를 달성하기 위해 과거 값의 지수 가중 이동 평균을 사용합니다. 단순 지수 지수 평활화 모델은 수학적으로 동등한 다수의 형태로 기록 될 수 있는데, 그 중 하나는 소위 오류 정정 형태이고, 이전의 ecast는 오류의 방향으로 조정됩니다. 정의에 따라 e t-1 Y t-1 - t-1이므로 ARIMA 0,1,1과 같이 다시 쓸 수 있습니다. 1 1 - 이는 상수가없는 ARIMA 0,1,1 모델로 지정하여 간단한 지수 스무딩에 적합 할 수 있음을 의미하며 추정 된 MA 1 계수는 SES 공식에서 1 - 빼기 - 알파에 해당합니다. SES 모델의 경우 1 기간 예측에서 데이터의 평균 연령은 1이며 이는 추세 또는 전환점보다 약 1 기간 지연되는 경향이 있음을 의미합니다. 1 기간 사전 데이터의 평균 연령 ARIMA 0,1,1의 예측은 1-1 1입니다. 예를 들어, 1 0 8이면 평균 연령은 5입니다. 1이 1에 가까워지면 ARIMA 0,1,1 - 일정하지 않음 모델은 매우 장기적인 이동 평균이되고, 1이 0에 가까워지면 드리프트없는 무작위 모델이됩니다. AR 항을 추가하거나 M을 추가하여 자기 상관을 보정하는 가장 좋은 방법은 무엇입니까? 용어 앞서 언급 한 앞의 두 모델에서 임의 걷기 모델의 자기 상관 오류의 문제는 차분 된 계열의 지연된 값을 방정식에 추가하거나 예측 오차의 지연된 값을 추가하여 두 가지 방법으로 고정되었다. best이 상황에 대한 경험상의 경험은 긍정적 인 자기 상관은 일반적으로 AR 항을 모델에 추가함으로써 가장 잘 처리되며, 음의 자기 상관은 일반적으로 MA 항을 더함으로써 가장 잘 처리됩니다. 비즈니스 및 경제적 시계열에서 부정적 자기 상관은 종종 차이점의 인공물로 발생합니다. 일반적으로 차이 분석은 양의 자기 상관 관계를 감소 시키며 긍정에서 부정적인 자동 상관 관계로 전환 할 수도 있습니다. 따라서 ARIMA 0,1,1 모델에서는 차이점이 MA 항은 ARIMA 1,1,0 모델보다 자주 사용됩니다. ARIMA로 SES 모델을 구현함으로써 m. odel, 실제로 유연성을 얻습니다. 우선 MA 1 계수는 음수로 허용됩니다. 이것은 SES 모델에서 1보다 큰 평활 계수에 해당합니다. 이는 일반적으로 SES 모델 피팅 절차에서 허용되지 않습니다. 둘째, 원한다면 ARIMA 모델에 상수 항을 포함시켜 평균 비 0 추세를 추정 할 수 있습니다. ARIMA 0,1,1 모델에는 상수가 있습니다. 이 기간 예측은 다음과 같습니다. 모델은 SES 모델과 질적으로 유사하지만, 장기 예측의 궤도는 전형적으로 기울기가 수평선이 아닌 μ와 동일한 경사 선이다. ARIMA 0,2,1 또는 0,2,2 상수 선형 지수 평활화가없는 선형 지수 평활화 모델은 MA 조건과 함께 2 개의 비 계절적 차이를 사용하는 ARIMA 모델입니다. 계열 Y의 두 번째 차이점은 단순히 Y와 두 기간의 차이가 아니라 th 첫 번째 차이의 첫 번째 차이 - 주기 t에서의 Y의 변화 변화 따라서주기 t에서의 두 번째 차이는 Y t - Y t - 1 - Y t - 1 - Y이다. 이산 함수의 두 번째 차이는 연속 함수의 2 차 미분과 유사합니다. 이 함수는 주어진 시점에서 함수의 가속도 또는 곡률을 측정합니다. ARIMA 0 , 상수가없는 2,2 모델은 두 번째 차이가 마지막 두 예측 오차의 선형 함수와 같다고 예측합니다 .1과 2가 MA 1과 MA 2 계수 인이 선형 선형 지수 smoothing 모델은 Holt 모델과 본질적으로 동일하며 Brown s 모델은 특별한 경우입니다 지수의 가중 이동 평균을 사용하여 시리즈의 지역 수준과 지역 경향을 추정합니다이 모델의 장기 예측은 직선으로 수렴합니다 그의 기울기는 시리즈의 끝으로 관측 된 평균 추세에 달려있다. ARIMA 1,1,2 이 모델은 ARIMA 모델의 동반 슬라이드에 설명되어 있습니다. 시리즈 마지막 부분에서 지역 추세를 추정하지만 더 긴 예측 시야에서이를 평평하게하여 보수주의 메모를 소개합니다. 경험적 지원 Gardner와 McKenzie가 감쇠 왜곡을 적용하는 이유에 대한 기사와 Armstrong 외의 Golden Rule 기사를 참조하십시오. 일반적으로 p와 q 중 적어도 하나가 1보다 크지 않은 모델을 고수하는 것이 좋습니다. 즉 ARIMA 모델의 수학 구조에 대한 자세한 내용은 ARIMA 모델 2,1,2와 같은 모델을 적합하게하려고하지 마십시오. 이는 ARIMA 모델의 주석에 자세히 설명되어있는 오버 피팅 및 공통 요인 문제로 이어질 수 있습니다. 스프레드 시트 구현 ARIMA 위에 설명 된 것과 같은 모델은 스프레드 시트에서 구현하기 쉽습니다. 예측 방정식은 원래 시계열의 과거 값과 오류의 과거 값을 참조하는 선형 방정식입니다. A 열에 데이터를 저장하고 B 열에 예측 공식을, C 열에 오류 데이터를 뺀 ARIMA 예측 스프레드 시트를 설정합니다. B 열의 일반적인 셀의 예측 수식은 단순히 값을 나타내는 선형 표현식입니다 선행 A 열과 C 열에 스프레드 시트의 다른 셀에 저장된 적절한 AR 또는 MA 계수가 곱해집니다. 무작위 이동 평균 시뮬레이션 첫 번째 주문. 데모는 아무리 사용 되더라도 동일한 임의의 일련의 점을 사용하도록 설정됩니다 그러나 무작위 화 버튼을 누르면 새로운 무작위 시리즈가 생성되어 사용됩니다. 무작위 시리즈를 동일하게 유지하면 사용자는 두 개의 상수의 ARMA 시리즈 변화에 대한 효과를 정확히 볼 수 있습니다 상수는 제한적입니다 ARMA 계열의 차이가 발생하기 때문에 -1,1로 설정합니다. 데모는 1 차 과정에만 사용됩니다. 추가 AR 조건은 더 복잡한 계열을 유전자로 만들 수 있습니다 ARMA 프로세스에 대한 자세한 설명은 G Box, GM Jenkins, G Reinsel, 시계열 분석 예측 및 제어 3 단 Englewood Cliffs, NJ Prentice-Hall, 관련 링크.

No comments:

Post a Comment