Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - Владимир Брюков 5 стр.


Следует заметить, что в зависимости от того, сколько предыдущих значений временного ряда будет включено в уравнение авторегрессии в качестве лаговых (факторных) переменных, принято различать авторегрессионные процессы разного порядка. Так, в формуле (3.1) представлен авторегрессионный процесс 1-го порядка, который в англоязычной литературе обычно называется словосочетанием Auto Regressive и кратко обозначается как AR(1).

Например, в том случае, когда в авторегрессию 1-го порядка добавляются лаговые переменные Yt-2 и Yt-3, его принято обозначать как AR(3), т. е. как авторегрессионный процесс 3-го порядка. При этом уравнение для AR(3) примет следующий вид:

Yt = с+b1Yt-1 +b2Yt-2+b3Yt-3 +et, (3.2)

где Yt-1, Yt-2 и Yt-3 — независимые (факторные) переменные с лагом в один, два и три месяца;

b1, b2 и b3 — соответствующие коэффициенты регрессии при лаговых переменных.

3.2. Специфика уравнений авторегрессии со скользящим средним (ARMA)

Помимо авторегрессионных моделей нам необходимо также познакомиться и с моделями со скользящим средним в остатках, которые в англоязычной литературе обычно называются словосочетанием Moving Average. Полезность моделей со скользящим средним в остатках обусловлена тем, что для стационарного ряда предсказываемую переменную Yt можно представить в виде линейной функции прошлых ошибок (отклонений прогнозов от их фактических значений). Следует иметь в виду, что термин «скользящая средняя» в данном случае не является синонимом скользящей средней, применяемой, например, для сезонного сглаживания уровней динамического ряда. При этом модель со скользящим средним в остатках 1-го порядка кратко обозначается как МА(1), а в виде формулы она приобретает следующий вид:

Объединение в одной модели авторегрессионного процесса AR и модели со скользящим средним в остатках МА приводит к созданию более экономичной модели с точки зрения количества используемых параметров. Эту объединенную модель в англоязычной литературе кратко называют ARMA. Эта аббревиатура произошла от словосочетания Auto Regressive — Moving Average, что в переводе означает «авторегрессионный процесс со скользящим средним в остатках».

Порядок в этой модели в буквенной форме принято обозначать как ARMA(p, q), где р — величина порядка авторегрессионного процесса, a q — величина порядка процесса со скользящим средним в остатках. Например, модель ARMA(2; 1) фактически представляет собой комбинацию модели AR(2) с моделью МА(1), т. е. в одной модели объединена авторегрессионная модель 2-го порядка с моделью со скользящим средним в остатках 1-го порядка. В результате модель ARMA(2; 1) приобретает следующий вид:

Чтобы объединенная модель ARMA(2; 1) была более понятна, ее можно задать в виде двух уравнений. Так, для AR(2) формула будет иметь вид

в то время как уравнение для МА(1) можно представить в следующем виде:

Следовательно, формулу (3.4) модели ARMA(2; 1) можно получить путем вычитания из формулы (3.5) расчетного параметра Ое, из левой части уравнения (3.6).

3.3. Коррелограмма и идентификация лаговых переменных в уравнениях AR и ARMA

При практическом построении модели ARMA(/? q) наиболее трудным является определение параметров ряд, т. е. определение оптимального количества лагов. При этом инструментами для нахождения соответствующих лаговых переменных являются автокорреляционная функция и частная автокорреляционная функция.

Программа EViews позволяет довольно быстро найти оптимальные параметры р и q для модели ARMA, для этого используется коррелограмма зависимости между различными лагами временного ряда с ежемесячными курсами американского доллара к российскому рублю.

Алгоритм действий № 5 Как построить коррелограмму в EViews Шаг 1. Выбор основных опций для построения коррелограммы

С этой целью загрузим в EViews ежемесячные данные по курсу доллара (столбец с данными обозначим как USDollar) в соответствии с алгоритмом действий № 2 «Импорт данных и создание рабочего файла в EViews», изложенным в главе 1.

Далее строим коррелограмму, тем более что в EViews сделать это довольно просто. С этой целью в Workfile (рабочем файле) этой программы открываем файл USDollar. После чего в файле USDollar нам необходимо выбрать опции VIEW/CORRELOGRAM, а в появившемся окне (рис. 3.1) CORRELOGRAM SPECIFICATION (спецификация коррелограммы) оставить заданные по умолчанию опцию LEVEL (исходный уровень) и опцию LAGS ТО INCLUDE (максимальная величина лага, включенного в коррелограмму). В результате у нас получится коррелограмма исходных уровней (фактических значений курса доллара) временного ряда USDollar с величиной лага от 1 до 36.

Шаг 2. Дополнительные возможности, которые можно использовать для построения коррелограммы

Если бы мы выбрали, например, опцию 1ST DIFFERENCE (разница исходных уровней 1-го порядка) или 2ND DIFFERENCE (разница исходных уровней 2-го порядка), тогда была бы построена коррелограмма не исходных уровней временного ряда, а соответственно их первых и вторых разностей. Например, исходный уровень для курса доллара по состоянию на апрель 2010 г. был равен 29,2886 руб. В то время как разница исходных уровней 1-го порядка на эту же дату оказалась равна -0,0752 руб. (т. е. по сравнению с прошлым месяцем курс доллара снизился на 7,52 коп.), а разница исходных уровней 2-го порядка составила 0,5094 руб. (т. е. падение курса доллара по сравнению с предыдущим месяцем уменьшилось на 50,94 коп.).

В полученной коррелограмме (см. табл. 3.1) можно увидеть, как меняются коэффициенты автокорреляции (Autocorrelation, или АС) и частной автокорреляции (Partial Correlation, или РАС) в зависимости от изменения величины лага. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Так, коэффициент автокорреляции уровней первого порядка измеряет корреляционную зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-1, т. е. в нашем случае измеряется коэффициент автокорреляции при лаге в один месяц. В свою очередь коэффициент автокорреляции уровней второго порядка измеряет зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t- 2, т. е. при лаге в два месяца. И так далее, вплоть до коэффициента автокорреляции уровней 36-го порядка, измеряющего зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-36, т. е. с лагом в 36 месяцев.

При этом коэффициент автокорреляции уровней k-го (т. е. 1-го, 2-го…., 36-го) порядка находится в EViews по следующей формуле:

Следует заметить, что коэффициент автокорреляции, рассчитываемый в EViews, несколько отличается от обычно вычисляемого коэффициента автокорреляции. Дело в том, что в EViews с целью упрощения вычислений в качестве Y- взята средняя для всей выборки, в то время как обычно для рядов Yt и Yt_k берутся свои средние.

Частной автокорреляционной функцией называют серию частных коэффициентов автокорреляции г, измеряющих связь между текущим лагом временного ряда Yt и предыдущими лагами временного ряда Yt-1, Yt_2…., Yt_k_1 с устранением влияния других промежуточных временных лагов. Вполне естественно, что при нулевом лаге коэффициент частной корреляции ρ0 = 1, а при лаге k = 1 ρ1 = r1, т. е. коэффициент частной корреляции равен коэффициенту автокорреляции.

Для лага k больше 1 EViews рекурсивно вычисляет частную автокорреляцию по следующей формуле:

где rk — коэффициент автокорреляции для лага k.

Этот алгоритм вычисления коэффициента частной корреляции, предложенный Боксом и Дженкинсом в 1976 г., представляет собой аппроксимацию. Чтобы найти его более точную оценку, следует решить следующее уравнение регрессии, с помощью которого мы найдем коэффициент частной корреляции ρk для лага k:

Для лага k больше 1 EViews рекурсивно вычисляет частную автокорреляцию по следующей формуле:

где rk — коэффициент автокорреляции для лага k.

Этот алгоритм вычисления коэффициента частной корреляции, предложенный Боксом и Дженкинсом в 1976 г., представляет собой аппроксимацию. Чтобы найти его более точную оценку, следует решить следующее уравнение регрессии, с помощью которого мы найдем коэффициент частной корреляции ρk для лага k:

где еt — остатки.

Судя по полученной коррелограмме (см. табл. 3.1), уровень автокорреляции (АС) между исходными уровнями временного ряда USDollar постоянно убывает начиная с 1-го лага. В свою очередь уровень частной корреляции (РАС) резко снижается уже после 1-го лага, а после 2-го лага осциллирующим образом стремится к нулю (т. е. колеблется вокруг нуля).

В том случае, когда мы хотим построить модель авторегрессионного процесса AR(/?), для определения оптимального числа р мы должны использовать частную автокорреляционную функцию. При этом следует исходить из следующего критерия: оптимальное число р в уравнении авторегрессии должно быть меньше лага, в котором частная автокорреляционная функция начинает стремиться к нулю. Судя по коррелограмме, помещенной в табл. 3.1, коэффициент частной автокорреляции для лага один месяц (или лага 1-го порядка) равен 0,99, а для лага два месяца (или лага 2-го порядка) -0,25. Однако для 3-го порядка коэффициент частной автокорреляции равен -0,014, причем начиная с этого лага величина этого коэффициента колеблется вокруг нулевого уровня. Следовательно, можно сделать вывод, что для прогнозирования курса доллара с помощью модели авторегрессии необходимо использовать модель AR(2), которая примет следующий вид:

В свою очередь при идентификации модели ARMA(/? q) в качестве лага р выбирается лаг, после которого начинает убывать частная автокорреляционная функция, а в качестве лага q — лаг, после которого начинает убывать автокорреляционная функция. Исходя из табл. 3.1 легко прийти к выводу, что коэффициент автокорреляции начинает убывать уже с лага 2-го порядка. Аналогичный вывод можно сделать и относительно коэффициента частной автокорреляции. Поэтому для прогнозирования курса доллара с помощью модели авторегрессии со скользящими средними в остатках необходимо использовать модель ARMA(1, 1), которая примет следующий вид:

Два последних столбца в табл. 3.1 показывают соответственно Q-статистику Люнга — Бокса (Q-Stat) и ее значимость (Prob.) для каждого лага. Следует иметь в виду, что Q-статистика для лага k является тестовой статистикой при нулевой гипотезе об отсутствии автокорреляции между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t- k.

При этом Q-статистика Люнга — Бокса для лага k-го порядка находится по следующей формуле:

где Т — число наблюдений;

rk — автокорреляция k-го порядка;

m — число проверяемых лагов.

Например, для лага 1-го порядка формула (3.12) имеет следующее значение:

Следует иметь в виду, что в том случае, когда в табл. 3.1 значимость (Prob.) 0-статистики будет больше 0,05, то нулевую гипотезу об отсутствии автокорреляции между уровнями ряда с лагом А:-го порядка нельзя считать опровергнутой с 95 %-ным уровнем надежности. Если значимость 0-статистики будет больше 0,01, но меньше 0,05, то нулевую гипотезу об отсутствии автокорреляции между уровнями ряда с лагом А:-го порядка нельзя считать опровергнутой с 99 %-ным уровнем надежности. Судя по коррелограмме исходных уровней временного ряда USDollar (см. табл. 3.1), значимость Q-статистики для всех 36 лагов равна нулю, поэтому нулевая гипотеза об отсутствии автокорреляции в остатках отклоняется для всех лагов.

3.4. Решение в Excel уравнения авторегрессии 2-го порядка AR(2)

После того как с помощью соответствующей коррелограммы (см. табл. 3.1) мы пришли к выводу, что для получения оптимального прогноза по курсу доллара следует построить модель авторегрессии 2-го порядка AR(2), следующим нашим шагом должно стать нахождение ее параметров. Правда, для этого развернутое уравнение авторегрессии AR(2), представленное в формуле (3.10), необходимо немного упростить. С этой целью из формулы следует убрать остатки, которые появятся только после решения этого уравнения. Кроме того, чтобы убрать у коэффициентов факторных переменных подстрочные индексы (цифры), обозначим их различными буквами. В результате формула (3.10) приобретет более удобный для решения вид:

Мы уже научились решать уравнения регрессии в Excel (см. алгоритм действий № 3 «Как решить уравнение регрессии в Excel»), поэтому, используя этот алгоритм, можно получить соответствующее уравнение авторегрессии, которое, как известно, является частным случаем уравнения регрессии и отличается от последнего лишь наличием лаговых факторных переменных. А для загрузки и первичной обработки данных по ежемесячному курсу доллара необходимо воспользоваться алгоритмом действий № 1 «Как строить диаграммы в Microsoft Excel» — Шаг 1 «Поиск данных, их загрузка и первичная обработка в Excel».

Далее создадим в Excel три столбца: во-первых, с зависимой переменной USDollar — ежемесячный курс доллара США; во-вторых, с двумя независимыми переменными USDollar(-l) — курс доллара США с лагом в один месяц и USDollar(-2) — курс доллара США с лагом в два месяца. При этом загруженная база данных по американской валюте охватывает период с июня 1992 г. по апрель 2010 г.

Далее, согласно алгоритму действий № 3 «Как решить уравнение регрессии в Excel», установим в появившемся окне РЕГРЕССИЯ следующие опции (рис. 3.2): ВХОДНОЙ ИНТЕРВАЛ Y ($В$1:$В$214); ВХОДНОЙ ИНТЕРВАЛ X ($C$1:$D$214); УРОВЕНЬ НАДЕЖНОСТИ (99); ВЫХОДНОЙ ИНТЕРВАЛ ($L$2).

В результате решения в Excel уравнения авторегрессии AR(2) со свободным членом мы получим следующий ВЫВОД ИТОГОВ, представленный в виде табл. 3.2. Возьмем из этой таблицы значения коэффициентов (см. столбец «Коэффициенты») и, подставив их в формулу (3.13), получим следующее уравнение авторегрессии (с округлением):

USDollar = 0,2260 + 1,2980 USDollar(-l) — 0,3047 USDollar(-2),

где USDollar — зависимая переменная, курс доллара США;

USDollar(-l) — независимая переменная, курс доллара США с лагом в один месяц;

USDollar(-2) — независимая переменная, курс доллара США с лагом в два месяца;

0,2260 — свободный член (константа).

При этом экономическая интерпретация этого уравнения авторегрессии 2-го порядка следующая: во-первых, в период с июня 1992 г. по апрель 2010 г. при исходном уровне 0,2260 руб. рост на 1 руб. курса доллара в текущем месяце приводил к повышению прогнозируемого курса доллара в будущем месяце в среднем на 1,2980 руб.; во-вторых, одновременно с этим рост курса доллара в прошлом месяце приводил к снижению прогнозируемого курса доллара в будущем месяце в среднем на 0,3047 руб.

Действуя согласно алгоритму действий № 4 «Оценка статистической значимости уравнения регрессии и его коэффициентов», мы можем сделать следующие выводы.

1. Поскольку коэффициент детерминации R2 дня уравнения регрессии оказался равен 0,9977, то отсюда следует, что оно в 99,77 % случаях в состоянии объяснить ежемесячные колебания курса доллара.

2. Значимость F равна 1,ЗЕ-245 или нулю, следовательно, уравнение регрессии статистически значимо как при 95 %-ном уровне надежности, так и при 99 %-ном уровне надежности.

3. Р-значение для свободного члена (константы) равно 0,037226, следовательно, константа статистически значима лишь при 95 %-ном уровне надежности, но незначима при 99 %-ном уровне надежности, поскольку ее P-значение больше 0,01. Р-значение для двух коэффициентов регрессии равно 0, следовательно, эти коэффициенты статистически значимы как при 95 %-ном уровне надежности, так и при 99 %-ном уровне надежности.

3.5. Решение в EViews уравнения авторегрессии 2-го порядка AR(2)

Уравнение авторегрессии 2-го порядка с константой можно решить не только в Excel, но и в EViews. Более того, решение этого уравнения регрессии в EViews имеет ряд преимуществ, обусловленных спецификой этой программы. Во-первых, в EViews можно быстрее оценить прогностическую точность полученной статистической модели; во-вторых, есть возможность протестировать полученные остатки на стационарность, наличие автокорреляции, а также провести ряд других важных тестов, о которых мы расскажем позднее. Тем читателям, которым еще не приходилось решать уравнения регрессии в EViews, советуем внимательно ознакомиться с алгоритмом действий № 6 «Как решить уравнение регрессии в EViews».

Назад Дальше