Несмотря на то что остатки, полученные по стационарной модели, нельзя считать нормально распределенными, мы тем не менее уже знаем, что при больших выборках можно строить интервальные прогнозы исходя из их нормального распределения. Поэтому нашим следующим шагом будет расчет интервальных прогнозов не только на июль 2010 г. (курс доллара по этому месяцу не включен в базу данных), но и для всех наблюдений, на основе которых составлена статистическая модель log(USDollar) = с + а × log(USDollar(-1)) + МА(1). Это поможет нам проверить соответствие составленных интервальных прогнозов нормальному распределению, поскольку уровень надежности для интервальных прогнозов рассчитывался исходя из предположения о нормальном распределении остатков. Попутно заметим, что интервальные прогнозы будут построены начиная с июля 1992 г., поскольку первое наблюдение во временном ряде нам потребовалось для создания факторной переменной log(USDollar(-l).
После того как на основе алгоритма действий № 12 будут составлены соответствующие интервальные прогнозы, у нас появится возможность сопоставить заданные уровни надежности с фактической долей точных интервальных прогнозов. Судя по табл. 6.18, доля точных прогнозов оказалась незначительно ниже заданного уровня надежности при 99,9 %-ном и 99 %-ном уровнях надежности и практически ему равна при 95 %-ном (отклонение на -0,1 процентного пункта). Однако при 90 %-ном уровне надежности и более низких уровнях доля фактических прогнозов становится выше заданного уровня. Причем эта положительная разница растет при снижении уровня надежности, достигая своего максимума при 40 %-ном уровне надежности, когда она равна 36 процентным пунктам.
Однако если сравнить табл. 6.18, характеризующую точность интервальных прогнозов для стационарной модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1), с табл. 4.8, которая характеризует их точность для нестационарной модели USDOLLAR= а х USDOLLAR(-l) + а × USDOLLAR(-2), то выяснится, что последняя модель с этой точки зрения несколько точнее.
Еще более серьезным минусом интервальных прогнозов, составленных по стационарной модели log(USDollar) = с + а × log(USDollar(-l)) + + МА(1) за весь период наблюдений (т. е. на основе данных с июля 1992 г. по июнь 2010 г.), являются слишком широкие интервалы прогнозов для большей части временного ряда, начиная с октября 1999 г. Так, при прогнозе на июль 1992 г. общий диапазон интервального прогноза (верхняя граница интервального прогноза минус нижняя граница интервального прогноза) при 95 %-ном уровне надежности составил лишь 4 коп. (табл. 6.19), в то время как фактическое значение курса доллара было равно лишь 16,12 коп. В свою очередь при прогнозе на июль 2010 г. общий диапазон интервального прогноза был равен 8 руб. 32,27 коп., а фактический курс доллара составил 30 руб. 18,69 коп. При этом в июле 1992 г. диапазон интервального прогноза составлял 25,77 % от фактического курса доллара, а в июле 2010 г. его доля в стоимости курса американской валюты равнялась 27,57 %, в то время как для нестационарной модели доля интервального прогноза для последнего наблюдения равнялась 10,62 %.
6.6. Построение стационарной модели ARMA с оптимизированным временным рядом
Чем же объясняется слишком широкий диапазон интервальных прогнозов для большей части наблюдений, полученных по модели log(USDollar) = с + а × log(USDollar(-l))? Ведь мы уже знаем, что если временной ряд является слабо стационарным, то это означает отсутствие, во-первых, тренда; во-вторых, строго периодических колебаний; в-третьих, систематических изменений дисперсии; в-четвертых, каких-либо иных систематических изменений во временном ряде (см. главу 1). Если систематические изменения дисперсии отсутствуют, то, следовательно, и абсолютная величина диапазона интервального прогноза не должна с течением времени существенно изменяться. Тем не менее по абсолютной величине интервальные прогнозы существенно изменились, что очевидно связано с неправильной спецификацией статистической модели.
Правда, если мы будем составлять интервальные прогнозы относительно логарифмического ряда данных, то в этом случае разница в их диапазоне относительно первого и последнего наблюдения будет не столь значительной. Так, для июля 1992 г. доля диапазона интервального прогноза составит 3,71 % от логарифмического фактического курса доллара, а в июле 2010 г. — 1,97 %.
Почему же стационарная модель log(USDollar) = с + а × log(USDollar(-l)) + МА(1) не позволяет построить прогнозы с оптимальной шириной интервальных прогнозов при переходе к исходному временному ряду? В главе 1 (см. 1.2) мы уже научились распознавать стационарность временного ряда с помощью построения его графика. Попробуем построить аналогичный график для логарифмических остатков (за период с июля 1992 г. по июнь 2010 г.), полученных в результате решения уравнения регрессии по стационарной модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1). В результате получится диаграмма, изображенная на рис. 6.12.
Исходя из рис. 6.12 можно сделать следующие выводы: во-первых, большая часть логарифмических остатков, полученных по стационарной модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1), колеблется примерно в одном диапазоне вокруг нулевого уровня; во-вторых, с течением времени волатильность логарифмических остатков постепенно снижается; в-третьих, на графике видны три значительных всплеска волатильности остатков, однако последний всплеск по сравнению с предыдущими явно незначительный. Отсюда можно сделать вывод, что логарифмические остатки стационарной (точнее сказать, слабо стационарной) статистической модели асимптотически стремятся к относительно узкому диапазону колебаний, т. е. становятся все более стационарными, однако на начальном этапе временного ряда эти колебания еще довольно велики.
Таким образом, чтобы получить оптимальную ширину интервальных прогнозов для стационарной модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1), необходимо убрать из базы данных часть временного ряда с наиболее волатильными остатками. Для отсечения наиболее волатильной части остатков будем использовать тест Чоу на точность прогноза. Исходя из рис. 6.12 и с учетом данных табл. 5.4 «Рейтинг наблюдений по величине скачка курса доллара», которые показывают максимальный рост волатильности после дефолта августа 1998 г., проведем тест на точность прогноза относительно сентября 1998 г. В результате получим табл. 6.20, согласно которой нельзя сделать однозначный вывод о наличии структурного изменения. Дело в том, что уровень значимости (Probability) F-критерия получился больше 0,05, что свидетельствует в пользу нулевой гипотезы об отсутствии структурных изменений. Однако уровень значимости LR-статистики равен 0,001354, что существенно меньше 0,05 и однозначно говорит о наличии структурного изменения. В этой ситуации более надежна LR-статистика, поскольку F-критерий предполагает наличие независимых и нормально распределенных остатков, чего не может быть по определению при решении уравнений авторегрессии. Поэтому нулевая гипотеза о стабильности временного ряда, включающего наблюдения с сентября 1998 г. по июнь 2010 г., отвергается.
Далее проведем тест на точность прогноза относительно октября 1998 г. В результате получим табл. 6.21, согласно которой можно сделать однозначный вывод о структурной стабильности выделенного временного ряда. Поскольку уровень значимости (Probability) F-критерия получился больше 0,05 и уровень значения LR-статистики оказался равен 1,0, что однозначно говорит об отсутствии структурного изменения, нулевая гипотеза о стабильности временнoго ряда, включающего наблюдения с октября 1998 г. по июнь 2010 г., принимается.
Исходя из результатов теста Чоу на точность прогноза построим статистическую модель log(USDollar) = с + а × log(USDollar(-l)) + МА(1) на основе данных за период с октября 1998 г. по июнь 2010 г. Вывод итогов после решения этого уравнения представлен в табл. 6.22, из которой следует, что уровень значимости у всех переменных, включенных в модель, оказался равен нулю и все они оказались статистически значимыми, как при 5 %-ном, так и при 1 %-ном уровне значимости.
Судя по табл. 6.23, уменьшение базы данных способствовало росту точности стационарной статистической модели по ряду параметров. С точки зрения прогнозирования особое значение имеет тот факт, что средняя ошибка по модулю уменьшилась на 1,71 процентных пункта, т. е. весьма существенно. Правда, средняя ошибка по модулю, напротив, выросла на 4,7 коп. Но это объясняется тем фактом, что средний курс доллара за период с октября 1998 г. по июнь 2010 г. оказался равен 28,70 руб. и был в 7,41 раза выше среднего курса доллара за период с июня 1992 г. по сентябрь 1998 г., равного 3,87 руб.
Судя по табл. 6.23, уменьшение базы данных способствовало росту точности стационарной статистической модели по ряду параметров. С точки зрения прогнозирования особое значение имеет тот факт, что средняя ошибка по модулю уменьшилась на 1,71 процентных пункта, т. е. весьма существенно. Правда, средняя ошибка по модулю, напротив, выросла на 4,7 коп. Но это объясняется тем фактом, что средний курс доллара за период с октября 1998 г. по июнь 2010 г. оказался равен 28,70 руб. и был в 7,41 раза выше среднего курса доллара за период с июня 1992 г. по сентябрь 1998 г., равного 3,87 руб.
Следующим шагом будет расчет точечных и интервальных прогнозов дня всех наблюдений, на основе которых составлена наша статистическая модель (за период с октября 1998 г. по июнь 2010 г.), а также на июль 2010 г. (курс доллара по этому месяцу не включен в базу данных). При этом точечный прогноз по курсу доллара на июль 2010 г., вычисленный по этой модели, оказался равен 31,02 руб. (фактический курс доллара в июле 2010 г. равнялся 30,19 руб.). Заметим, что этот прогноз оказался на 17 коп. точнее аналогичного точечного прогноза (31,19 руб.), рассчитанного по модели log(USDollar) = с +а × log(USDollar(-l)) + МА(1), построенной по данным за весь период (с июня 1992 г. по июнь 2010 г.).
Далее на основе алгоритма действий № 12 составим по модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1), построенной по данным с октября 1998 г. по июнь 2010 г., соответствующие интервальные прогнозы с разными уровнями надежности. Назовем последнюю модель стационарной моделью с оптимизированным временным рядом.
Посмотрим, как у этой модели заданные уровни надежности соотносились с фактической долей точных интервальных прогнозов. После проведения соответствующих подсчетов удалось выяснить, что при 95 %-ном уровне надежности из 142 составленных по этой модели интервальных прогнозов в 138 случаях фактический курс доллара оказался в рамках интервального прогноза, т. е. получился точным. Следовательно, при 95 %-ном уровне надежности фактическая вероятность точного интервального прогноза у стационарной модели с оптимизированным временным рядом достигла 97,2 %, т. е. получилась на 2,2 процентного пункта выше заданного 95 %-ного уровня надежности. Судя по табл. 6.24, доля точных прогнозов по этой модели оказалась незначительно ниже заданного уровня надежности лишь при 99,9 %-ном уровне. В то время как при 99 %-ном уровне надежности и ниже доля точных фактических прогнозов становится выше заданного уровня. Причем эта положительная разница достигает максимума при 40 %-ном уровне надежности, когда она равна 26,2 процентного пункта.
Если сравнить данные табл. 6.24 с данными табл. 6.18, то легко сделать вывод, что интервальные прогнозы, составленные по модели log(USDollar) = с + а × log(USDollar(-l)) + МА(1) с оптимизированным временным рядом, получились надежнее интервальных прогнозов, рассчитанных на основе аналогичной модели с полным временным рядом.
У стационарной модели, построенной на основе базы данных за период с октября 1998 г. по июнь 2010 г., есть еще один весьма ощутимый плюс — у нее более приемлемый диапазон интервальных прогнозов. Так, при прогнозе на октябрь 1998 г. общий диапазон интервального прогноза (верхняя граница интервального прогноза минус нижняя граница интервального прогноза) при 95 %-ном уровне надежности составил 1,84 руб. (табл. 6.25), или 11,48 % от фактического курса доллара, который тогда равнялся 16,01 руб. В то время как при прогнозе на июль 2010 г. общий диапазон интервального прогноза был равен 2,96 руб., или 9,79 % от фактического курса доллара, который тогда равнялся 30,19 руб. Нетрудно также заметить, что за счет уменьшения стандартного отклонения (в структурно стабильном временном ряде, естественно, наблюдается более низкий уровень волатильности) ширина диапазона интервального прогноза в табл. 6.25 существенно меньше, чем в табл. 6.19.
В заключение остановимся на таком важном моменте прогнозирования, как сравнение индекса оптимальности четырех статистических моделей. Дело в том, что наряду с точностью интервальных прогнозов необходимо оценить и их оптимальность, т. е. позаботиться о том, чтобы средняя ширина интервального прогноза (верхняя граница интервального прогноза минус нижняя граница интервального прогноза) не была слишком велика, поскольку это снижает ценность прогноза для инвестора. С этой целью сравним четыре важных параметра по четырем ранее разработанным статистическим моделям (табл. 6.26). Причем наиболее важным среди четырех параметров таблицы является индекс оптимальности интервальных прогнозов, который находится по следующей формуле:
Индекс оптимальности интервальных прогнозов = Средний диапазон интервального прогноза (руб): Точность интервальных прогнозов (при 95 %-ном уровне надежности).
(6.10)
Следовательно, чем ниже индекс оптимальности интервальных прогнозов, тем лучше конкретная статистическая модель. Таким образом, первое место по этому показателю занимает стационарная модель с оптимизированным временным рядом, в то время как последнее — стационарная модель с полным временным рядом. При этом индекс оптимальности интервальных прогнозов у первой модели равен
0,0276, а это означает, что на один процентный пункт точности интервальных прогнозов (при 95 %-ном уровне надежности) у нее приходится 2,76 коп. среднего диапазона интервального прогноза, в то время как один процентный пункт точности интервальных прогнозов у стационарной модели с полным временным рядом обошелся в 5,54 коп. среднего диапазона интервального прогноза, т. е. в последнем случае точность обошлась гораздо дороже.
Заметим также, что представленный в таблице средний диапазон интервального прогноза (руб.) вычислен путем суммирования всех диапазонов интервального прогноза по определенной статистической модели, которые затем делятся на общее количество наблюдений во временном ряде. В свою очередь средний диапазон интервального прогноза (%) находится по следующей формуле:
Средний диапазон интервального прогноза (руб.): Средний фактический курс доллара × 100 %.
(6.11)
Судя по табл. 6.26, по всем четырем параметрам наиболее оптимальные показатели у стационарной модели с оптимизированным временым рядом, в то время как наименее оптимальные — у стационарной модели с полным временным рядом. Сравнивая две нестационарные модели, можно прийти к выводу, что модель с оптимизированным временным рядом превосходит модель с полным временным рядом по трем параметрам, незначительно уступая ей лишь по точности интервальных прогнозов (при 95 %-ном уровне надежности).
Контрольные вопросы и задания1. Почему при составлении статистической модели со стационарной ARM А-структурой мы были вынуждены перейти от исходного временнoго ряда к логарифмическому временному ряду? В каком случае расширенный тест Дикки — Фуллера отвергает нулевую гипотезу о наличии единичного корня? Какой вывод можно сделать в этом случае о стационарности временнбго ряда?
2. Повторите весь перечень действий, необходимых для построения статистической модели, представляющей собой уравнения авторегрессии (AR) или уравнения авторегрессии со скользящей средней (ARMA). Сколько всего пунктов в этом перечне и можно ли его при необходимости расширить?
3. Каким образом коррелограмма используется для построения моделей авторегрессии и моделей авторегрессии со скользящей средней? Как найти с помощью автокорреляционной и частной автокорреляционной функций величину лага для лаговой переменной AR и для скользящей средней МА?
4. Какой тест используется для проверки модели авторегрессии со скользящей средней на автокорреляцию в остатках? Как проверяется на стационарность ARMA-структура этой статистической модели? К какому значению стремятся функции импульсного и накопленного ответа у стационарной модели? Как изменяется по мере увеличения лага автокорреляция и частная автокорреляция в остатках стационарной статистической модели?
5. Какие выводы можно сделать о стабильности стационарной и нестационарной статистических моделей, если сравнить табл. 6.11 и табл. 5.9? Какая из этих моделей продемонстрировала большую точность в прогнозах после 1998 г.?
6. Сравните точность стационарной и нестационарной статистических моделей в целом за весь период и за различные периоды времени? Какая из этих моделей оказалась точнее за период, начиная с 1999 г.? Подкрепите свой вывод конкретными цифрами.
7. Чем объясняется широкий диапазон интервальных прогнозов для большей части наблюдений, полученных по модели log(USDollar) = с + а × log(USDollar(-l))? С помощью какого теста мы смогли построить стационарную статистическую модель с оптимизированным временным рядом? Назовите лучшую статистическую модель (из числа уже проанализированных) с точки зрения индекса оптимальности интервальных прогнозов.