Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - Владимир Брюков 10 стр.


ХtT-матрица-строка факторных значений для момента времени t в этом случае выглядит таким образом:

Следовательно, при расчете средней ошибки индивидуального значения курса доллара на каждый месяц как матрица-столбец Xt, так и матрица-строка ХtТ приобретают разные значения. И еще один важный момент: если у нас было бы уравнение регрессии со свободным членом, то в матрицу-столбец и в матрицу-строку следовало бы добавить по единице.

В частности, средняя ошибка прогнозируемого индивидуального значения курса доллара на май 2010 г. по формуле (4.17) вычисляется следующим образом:

SEind =0,8178 × 1,003983 = 0,82106.

В зависимости от того, какой уровень волатильности курса доллара инвестор ожидает в будущем месяце, он может составить интервальные прогнозы с разными уровнями надежности. Так, если на рынке ожидают очень высокую волатильность в динамике курса американской валюты, то в этом случае интервальный прогноз целесообразно составить, например, с 99 %-ным уровнем надежности, а если относительно низкую, то требуемый уровень надежности можно уменьшить до 95 %.

При этом следует иметь в виду: чем выше уровень надежности, тем больше г-значение и шире интервал прогноза, а следовательно, ниже точность прогноза. Как в зависимости от уровня надежности меняется диапазон интервального прогноза, можно посмотреть в табл. 4.9, в которой представлены интервальные прогнозы на май 2010 г., рассчитанные с разными уровнями надежности. Например, при 10 %-ном уровне надежности диапазон интервального прогноза составил лишь 20,66 коп., в то время как при 99,9 %-ном уровне надежности диапазон интервального прогноза вырос до 5 руб. 48,05 коп.

Интуитивно нетрудно понять: чем шире диапазон интервального прогноза, тем выше вероятность реализации прогноза, а следовательно, выше и его надежность. Так, фактический курс доллара к рублю на конец мая 2010 г. составил 30 руб. 49,56 коп., т. е. оказался на 1 руб. 18,19 коп. выше точечного прогноза. Несмотря надовольно значительное отклонение, мы все же не ошиблись с интервальным прогнозом, однако только в том случае, когда составили его с 90 %-ным и выше уровнем надежности, в то время как при более низком уровне надежности он оказался бы неточным.

4.5. Проверка точности составленных интервальных прогнозов

И еще один важный момент: мы уже ранее говорили, что интервальные прогнозы составляются исходя из предположения о нормальном распределении остатков, однако в действительности их распределение нельзя назвать нормальным. В связи с этим возникает вопрос: насколько, например, 95 %-ный уровень надежности соответствует фактическому попаданию курса доллара в интервал прогноза?

Чтобы ответить на этот важный вопрос, нам необходимо сделать следующее. Во-первых, решить в EViews уравнение авторегрессии 2-го порядка без константы (см. алгоритм действий № 6 «Как решить уравнение регрессии в EViews»). Во-вторых, найти точечные прогнозы с помощью опции FORECAST (см. алгоритм действий № 8 «Как оценить точность статистической модели в EViews»), в которой надо обязательно заполнить дополнительную опцию S.E. (optional) аббревиатурой SE. Таким образом, в файле SE у нас появятся средние ошибки прогнозируемого индивидуального значения курса доллара (см. табл. 4.7). В-третьих, чтобы вывести на экран точечные прогнозы, нам необходимо выбрать опции EQUATION/VIEW/ACTUAL, FITTED, RESIDUAL /ACTUAL, FITTED, RESIDUAL TABLE (уравнение/вид/ фактические, расчетные значения, остатки/таблица фактических, расчетных значений и остатков). Так мы получим данные по фактическим и предсказанным значениям курса доллара и по величине остатков за весь период с августа 1992 г. по май 2010 г., т. е. за 214 месяцев (табл. 4.10). В результате у нас получилась табл. 4.11, в которую мы в целях экономии места занесем фактические и предсказанные значения по курсу доллара лишь за два небольших периода — с августа по декабрь 1992 г. и с июля 2008 г. по май 2010 г.

В-четвертых, используя данные в файле SE по средним ошибкам прогнозируемого индивидуального значения курса доллара составим с 95 %-ным уровнем надежности интервальные прогнозы за весь период с августа 1992 г. по май 2010 г. При этом расчеты нижней и верхней границы интервальных прогнозов будем делать согласно формулам (4.15) и (4.16). Таким образом, табл. 4.11 будет дополнена еще и интервальными прогнозами по включенным в нее наблюдениям.

После проведения соответствующих подсчетов удалось выяснить, что при 95 %-ном уровне надежности из 214 составленных нами интервальных прогнозов в 206 случаях фактический курс доллара оказался в рамках интервального прогноза, т. е. был точным. Следовательно, при 95 %-ном уровне надежности фактическая вероятность точного интервального прогноза достигла 96,3 %, т. е. получилась на 1,3 процентного пункта выше заданного уровня надежности.

А теперь посмотрим, насколько удачными были наши интервальные прогнозы при других уровнях надежности. С этой целью мы должны: во-первых, найти t-значения для каждого уровня надежности; во-вторых, для каждого уровня надежности вычислить по формулам (4.15) и (4.16) верхние и нижние границы интервального прогноза, используя при этом данные из файла SE по средним ошибкам прогнозируемых индивидуальных значений курса доллара; и, в-третьих, подсчитать для каждого уровня надежности количество попаданий фактического курса доллара в диапазон интервального прогноза.

После проведения этих вычислений получилась табл. 4.10, в которой заданные уровни надежности сопоставляются с фактической долей точных прогнозов. Судя по этой таблице, доля точных прогнозов оказалась выше заданного уровня надежности при 95 %-ном и более низких уровнях надежности. Причем эта положительная разница растет при снижении уровня надежности, достигая своего максимума при 30 %-ном уровне надежности, когда она равна 43,4 процентного пункта.

Отсюда можно сделать вывод, что средняя ошибка прогнозируемого индивидуального значения курса доллара по своей сути является суммой стандартного отклонения и индивидуального значения средней ошибки. При этом рост последнего слагаемого зависит в нашем случае от значений переменных USDollar(-l) USDollar(-2) в момент прогнозирования, а если сказать точнее, то от их разницы, что фактически означает рост волатильности на валютном рынке. Именно поэтому максимального своего значения, равного 0,975232 (см. файл SE), средняя ошибка прогнозируемого индивидуального значения курса доллара достигла при прогнозировании на октябрь 1998 г., поскольку по итогам предыдущего месяца USDollar(-l) был равен 16,0645 руб., a USDollar(-2) — 7,9050 руб., т. е. разница между ними составила более 8 руб. Для справки также заметим, что в сентябре 1998 г. разница между предсказанным и фактическим курсом доллара составила 7 руб. 61,37 коп., т. е. также была наивысшей за все время наблюдений.

В целом же по всему исследуемому временному ряду средняя ошибка прогнозируемого индивидуального значения курса доллара не слишком заметно отличается от стандартного отклонения, которое равно 0,817803.

Так, если в августе 1992 г. величина средней ошибки составила 0,817807, то в мае 2010 г. она была чуть больше и равнялась 0,821060 (выше первой цифры лишь в 1,004 раза). Таким образом, в течение 18 лет средняя ошибка прогнозируемого индивидуального значения курса доллара в основном лишь незначительно отступала от стандартного отклонения, в то время как фактический курс доллара вырос с 0,1253 руб.[12] в июне 1992 г. до 30,4956 руб. в мае 2010 г., т. е. увеличился в 243,5 раза!

С учетом методики расчета нижней и верхних границ интервального прогноза (см. формулы (4.15) и (4.16)) становится вполне понятным, почему у нас в результате возникла проблема избыточной ширины интервального прогноза. Так, при прогнозе на август 1992 г. общий диапазон интервального прогноза (верхняя граница интервального прогноза минус нижняя граница интервального прогноза) при 95 %-ном уровне надежности составил 3 руб. 22,43 коп. (см. табл. 4.11), в то время как фактическое значение курса доллара было равно лишь 20,5 коп. В свою очередь при прогнозе на май 2010 г. общий диапазон интервального прогноза был равен 3 руб. 23,72 коп., а фактический курс доллара составил 30 руб. 49,56 коп. Легко подсчитать, что в августе 1992 г. диапазон интервального прогноза в 15,7 раза превышал фактический курс доллара, в то время как в мае 2010 г. его доля в стоимости курса американской валюты составила вполне приемлемые 10,62 %.

Почему для начальных наблюдений временного ряда у нас получился столь широкий диапазон интервального прогноза? Как построить статистическую модель с приемлемым диапазоном интервального прогноза? Стоит ли при этом исключать из расчетной базы данных часть наблюдений? И если исключать часть наблюдений все-таки необходимо, то как определить оптимальную выборку данных, которая необходима нам для составления предсказаний с оптимальным диапазоном интервального прогноза?

Чтобы ответить на эти вопросы, необходимо сделать следующее. Во-первых, познакомиться с такими понятиями, как устойчивость прогностической модели к внешним шокам; во-вторых, узнать, какого рода бывают изменения структурной стабильности временного ряда; в-третьих, научиться проводить тесты Чоу на структурную стабильность и на точность прогноза; в-четвертых, освоить методику проведения теста Д. Гуйарати по определению характера структурного сдвига; и, в-пятых, на основе результатов последнего теста научиться выделять выборку данных, необходимую для получения предсказаний с оптимальным диапазоном интервального прогноза.

Контрольные вопросы и задания

1. При каком уровне надежности статистически значим свободный член уравнения авторегрессии, если его p-значение равно 0,037226? Стоит ли его включать в уравнение, если мы хотим составить уравнение регрессии с 99 %-ным уровнем надежности?

2. С помощью какого алгоритма действий уравнения авторегрессии проверяются на автокорреляцию в остатках? При использовании LM-теста Бройша — Годфри какой лаг следует установить в мини-окне LAG SPECIFICATION при тестировании уравнений авторегрессии 1-го AR(1), 2-го AR(2) и 3-го порядков AR(3)? В каком случае LM-тест Бройша — Годфри свидетельствует об отсутствии автокорреляции в остатках?

3. С помощью какого алгоритма действий проверяются остатки на стационарность? Используются ли при тестировании остатков на стационарность их исходные уровни или первые разности? В каком случае результаты расширенного теста Дикки — Фуллера показывают стационарность остатков?

4. С помощью какого алгоритма действий можно получить описательную статистику? Назовите тест, с помощью которого остатки определяются на нормальное распределение? Как интерпретируются результаты этого теста? В каком случае можно говорить о левосторонней или правосторонней асимметрии в остатках, их «островершинном» или «плосковершинном» распределении?

5. Каким образом в EViews можно рассчитать точечный прогноз? Можно ли строить интервальные прогнозы исходя из их нормального распределения, если тестирование показало, что их распределение нельзя считать нормальным? Если — да, то в каком случае это можно делать?

6. Внимательно изучите табл. 4.10, а затем ответьте на следующие вопросы. Назовите уровень надежности, при котором доля точных интервальных прогнозов в большей степени соответствует заданному уровню надежности. При каком уровне надежности разница между фактическим и заданным уровнем надежности достигает своего максимума? Какую долю точных интервальных прогнозов можно получить, снизив заданный уровень надежности до 90 %?

7. Почему в полученной статистической модели возникла проблема избыточной ширины интервального прогноза? Подтвердите наличие этой проблемы конкретными цифрами. Как избыточный интервальный прогноз отражается на качестве прогнозирования?

Глава 5 Тестирование структурной нестабильности и построение нестационарной статистической модели с оптимизированным временным рядом

5.1. Тестирование авторегрессионного процесса на стационарность путем нахождения обратных единичных корней

В главе 4 мы убедились, что с помощью уравнения авторегрессии USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2) можно строить точные интервальные прогнозы с 95 %-ным уровнем надежности. Во всяком случае, прогноз по этой статистической модели на май 2010 г. показал, что доля точных интервальных прогнозов очень близка к заданному 95 %-ному уровню надежности, рассчитанному на основе нормального распределения. И это несмотря на то, что сами остатки, полученные в результате решения уравнения регрессии, нельзя назвать нормально распределенными. Правда, при этом для части наблюдений у нас получились слишком широкие интервальные прогнозы. Как далее выяснится, решить эту проблему можно с помощью тестирования произошедших во временном ряде структурных изменений.

Однако сначала давайте посмотрим, насколько устойчива полученная прогностическая модель к внезапному росту волатильности на валютном рынке? Чтобы убедиться в устойчивости этой прогностической модели, необходимо проверить авторегрессионный процесс (AR-структуру этой модели) на стационарность. В EViews провести эту проверку достаточно несложно. При этом следует иметь в виду, что в ходе решения уравнения регрессии (см. алгоритм действий № 6 «Как решить уравнение регрессии в EViews») диалоговое мини-окно EQUATION SPECIFICATION заполняется иначе, а именно вместо записи USDollar USDollar(-l) USDollar(-2) в него надо вставить формулу

USDollar AR(1) AR(2), (5.1)

где AR(1) — переменная с лагом в один месяц;

AR(2) — переменная с лагом в два месяца.

Формула (5.1) по своей математической сути аналогична формуле USDollar USDollar(-l) USDollar(-2), однако ввод в EViews уравнения по этой формуле дает возможность оценить авторегрессионный процесс на стационарность. Естественно, что при выводе итогов мы получим данные, практически аналогичные тем, которые уже содержатся в табл. 4.1. Одно из незначительных отличий заключается в том, что при выводе итогов ранее использовавшиеся обозначения переменных в виде USDOLLAR(-l) и USDOLLAR(-2) будут заменены соответственно на AR(1) и AR(2). Но самое главное заключается в том, что помимо уже известной нам информации в выводе итогов внизу появятся две дополнительные строки, в которых содержится оценка ARMA-структуры этого уравнения на стационарность (табл. 5.1).

Судя по информации в этой таблице, AR-структура этого уравнения оказалась нестационарной, поскольку один из обратных единичных корней оказался больше единицы (подробнее об этом чуть позже). А из нестационарности AR-процесса вытекает вывод, что коэффициенты уравнения авторегрессии будут неустойчивыми. Таким образом, несмотря на довольно неплохие прогностические качества этой статистической модели, ее параметры нельзя назвать достаточно надежными к воздействию внешних «шоков», т. е. к случаям внезапного и резкого повышения курса доллара.

Чтобы точнее оценить степень устойчивости этой прогностической модели, продолжим проверку ее авторегрессионной структуры, тем более что EViews позволяет сделать это с минимальными затратами времени.

Алгоритм действий № 13 Тестирование на стационарность AR-структуры уравнения USDOLLAR = а × USDOLLAR(-1) + b × USDOLLAR(-2) путем нахождения корней характеристического уравнения

Шаг 1. Нахождение корней характеристического уравнения

С этой целью в меню оцененного уравнения регрессии следует воспользоваться следующими опциями: VIEW/ARMA STRUCTURE (посмотреть/структуру модели ARMА). В результате чего на экране появится диалоговое мини-окно ARMA DIAGNOSTIC VIEWS (посмотреть диагностику модели ARMА).

Если в этом окне (рис. 5.1) выбрать опции ROOTS (корни) и TABLE (таблица), то в результате у нас получатся обратные корни характеристического уравнения в виде табл. 5.2. Судя по таблице, один из корней (по модулю) этого характеристического уравнения оказался больше единицы.

Шаг 2. Интерпретация корней характеристического уравнения

Чуть ниже мы остановимся подробнее на специфике корней, получаемых в результате решения характеристического уравнения. А сейчас отметим их самое важное для нас свойство: в том случае, когда абсолютные значения (по модулю) всех обратных корней этого уравнения меньше единицы, т. е. лежат внутри единичного круга, то этот авторегрессионный процесс можно считать стационарным, а следовательно, обладающим устойчивыми вероятностными характеристиками. Если же хотя бы один из обратных корней характеристического уравнения больше единицы, т. е. лежит за пределами единичного круга, то тогда авторегрессионный процесс является нестационарным.

Шаг 3. Построение графика корней характеристического уравнения

Если в мини-окне ARMA DIAGNOSTIC VIEWS выбрать опции ROOTS (корни) и GRAPH (график), то в этом случае мы получим обратные единичные корни характеристического уравнения в наглядном, графическом виде. Судя по рис. 5.2, один из корней находится внутри единичного круга, в то время как другой корень, хотя и расположен довольно близко к этому кругу, но все-таки лежит за его пределами. При этом следует иметь в виду, что горизонтальная ось на этом графике показывает фактические значения полученных обратных корней характеристического уравнения, в то время как вертикальная ось — их воображаемые значения.

Теперь остановимся несколько подробнее на процедуре получения обратных единичных корней, с помощью которой в EViews доказывается стационарность AR-процессов. В главе 4 уже говорилось, что в основе теории единичного корня лежит довольно простая формула (4.4), которая считается базовой для понимания стационарности в уравнениях авторегрессии:

Назад Дальше