Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews - Владимир Брюков 12 стр.


Анализируя по табл. 5.7 динамику стандартных остатков, легко заметить, что своего максимума они достигли в августе и сентябре 1998 г.

Чтобы обратить внимание читателей к этим двум наблюдениям, их выделили жирным шрифтом. При этом можно увидеть, что в то время как стандартные остатки в августе 1998 г. оказались равны 2,931979 и были меньше трех стандартных отклонений, то в сентябре 1998 г. их величина составила 4,922042, приблизившись тем самым к пяти стандартным отклонениям. Таким образом, с уверенностью можно констатировать, что сентябрьский остаток представляет собой выброс — это весьма осложняет получение (по применяемой статистической модели) точного прогноза на октябрь 1998 г. Впрочем, выбросом можно считать и остатки, полученные в августе 1998 г., если снизить уровень для выбросов до двух стандартных отклонений.

Помимо стандартных остатков для анализа выбросов используются также стьюдентизированные остатки, которые представляют собой частное от деления обычного остатка на оценку его стандартного отклонения. Хотя теоретически все случайные ошибки, полученные после решения уравнения регрессии, считаются независимыми и имеющими одну и ту же дисперсию, однако в действительности конкретные остатки в силу своего различенного положения во временном ряду отнюдь не независимы и, следовательно, не имеют одинаковых дисперсий[14]. Поэтому чтобы учесть эту разницу в дисперсии остатков, их необходимо стьюдентизировать, т. е. оценить с учетом их положения в выборке. Формулу по расчету стьюдентизированных остатков мы дадим далее, а сейчас приведем алгоритм действий, с помощью которого можно быстро получить стьюдентизированные остатки. Правда, в Excel такая возможность отсутствует, но в последних версиях EViews эту процедуру можно реализовать с помощью статистики влияния остатков (INFLUENCE STATISTICS). Чтобы уяснить, как это делается, надо прочитать алгоритм действий № 17.

Алгоритм действий № 17 Диагностика в EViews влияния стьюдентизированных остатков на уравнение регрессии для прогностической модели USDOLLAR = а × USDOLLAR(-1) + b × USDOLLAR(-2) Шаг 1. Как получить стьюдентизированные остатки

После решения уравнения регрессии (на основе рыночных данных по курсу доллара за период с июня 1992 г. по сентябрь 1998 г.) в строке EQUATION выбираем опции VIEW/STABILITY DIAGNOSTICS/INFLUENCE STATISTICS. В результате на экране появляется диалоговое мини-окно INFLUENCE STATISTICS, которое нужно соответствующим образом заполнить, чтобы провести диагностику остатков (рис. 5.6). Чтобы получить как графический, так и табличный вариант по статистике влияния остатков в параметре OUTPUT TYPE (тип выходной статистики), следует установить опции GRAPH (график) и TABLE (таблица). Далее в параметре OUTPUT STATISTICS (выходная статистика) ставим галочку у опции RSTUDENT (стьюдентизированные остатки) и рядом пишем RS — название файла, который будет помещен в рабочий файл.

Шаг 2. Интерпретация влияния стьюдентизированных остатков на точность прогноза

В результате шага 1 получены диаграмма (она приведена на рис. 5.7) и табл. 5.8. Интерпретация диаграммы довольно проста, поскольку на ней представлен график значений стьюдентизированных остатков, который с обеих сторон выделен пунктирной линией и обозначает область допустимых значений, равных ± 2. Когда стьюдентизированные остатки выходят за пределы этой пунктирной линии, в этом наблюдении их можно считать выбросами. Легко заметить, что особенно велик стьюдентизированный остаток, полученный в сентябре 1998 г.

В таблице 5.8 приведена часть полученных с помощью EViews значений стьюдентизированных остатков (за период с января 1997 г. по сентябрь 1998 г.). При этом стьюдентизированные остатки, которые считаются выбросами (их величина больше или меньше 2), при выводе итогов обозначаются EViews красным шрифтом (в таблице они подчеркнуты). При этом область допустимых значений определяется с помощью уже известной нам t-статистики. В частности, выбросами считаются остатки, которые получены не только в сентябре, но и в августе 1998 г. Если сравнить стандартные остатки из табл. 5.7 со стьюдентизированными остатками, то легко заметить, что значения последних — за счет выросшей дисперсии между наблюдениями — наиболее сильно отличаются от значений первых для августа и сентября 1998 г.

Некоторые математические подробности по расчету стьюдентизированных остатков в EViews

Теоретически все случайные ошибки предполагаются независимыми и имеющими одну и ту же дисперсию σ2, однако в действительности конкретные остатки отнюдь не независимы и, следовательно, не имеют одинаковых дисперсий. В действительности дисперсия остатков зависит не только от величины σ2, но и от hi — i-го диагонального элемента матрицы вида Хt(Х`Х)-1Хt, с которой мы уже познакомились в главе 3.

Стьюдентизированные остатки в EVews рассчитываются по формуле

где еt — остаток для конкретного наблюдения, полученный по уравнению регрессии, построенному с учетом всех наблюдений временного ряда;

s(i) — стандартное отклонение остатков, полученное по уравнению регрессии, построенному по тому же временному ряду без учета наблюдения i;

ht — i-ный диагональный элемент матрицы вида Хt(ХХ)-1Хt.

При необходимости i-ный диагональный элемент матрицы Хt(ХХ)-1Хt можно найти для каждого наблюдения, если в диалоговом мини-окне INFLUENCE STATISTICS установить опцию ПАТ MATRIX (т. е. матрица Хt(ХХ)-1Хt).

Например, величина стьюдентизированного остатка для сентября 1998 г. равна

Распределение стьюдентизированных остатков подчиняется t-статистике, получаемой в результате подстановки фиктивной переменной в первоначальное уравнение регрессии. Причем фиктивная переменная для интересующего нас наблюдения i равна 1, а для всех остальных наблюдений она равна 0. Таким образом, стьюдентизированный остаток можно интерпретировать как тест на значимость остатка определенного наблюдения с точки зрения его влияния на уравнение регрессии.

Следует заметить, что если у кого-то из читателей нет последней версии EViews или иных программ, умеющих рассчитывать стьюдентизированные остатки, то в принципе для обнаружения выбросов вполне возможно пользоваться стандартными остатками. Во всяком случае, как утверждают Н. Дрейпер и Г Смит, в подавляющем большинстве случаев, хотя и не во всех, для обнаружения выбросов вполне достаточно пользоваться графиками обычных и стандартных остатков[15].

Чтобы убедиться в справедливости этих слов, мы провели небольшой эксперимент. С этой целью уравнение регрессии USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2) решено на основе данных за период с июня 1992 г. по апрель 2010 г., а затем рассмотрены полученные остатки (табл. 5.9). В том случае, когда стьюдентизированные остатки диагностируют выбросы, стандартные остатки также их выявляют (если к выбросам отнести остатки, имеющие два стандартных отклонения). Правда, поскольку стьюдентизированные остатки учитывают не только стандартное отклонение, но и дисперсию между различными наблюдениями (формула (5.6)), то величина стьюдентизированных остатков всегда выше. Причем особенно заметна эта разница относительно сентября 1998 г. и января 2009 г., т. е. когда на валютном рынке наблюдалась максимальная волатильность, обусловленная в первом случае августовским дефолтом 1998 г., а во втором случае — глобальным финансовым кризисом 2008–2009 гг.

5.5. Тесты Чоу на наличие структурной стабильности во временно м ряде

Диагностика выбросов в остатках является не единственным инструментом для выявления проблем, мешающих повышению точности прогностических моделей. В этом смысле, пожалуй, еще большее значение имеет тест Грегори Чоу на наличие структурной стабильности временного ряда. Поэтому следующим нашим шагом будет оценка на основе этого теста стабильности временного ряда за период с июня 1992 г. по апрель 2010 г. С методикой проведения этого теста можно познакомиться в алгоритме действий № 18.

Алгоритм действий № 18 Методика проведения теста Чоу на наличие структурной стабильности во временно м ряде для прогностической модели USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2) Шаг 1. Основные идеи, на которых строится тест Чоу на наличие структурной стабильности

Тест Чоу на диагностирование структурной стабильности проводится следующим образом. Сначала берется временной ряд (например, данные по ежемесячному курсу доллара за период с июня 1992 г. по апрель 2010 г.), относительно которого выдвигается нулевая гипотеза о его структурной стабильности. Потом этот временной ряд делится на два периода наблюдений, граница между которыми проводится в момент времени t, т. е. в момент предполагаемых структурных изменений. (При необходимости EViews позволяет проводить тест на наличие во временном ряде структурных изменений не только в какой-то один момент времени t, но и сразу для нескольких моментов, деля выборку на несколько соответствующих периодов.)

Тест Чоу на диагностирование структурной стабильности проводится следующим образом. Сначала берется временной ряд (например, данные по ежемесячному курсу доллара за период с июня 1992 г. по апрель 2010 г.), относительно которого выдвигается нулевая гипотеза о его структурной стабильности. Потом этот временной ряд делится на два периода наблюдений, граница между которыми проводится в момент времени t, т. е. в момент предполагаемых структурных изменений. (При необходимости EViews позволяет проводить тест на наличие во временном ряде структурных изменений не только в какой-то один момент времени t, но и сразу для нескольких моментов, деля выборку на несколько соответствующих периодов.)

Проверка нулевой гипотезы идет путем сравнения разницы между суммой квадратов остатков, которую мы получаем, построив уравнение регрессии для единого временного ряда, и суммой квадратов остатков, получаемой при построении уравнения регрессии отдельно для каждого периода этого ряда. При этом в соответствии с методикой, предложенной Г. Чоу, определяется фактическое значение F-критерия и LR-статистики (log likelihood ratio statistic — соотношение статистики логарифмов правдоподобия). Если уровни значимости F-критерия и LR-статистики оказываются меньше 0,05, то тогда нулевая гипотеза о структурной стабильности временнoго ряда отвергается, а следовательно, влияние структурных изменений признается существенным.

Шаг 2. Проведение в EViews теста Чоу на наличие структурной стабильности

В соответствии с данными табл. 5.4 вполне логично предположить, что самые значительные структурные изменения в исследуемом временном ряде могли произойти после самого крупного скачка курса доллара, имевшего место в сентябре 1998 г. Поэтому мы решили выделить в нашем временном ряде период с октября 1998 г. по апрель 2010 г. При этом для корректного проведения теста необходимо, чтобы количество наблюдений в каждом из выделенных периодов временнoго ряда было по меньшей мере равно количеству параметров в оцененной нами статистической модели. Впрочем, это требование соблюдено, поскольку в анализируемой статистической модели всего лишь два параметра, а в самом малом выделенном периоде временного ряда имеется 74 наблюдения.

Чтобы в EViews провести тест Чоу на наличие структурной стабильности, в меню оцененного уравнения регрессии необходимо воспользоваться опциями VIEW/STABILITY TESTS/CHOW BREAKPOINT TEST… (смотреть/тесты на стабильность/тест Чоу на структурные изменения). В результате открывается диалоговое мини-окно CHOW TESTS (тесты Чоу), в котором нужно указать конкретное наблюдение, когда произошло предполагаемое структурное изменение во временном ряде. В этом случае в мини-окно введено обозначение — 98m10, т. е. указан октябрь 1998 г. (рис. 5.8). Следовательно, можно посмотреть, произошли ли структурные изменения в октябре 1998 г.

После того как мы щелкнули кнопку ОК, в мини-окне CHOWTESTS появился вывод данных по результатам тестирования, которые приведены в табл. 5.10. Поскольку уровни значимости (Probability) как F-критерия (F-statistic), так и LR-статистики (Log likelihood ratio — соотношения логарифмов правдоподобия) у нас оказались равны нулю, т. е. получились меньше критического значения, равного 0,05, следовательно, нулевая гипотеза о наличии структурной стабильности во временном ряде в октябре 1998 г. отвергается.

Некоторые математические подробности для теста Чоу на наличие структурной стабильности во временном ряде

После того как была выдвинута нулевая гипотеза о структурной стабильности временного ряда, далее нам приходится решать несколько уравнений регрессии USDOLL AR = a × USDOLL AR(−1) + b × USDOLL AR(−2) как относительно единого временного ряда, так и относительно каждого выделенного периода наблюдений. Напомним, что в этом случае мы предположили, что структурная нестабильность возникла в октябре 1998 г., а потому временной ряд нами разделен на два периода: с июня 1992 г. по сентябрь 1998 г. и с октября 1998 г. по апрель 2010 г. Таким образом, мы находим сумму квадратов остатков, полученных как по единому уравнению регрессии для всего временнoго ряда, так и по остальным уравнениям регрессии (назовем их совокупность объединенной кусочно-линейной прогностической моделью) для каждого выделенного периода наблюдений.

Далее складываем суммы квадратов остатков, полученных в объединенной кусочно-линейной прогностической модели, по формуле

После чего находим фактическое значение F-критерия по формуле

где SSедост — сумма квадратов остатков, полученных по единому уравнению регрессии для всего временного ряда;

п — количество наблюдений во всем временном ряде;

k — количество параметров в уравнении.

Затем в Excel с помощью функции РРАСП находим значимость фактического F-критерия:

FPACП(Fфакт); числитель степеней свободы; знаменатель степеней свободы) = FPACП(42,111; 2; 209) = 0.

Таким образом, поскольку значимость фактического F-критерия равна нулю, это позволяет нам отвергнуть нулевую гипотезу о структурной стабильности временнoго ряда.

LR-статистика в этом тесте рассчитывается путем сравнения ограниченного и неограниченного максимума функции логарифма правдоподобия. Причем LR-статистика — при нулевой гипотезе об отсутствии структурных изменений — имеет асимптотическое χ2 (хи-квадрат) распределение со степенями свободы, равными

(т — 1 )k,

где т — число периодов во временном ряде;

k — количество параметров в уравнении регрессии.

При значимости LR-статистики меньше 0,05 нулевая гипотеза о структурной стабильности отвергается.

Поскольку мы уже научились проводить тест Чоу на структурную стабильность временного ряда, то продолжим наше исследование уровня надежности модели USDOLLAR = а × USDOLLAR(-l) + b × USDOLLAR(-2), используя при этом рыночные данные за период с июня 1992 г. по апрель 2010 г. Теперь нашей задачей будет последовательное тестирование структурной стабильности временного ряда после резких скачков курса доллара, вошедших в топ-двадцатку самых волатильных месяцев (см. табл. 5.4).

Следует иметь в виду, что применение теста Чоу, как правило, предполагает соблюдение предпосылок о нормальном распределении остатков и независимости их распределения. К сожалению, в этом случае, поскольку мы имеем дело с уравнением авторегрессии, эти предпосылки не выполняются. Тем не менее тест и в этой ситуации показал себя достаточно чувствительным к структурным изменениям.

По результатам тестирования мы составили табл. 5.11, в которой все наблюдения размещены в календарной последовательности. При этом каждый месяц резкого скачка курса доллара взят в качестве первого наблюдения, включенного в период после предполагаемых структурных изменений во временном ряде, поскольку в этом случае тест становится наиболее чувствительным к изменению стабильности.

И еще один важный момент в связи с тем, что поскольку в период с января 2000 г. по январь 2004 г. ни одно из наблюдений не вошло в топ-двадцатку самых волатильных, а информация по этому периоду нам также важна, то мы заполнили этот период, протестировав менее волатильные месяцы. Их мы не стали выделять жирным шрифтом, чтобы отличить от остальных, гораздо более волатильных наблюдений.

Судя по табл. 5.11, начиная с октября 1998 г. и по июнь 2000 г. в исследуемом временном ряде наблюдаются структурные изменения. Однако с конца 1998 г. и до середины 2000 г. волатильность на валютном рынке стала понемногу затухать, а к июлю 2000 г. тест Чоу вновь стал уверенно показывать наличие структурной стабильности. Впрочем, за одним-единственным исключением: после резкого роста доллара в январе 2009 г. на 18,7 % — в ходе так называемой плавной девальвации рубля — тест Чоу вновь выявил структурную нестабильность временного ряда, которая, впрочем, восстановилась уже в следующем месяце.

Вызывает большие сомнения, что 26,8 % — ное повышение курса доллара в августе 1998 г. не привело к структурным изменениям во временном ряде. Тем не менее уровни значимости F-критерия и LR-статистики, полученные в ходе тестирования, оказались в августе 1998 г. существенно выше 0,05. Это объясняется тем, что в табл. 5.6 представлены результаты тестирования для статистической модели, построенной на базе данных за период с июня 1992 г. по апрель 2010 г. При такой базе данных прирост курса доллара в августе 1998 г. на 1,67 руб. не выглядит чем-то экстраординарным, хотя сразу после августовского дефолта столь значительный взлет американской валюты буквально шокировал участников рынка.

Назад Дальше