С помощью последнего уравнения регрессии можно делать расчет прогнозов непосредственно от исходных данных, а не от их натуральных логарифмов. В результате прогноз курса на доллара на апрель 2010 г. можно вычислить следующим образом:
Y=0,044361*215^1,28073; где 215 – порядковый номер апреля 2010 г. (при июне 1992 г. =1).
Несмотря на то, что коэффициент детерминации у степенного уравнения регрессии выше, чем у линейного, однако, например, относительно апреля 2010 г. прогноз по данному уравнению регрессии весьма сильно отклоняется от фактического курса доллара, как впрочем, и во многих других случаях. Судя по таблице 2.9, с января 2009 г. по апреля 2010 г. отклонения от прогноза (остатки), сделанного по уравнению регрессии yрасч.= 0,044361*X^1,28073, колебались в диапазоне от -3,7954 руб. до -13,7862 руб., что свидетельствует о невысокой точности данной прогностической модели.
Таблица 2.9. Прогноз по степенному уравнению регрессии, фактический курс доллара и остатки с января 2009 г. по апрель 2010 г.
При этом средняя абсолютная ошибка прогноза по модулю для степенной статистической модели – см. формулу (2.20) – оказалась равна 5 рублям 92, 4 копейкам. Следовательно, этот показатель у данной модели оказался на 30 коп. выше, чем у линейной модели. В свою очередь, средняя относительная ошибка по модулю в процентах ? см. формулу (2.21) – для степенной модели оказалась равна 31,10 процентам, то есть на 7,78 процентных пункта ниже, чем у линейной модели. Более того, если построить график остатков по степенной прогностической модели (см. рис. 2.3), то легко обнаружить, что на нем наблюдается несколько локальных трендов. А это – как мы говорили ранее – наглядно свидетельствует о нестационарности остатков.
Рис. 2.6. Нестационарность остатков, полученных по степенной прогностической модели
Отсюда можно сделать вывод, что не только линейная модель, но и степенная модель, в которой в качестве независимой переменной использовался фактор времени (порядковый номер месяца), оказались непригодны для прогнозирования курса доллара. Все это заставляет нас продолжить поиск адекватной прогностической модели.
Контрольные вопросы и задания к главе 2
1. В чем суть метода наименьших квадратов, как этот метод можно представить графически?
2. Перечислите все пункты алгоритма действий, которые необходимо выполнить при решении уравнения регрессии в Microsoft Excel.
3. Какое уравнение регрессии (при прочих равных условиях) точнее: то, которое имеет коэффициент детерминации (R-квадрат)=0,757, либо то, у которого (R-квадрат) равен 0,978. Объясните почему?
4. Скажите, можно ли признать статистически значимым уравнение регрессии в том случае если значимость его F-критерия =009? И если можно, то с каким уровнем надежности?
5. В каком случае делается вывод о статистической значимости коэффициентов уравнения регрессии? Скажите, при каком Р-значении коэффициенты уравнения регрессии являются статистически значимыми с 95% уровнем надежности и с 99% уровнем надежности?
6. Перечислите формат трендов, используемых в Excel при решении уравнений регрессии графическим способом. Чем эти форматы трендов отличаются друг от друга.
Глава 3.
Уравнения авторегрессии и авторегрессии со скользящим средним
3.1. Специфика уравнений авторегрессии (AR)
В главе 2 мы убедились, что использование фактора времени для прогноза курса доллара не дает достаточно точного результата. Поэтому необходимо найти более подходящую независимую переменную (или переменные). Как известно, согласно теории эффективного рынка, наиболее полную информацию для прогноза будущей стоимости какого-либо финансового актива в момент времени t можно извлечь из его цены в момент времени t-1. Причем, точность прогноза уменьшается по мере того как прогноз делается в моменты времени t-2, t-3 … и т.д. Исходя из этого вполне очевидного постулата, можно прийти к выводу, что наиболее полную информацию о курсе доллара на момент времени t содержит его курс на момент времени t-1. Следовательно, наиболее точный прогноз курса американской валюты можно рассчитать на основе уравнения регрессии, включив в него в качестве независимой переменной курс доллара с лагом t-1. Такого рода уравнения регрессии, в которых значения результативного признака прогнозируются на основе его предыдущих значений, в статистической литературе называют уравнениями авторегрессии.
Правда, в отличие от прогностической модели, в которой в качестве независимой переменной используется фактор времени, а потому горизонт для прогноза практически безграничен, прогноз по авторегрессионной модели имеет небольшой временной горизонт для прогноза, равный длине лага. В частности, модель авторегрессии с лагом в один месяц способна давать прогноз с упреждением в один месяц.
Помимо относительно небольшого временного горизонта для прогноза, в процессе построения моделей авторегрессии возникают еще одна серьезная проблема. Дело в том, что наличие лаговых значений зависимой переменной в правой части уравнения приводит к нарушению одной из важнейших предпосылок метода наименьших квадратов (МНК) об отсутствии связи между зависимой (результативной) и независимой (факторной) переменной. Математически эта проблема может быть изложена следующим образом – см. формулу (3.1):
Где: с – свободный член (константа) уравнения, Yt – зависимая (результативная) переменная, Y t-1 – независимая (факторная) переменная с лагом в один месяц, b – соответствующий коэффициент при Y t-1, et – отклонение прогноза от фактического курса доллара (остаток) в текущем месяце t.
Таким образом из формулы (3.1) следует, что в уравнении авторегрессии может иметь место: во-первых, зависимость между et и e t-1, то есть может быть нарушена предпосылка МНК об отсутствии автокорреляция в остатках; во-вторых, может появиться зависимость между факторной переменной Y t-1 и остатками et, то есть будет нарушена предпосылка МНК о гомоскедастичности остатков.
Наличие автокорреляции в остатках означает определенную связь (корреляцию) между остатками текущих и предыдущих наблюдений. При наличии такой зависимости остатки могут, либо содержат определенную тенденцию, либо какие-то циклические колебания. В этом случае делается вывод, что отклонения от прогноза не носят случайный характер. При наличии автокорреляции в остатках оценки коэффициентов уравнения регрессии нельзя назвать состоятельными и эффективными.
Гомоскедастичность остатков означает, что дисперсия остатков Et не изменяется в зависимости от величины факторной переменной Yt-1. Если это не так, то возникает гетероскедастичность остатков, что также ? как и в случае автокорреляции в остатках ? влияет на состоятельность оценки коэффициентов уравнения регрессии.
Для справки заметим, что состоятельными оценками называются такие оценки, чья точность повышается по мере роста объема выборки, объема данных, на основе которых строится уравнение регрессии. В свою очередь, эффективными оценками называются такие оценки, которые имеют наименьшую дисперсию.
Несмотря на вышеуказанные опасения, многие авторитетные специалисты полагают, что в случае больших выборок уравнения авторегрессии позволяют получать состоятельные и эффективные оценки. Вот как, например, оценивает авторегрессионные модели профессор статистики Стэнфордского университета Т. Андерсон: «Модель авторегрессии обладает рядом преимуществ по сравнению с моделью скользящего среднего и процессом авторегрессии с остатками в виде скользящего среднего, хотя последние в определенных случаях могут хорошо описывать образование наблюдаемых временных рядов. Оценки коэффициентов процесса авторегрессии легко вычисляются. Статистические процедуры для такого процесса, основывающиеся на теории больших выборок, легко выполнимы, поскольку они соответствуют обычной технике наименьших квадратов. Во многих случаях коэффициенты процесса авторегрессии допускают непосредственную интерпретацию, а линейные функции от запаздывающих переменных могут быть использованы для прогнозирования (см. Т. Андерсон. Статистический анализ временных рядов. Пер. под ред. Ю.К. Беляева. Издательство «Мир», М., 1976 стр. 276).
Следует заметить, что в зависимости от того, сколько предыдущих значений временного ряда будет включено в уравнение авторегрессии в качестве лаговых (факторных) переменных, принято различать авторегрессионный процесс разного порядка. Так, в формуле 3.1. представлен авторегрессионный процесс первого порядка, который в англоязычной литературе обычно называется словосочетанием Auto Regressive и кратко обозначается как AR(1).
В том случае, когда в авторегрессию первого порядка добавляются лаговые переменные Yt-2 и Yt-3, то его принято обозначать как AR(3), то есть как авторегрессионный процесс третьего порядка. При этом уравнение для AR(3) примет вид (3.2):
где Y t-1, Y t-2 и Y t-3– независимые (факторные) переменные с лагом в один, два и три месяц; b1,b2 и b3 – соответствующие коэффициенты регрессии при лаговых переменных.
3.2. Специфика уравнений авторегрессии со скользящим средним (ARMA)
Помимо авторегрессионных моделей, нам необходимо также познакомиться и с моделями со скользящим средним в остатках, которые в англоязычной литературе обычно называется словосочетанием Moving Average. Полезность моделей со скользящим средним в остатках обусловлена тем, что для стационарного ряда предсказываемую переменную Yt можно представить в виде линейной функции прошлых ошибок (отклонений прогнозов от их фактических значений). Следует иметь в виду, что термин «скользящая средняя» в данном случае не является синонимом скользящей средней, применяемой, например, для сезонного сглаживания уровней динамического ряда. При этом модель со скользящими средними в остатках первого порядка кратко обозначается как МА(1), а ее формула имеет следующий вид:
Объединение в одной модели авторегрессионного процесса AR и модели со скользящим средним в остатках МА приводит к созданию более экономичной модели с точки зрения количества используемых параметров. Эту объединенную модель в англоязычной литературе кратко называют ARMA. Данная аббревиатура произошла от словосочетания ? Auto Regressive ? Moving Average, что в переводе означает авторегрессионный процесс со скользящими средними в остатках.
Порядок в этой модели в буквенной форме принято обозначать как ARMA(p,q), где p ? величина порядка авторегрессионного процесса, а q – величина порядка процесса со скользящим средним в остатках. Например, модель ARMA (2;1) фактически представляет собой комбинацию модели AR (2) с моделью MA(1), то есть в одной модели объединена авторегрессионная модель второго порядка с моделью со скользящим средним в остатках первого порядка. В результате модель ARMA (2;1) приобретает вид (3.4):
Для того, чтобы объединенная модель ARMA(2;1) была нашим читателям более понятна, ее можно задать в виде двух уравнений. Так, для AR(2) формула будет иметь вид (3.5)
В то время как уравнения для MA(1) можно представить так (3.6):
Следовательно, формулу (3.4) модели ARMA(2; 1) можно получить путем вычитания из
левой части формулы (3.5) левой части уравнения (3.6).
3.3. Коррелограмма и идентификация лаговых переменных в уравнениях AR и ARMA
При практическом построении модели ARMA(p,q) наиболее трудным является определение параметров p и q, то есть определение оптимального количества лагов. При этом инструментами для нахождения соответствующих лаговых переменных являются автокорреляционная функция и частная автокорреляционная функция, о которых мы расскажем ниже.
Программа EViews позволяет довольно быстро найти оптимальные параметры p и q для модели ARMA. Для этого используется коррелограмма зависимости между различными лагами временного ряда с ежемесячными курсами американского доллара к российскому рублю.
Алгоритм действий № 5 «Как построить коррелограмму в EViews»
Шаг 1. Выбор основных опций для построения коррелограммы
С этой целью загрузим в EViews ежемесячные данные по курс доллара (столбец с данными обозначим как USDOLLAR) в соответствии с алгоритмом действий № 2 «Импорт данных и создание рабочего файла в EViews».
Далее строим коррелограмму, тем более что в EViews это сделать довольно просто. С этой целью в Workfile (рабочем файле) данной программы открываем файл USDOLLAR. После чего в файле USDOLLAR нам необходимо выбрать опции View/Correlogram, а в появившемся окне (см. рис. 3.1) Correlogram Specification (спецификация коррелограммы) оставить заданные по умолчанию опцию Level (исходный уровень) и опцию LAGS TO INCLUDE (максимальную величину лага, включенного в коррелограмму). В результате у нас получится коррелограмма исходных уровней (фактических значений курса доллара) временного ряда USDOLLAR с величиной лага от 1 до 36.
Шаг 2. Дополнительные возможности, которые можно использовать для построения коррелограммы
В том случае, если бы мы выбрали, например, опцию 1st difference (разница исходных уровней первого порядка) или 2nd difference (разница исходных уровней второго порядка), то тогда бы была построена коррелограмма не исходных уровней временного ряда, а соответственно, их первых и вторых разностей. Например, исходный уровень для курса доллара по состоянию на апрель 2010 г. был равен 29,2886 рублям. В то время как разница исходных уровней первого порядка на эту же дату оказалась равна -0,0752 рубля (то есть по сравнению с прошлым месяцем курс доллара снизился на 7,52 коп.), а разница исходных уровней второго порядка составила 0,5094 рубля (то есть падение курса доллара по сравнению с предыдущим месяцем уменьшилось на 50,94 коп.).
Рис. 3.1. Использование опций Level и Lags to include для построения кореллограммы
В полученной коррелограмме (см. табл. 3.1) можно увидеть, как меняется коэффициенты автокорреляции (Autocorrelation или АС) и частной автокорреляции (Partial Correlation или РАС) в зависимости от изменения величины лага. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда. Так, коэффициент автокорреляции уровней первого порядка измеряет корреляционную зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-1, то есть в нашем случае измеряется коэффициент автокорреляции при лаге в один месяц. В свою очередь, коэффициент автокорреляции уровней второго порядка измеряет зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-2, то есть при лаге в два месяца. И так далее, вплоть до коэффициента автокорреляции уровней 36 порядка, измеряющего зависимость между динамикой курса доллара временного ряда t и динамикой курса доллара временного ряда t-36, то есть с лагом в 36 месяцев.
При этом коэффициент автокорреляции уровней k-ого (то есть первого, второго… тридцать шестого) порядка находится в EViews по формуле (3.7):
где n – количество наблюдений во временном ряде; k – величина лага; Yt – динамика курса доллара временного ряда t;Y t-k – динамика курса доллара временного ряда t-k; Y – с черточкой сверху средняя для всей выборки.