Построение моделей авторегрессионной условной гетероскедастичности (ARCH) некоторых индикаторов российского финансового рынка


ГЛАВА 2. МЕТОДЫ ОЦЕНИВАНИЯ.

СПЕЦИФИКАЦИЯ МОДЕЛИ.

– последовательность наблюдаемых скалярных случайных величин. - набор предопределенных к моменту t переменных. Функции условных мат. ожидания и дисперсии совместно параметризованы вектором : . – известные функции, которые далее будем обозначать, опуская аргумент и используя нижний индекс t. Существует единственный такой, что

(М.1)

(М.2) ,

называется вектором истинных параметров. Определим также функции остатков и стандартизованных остатков

.

Условия (М.1)-(М.2) позволяют вычислить математическое ожидание и дисперсию в произвольной точке параметрического пространства. Например, в точке

(М.3)

(М.4) .

Процедура, используемая наиболее часто для оценки , состоит в максимизации функции правдоподобия, построенной в предположении о том, что распределение при условии нормально со средним и дисперсией, определенными (М.1)-(М.2). Гипотеза об условной нормальности, однако, часто не выдерживает тестирования; в этой связи возникает проблема выбора метода, устойчивого к различным ее нарушениям.

Обоснован метод квази-максимального правдоподобия, который предполагает максимизацию нормальной функции правдоподобия при том, что распределение в действительности не является нормальным. При этом оценки сохраняют свойства состоятельности и асимптотической нормальности, однако утрачивают свойство асимптотической эффективности.

В данной работе предпринята попытка оценить модель обобщенным методом моментов. Оказалось возможным построить оптимальные инструменты, приводящие к оценкам, асимптотически более эффективным, чем оценки метода квази-максимального правдоподобия.

2.1 ОЦЕНИВАНИЕ ARCH-N МОДЕЛИ: МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ.

Применение метода максимального правдоподобия требует явного задания функции плотности распределения случайных величин . Предположение о нормальном характере распределения позволяет воспользоваться простой и детально разработанной процедурой оценивания неизвестных параметров, которая и является предметом рассмотрения настоящего параграфа. Гипотеза об условной нормальности процесса формально записывается как

(N) .

ОПРЕДЕЛЕНИЯ.

Оценки метода максимального правдоподобия (ММП) доставляют максимум критериальной функции, составленной из вкладов отдельных наблюдений:

(3.1) ,

где вклад t-го наблюдения определяется как

(3.2) .

совпадает с логарифмом совместной плотности распределения вектора . Градиент и гессиан критериальной функции также составлены из вкладов отдельных наблюдений:

,

вклады наблюдения t записываются как

(3.3)

(3.4)

.

Вычислим условные ожидания (3.3) и (3.4) в точке истинных параметров. Значения функций и , производные этих функций по q предопределены к моменту t. Выражения, заключенные в квадратные скобки, обращаются в нуль. Имеем

(3.5)

(3.6)

Обозначим матрицу условной ковариации вклада t-го наблюдения градиент:

(3.7) .

Вследствие (3.5) безусловное ожидание градиента критериальной функции равно нулю:

(3.8) .

Определим информационную матрицу как безусловную ковариацию градиента в точке :

(3.9) .

Поскольку последовательность вкладов наблюдений в градиент критериальной функции серийно не коррелирует (равенство (3.5)), информационная матрица может быть также вычислена по формуле

(3.10) .

Для дальнейшего изложения существенно, что соотношения (3.3)-(3.10) были выведены вне связи с гипотезой (N).

 

ИНФОРМАЦИОННАЯ МАТРИЦА.

В теории метода максимального правдоподобия известно равенство

(3.11) ,

которое нетрудно установить и в данном случае. Внешнее произведение вклада t-го наблюдения в градиент содержит в степени от первой до четвертой. Условные мат. ожидание и дисперсия истинных остатков определены равенствами (М.3)-(М.4), тогда как для вычисления третьего и четвертого моментов необходимо прибегнуть к дополнительному предположению (N). (3.11) влечет равенство

(3.12) ,

однако вычислить полные ожидания не представляется возможным.

В некоторых случаях вектор q можно разделить на компоненты b и g , первая из которых параметризует условное среднее, вторая – условную дисперсию. Тогда, однако даже в этом случае . Если, кроме того, распределение симметрично, выполнены некоторые ограничения на функциональную форму , то информационная матрица является блочно-диагональной:

.

Engle (1982) приводит набор достаточных условий и формальное доказательство для ARCH(q)-N модели. Блочная диагональность информационной матрицы между параметрами b и g означает, что оценки параметров среднего состоятельны даже при неверной спецификации функции условной дисперсии. В частности, оценки методом наименьших квадратов являются состоятельными, однако, выигрыш в эффективности от использования ММП по сравнению с МНК может оказаться сколь угодно великим. Более того, оценки g, полученные на основе состоятельных, но не эффективных оценок b (например, на основе МНК), сохраняют свойство асимптотической эффективности.

Не обладают свойством блочной диагональности информационные матрицы ARCH-M моделей: для них разбиения q = (b, g) не существует. Иное исключение составляют EGARCH модели и другие, в которых является асимметричной функцией остатков. Присутствие ошибок в спецификации функции условной дисперсии приводит к несостоятельности оценок параметров среднего, и наоборот. Состоятельное оценивание требует верной спецификации полной модели.

При определенных условиях регулярности оценки максимального правдоподобия состоятельны, асимптотически нормальны и эффективны с асимптотической матрицей ковариации

(3.13) .

Существуют два базовых способа состоятельно оценить информационную матрицу. Первый способ основан на связи информационной матрицы и гессиана (равенства (3.11)-(3.12)). В качестве оценки приемлема матрица , где

(3.14) .

Данная оценка построена как сумма выражений вида , причем участвующие в функции исчислены в точке .

Второй способ вытекает из равенства (3.10) для информационной матрицы. Опустив знаки мат. ожиданий и воспользовавшись оценками неизвестных параметров, приходим к

(3.15) .

Второй способ восходит к статье Berndt, Hall, Hall, and Hausman и потому называется BHHH. Другое название - метод внешнего произведения градиента (outer product of the gradient, OPG).

Как , так и состоятельны для I. Обращенная информационная матрица служит оценкой матрицы ковариации оценок максимального правдоподобия . Возможны, следовательно, два выражения:

(3.16.а)

(3.16.б) .

 

2.2 НАРУШЕНИЯ ГИПОТЕЗЫ ОБ УСЛОВНОЙ НОРМАЛЬНОСТИ: МЕТОД КВАЗИ-МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ.

Гипотезу (N) позволяет протестировать верное в нуле свойство независимости и нормальной распределенности стандартизованных остатков. Как правило, гипотеза отклоняется из-за того, что оцененные демонстрируют положительный куртозис. Реже причиной отклонения нулевой гипотезы становится асимметрия (необходимые ссылки представлены Bollerslev, Chou и Kroner (1992)).

Рядом авторов реализован ММП в предположении о том, что плотность распределения принадлежит некоторому параметризованному семейству ¦(z,u). Так, Bollerslev (1987), Nelson (1990), Bollerslev, Engle и Nelson (1993) применяют, соответственно, t-Стьюдента, GED, и обобщенное t-Стьюдента распределения. Плотности t и GED имеют единственный параметр, регулирующий величину куртозиса, плотность обобщенного t-распределения имеет два параметра и включает t и GED как частные случаи (свойства GED обсуждались в параграфе 2). Параметры u и q оцениваются одновременно максимизацией логарифмической функции правдоподобия

.

С точки зрения асимптотической эффективности ММП с корректно определенной функцией плотности ¦ (× ,× ) является наилучшим решением. Реализация его, однако, технически крайне трудна: поскольку производные соответствующих функций правдоподобия не могут быть представлены аналитически, для максимизации их прибегают к методам численного дифференцирования.

Качество подбора функции плотности ¦ (× ,× ) можно установить, сравнивая фактическое и ожидаемое количества таких значений , которые превосходят некоторое заданное Z. В этом смысле GED не вполне адекватно отражает частоту “хвостовых событий”: фактическое число выбросов гораздо больше, чем если бы были реализациями GED-распределенной случайной величины со значением параметра u , равным оцененному. Кроме того, t и GED симметричны, тогда как асимметрия – одна из важных особенностей изучаемых в данной работе российских финансовых активов. По этим причинам ММП был предпочтен методам квази-максимального правдоподобия и моментов. Среди других распределений, примененных при оценивании ARCH модели, – смесь нормального и логнормального, нормального и Пуассона распределений.

Установлено, что максимизация критериальной функции (3.1)-(3.2) приводит к состоятельным и асимптотически нормальным оценкам независимо от того, как именно распределены случайные величины . В тех случаях, когда истинное распределение неизвестно, эту процедуру принято называть методом квази- (псевдо-) максимального правдоподобия (МКМП). Отличие ее от традиционного ММПсостоит в матрице ковариации оценок:

(3.17)

.

Равенство неверно в общем случае без предположения об условной нормальности, поэтому (3.17) не эквивалентно (3.13). МКМПнеизбежно приводит к потере асимптотической эффективности. Потери эффективности, возникающие, в частности, при t-распределенных ошибках невелики, однако могут быть весьма существенными, если распределение ошибок асимметрично.

Для вывода равенств (3.5), (3.6), (3.8), и (3.10) предположение (N) не привлекалось, все они являются следствием верной спецификации функций условного среднего и дисперсии, т.е. (M.1)-(M.2). Поэтому матрица остается состоятельной для гессиана, – состоятельной для информационной матрицы. Однако и не являются асимптотически эквивалентными, как не являются асимптотически эквивалентными минус гессиан и информационная матрица. Оценкой ковариацонной матрицы КМП-оценок служит

(3.18) .

Оценка (3.18) устойчива к нарушению гипотезы об условной нормальности в том смысле, что остается состоятельной для ковариации оценок, полученных максимизацией (3.1)-(3.2). Оценки и при указанном нарушении свойства состоятельности не сохраняют.

ТЕСТИРОВАНИЕ

Асимптотическая нормальность оценок КМП позволяет воспользоваться стандартными процедурами. Пусть нулевая гипотеза формулируется как

(3.19) ,

где дифференцируема на и l<m. Если и матрица имеет ранг l, то применима статистика Вальда

(3.20) ,

где - оценки параметров при альтернативной гипотезе (оценки полной модели, без ограничений (3.19)), - состоятельная оценка ковариации . При верной гипотезе (N) следует использовать , в противном случае - . Верно предположение (N) или нет, в нуле статистика Вальда имеет асимптотическое хи-квадрат распределение с m-l степенями свободы. Тест Вальда

(3.21)

где - 5%-й квантиль распределения, характеризуется асимптотической ошибкой первого рода 5%: вероятность отвергнуть тогда как она верна

при увеличении числа наблюдений сходится к

.

Асимптотические результаты могут оказаться неприемлемыми для малых выборок и при некорректном выборе матрицы . Bollerslev и Wooldridge (1992) сообщают результаты имитационных экспериментов, проливающих свет на характер искажений, связанных с использованием в тестировании несостоятельных оценок при нарушении гипотезы (N). Общий вывод исследования состоит в следующем: ковариационные матрицы систематически недооценивают истинные размеры стандартных ошибок.

Схема исследования такова. Построены 1000 реализаций AR(1)-GARCH(1,1) процесса, имеющего условное распределение. Для каждой реализации вычислены

(3.19) трех типов по общей формуле (3.20). Тип статистики определяется типом оценки вариационной матрицы, применяемой в (3.20) - RB, HE, или OPG.

Имитационные эксперименты позволяют построить эмпирические распределения трех вариантов статистики Вальда при верной нулевой гипотезе, которые затем сопоставляются с хи-квадрат распределением. Полученные распределения имеют более толстые хвосты, чем . Так, например, доля реализаций статистики Вальда типов HE и OPG, лежащих правее 5%-го квантиля, больше 0.05, скажем, 0.1. Это означает, что тест (3.18) имеет ошибку первого рода 10%, а не 5%. Иными словами, вероятность отвергнуть нулевую гипотезу в то время как она верна составляет 0.1:

.

Распределение RB-статистики близко к . Использование устойчивой формы статистики Вальда, как и следовало ожидать, предпочтительнее двух других, причем OPG-статистика наименее точна. Таким образом, как , так и систематически преуменьшают вариацию оценок и вводят в заблуждение относительно того уровня значимости, с которым нуль может быть отвергнут.

Точность всех форм статистик снижается при переходе к несимметричному распределению . Аналогичные результаты были получены и для LM статистики.

ЧИСЛЕННЫЕ МЕТОДЫ НАХОЖДЕНИЯ ОЦЕНОК

Значения, доставляющие максимум критериальной функции (с соответствующими оговорками), удовлетворяют условиям первого порядка

(3.22) .

Нахождение численного решения системы (3.22) предполагает реализацию алгоритма, i-й шаг которого задается формулой

(3.23) .

- некоторая симметричная, положительно определенная матрица размерности m´ m. В качестве могут быть использованы гессиан или оценка информационной матрицы, вычисленные на i-м шаге с использованием . Стационарная точка последовательности удовлетворяет (3.22).

Для упрощения вычислений разработан прием, называемый искусственной регрессией (auxiliary regression): вектор приращений параметров приводится к характерному виду при помощи некоторых искусственных переменных A и C.

Запишем в форме искусственной регрессии шаг алгоритма, использующего в качестве взвешивающей матрицы минус условный гессиан . Воспользуемся матрицей регрессоров размерности 2n´ m и 2n-компонентным вектором зависимой переменной

, .

Градиент и минус гессиан записываются через переменные A и C как

Шаг алгоритма приобретает вид

.

Запишем искусственную регрессию для алгоритма со взвешивающей матрицей вида . Независимые переменные данной регрессии формируют n´ m матрицу вкладов в градиент со строками . В качестве независимой переменной выступает n´ 1 вектор i , все компоненты которого равны единице. Тогда

Шаг алгоритма приобретает вид

.

Выбор матрицы F в (3.22) влияет на скорость сходимости алгоритма. С этой точки зрения рассмотренная выше форма HE взвешивающей матрицы предпочтительнее OPG. Для оптимизации скорости сходимости алгоритма можно корректировать длину вектора изменения параметров в заданном направлении с помощью дополнительного параметра l :

.

Целесообразно выбирать l , максимизируя по нему критериальную функцию:

.

Использование l особенно полезно тогда, когда точка максимума критериальной функции лежит вблизи границы Q . В этих случаях промежуточные оценки, вычисляемые с помощью (3.23), могут оказаться вне Q , что приводит к остановке алгоритма.


Продолжение:

2.3 ОБОБЩЕННЫЙ МЕТОД МОМЕНТОВ