– последовательность наблюдаемых
скалярных случайных величин.
- набор предопределенных к моменту t переменных. Функции условных мат. ожидания
и дисперсии
совместно параметризованы
вектором
:
.
– известные функции, которые
далее будем обозначать, опуская аргумент
и используя нижний индекс t. Существует единственный
такой, что
(М.1) ![]()
(М.2)
,
называется вектором истинных
параметров. Определим также функции остатков и стандартизованных остатков
.
Условия (М.1)-(М.2) позволяют вычислить математическое ожидание
и дисперсию
в произвольной
точке параметрического пространства. Например, в точке
(М.3)
(М.4)
.
Процедура, используемая наиболее часто для оценки
,
состоит в максимизации функции правдоподобия, построенной в предположении о
том, что распределение
при
условии
нормально со средним
и дисперсией, определенными (М.1)-(М.2). Гипотеза об условной
нормальности, однако, часто не выдерживает тестирования; в этой связи возникает
проблема выбора метода, устойчивого к различным ее нарушениям.
Обоснован метод квази-максимального правдоподобия, который предполагает максимизацию
нормальной функции правдоподобия при том, что распределение
в действительности не является нормальным. При этом оценки сохраняют свойства
состоятельности и асимптотической нормальности, однако утрачивают свойство асимптотической
эффективности.
В данной работе предпринята попытка оценить модель обобщенным методом моментов. Оказалось возможным построить оптимальные инструменты, приводящие к оценкам, асимптотически более эффективным, чем оценки метода квази-максимального правдоподобия.
Применение метода максимального правдоподобия требует явного задания функции
плотности распределения случайных величин
.
Предположение о нормальном характере распределения
позволяет воспользоваться простой и детально разработанной процедурой оценивания
неизвестных параметров, которая и является предметом рассмотрения настоящего
параграфа. Гипотеза об условной нормальности процесса формально записывается
как
(N)
.
ОПРЕДЕЛЕНИЯ.
Оценки метода максимального правдоподобия (ММП) доставляют максимум критериальной функции, составленной из вкладов отдельных наблюдений:
(3.1)
,
где вклад t-го наблюдения определяется как
(3.2)
.
совпадает с логарифмом
совместной плотности распределения вектора
.
Градиент и гессиан критериальной функции также составлены из вкладов отдельных
наблюдений:
,
вклады наблюдения t записываются как
(3.3) 
(3.4) 

.
Вычислим условные ожидания (3.3) и (3.4) в точке истинных параметров. Значения
функций
и
,
производные этих функций по q
предопределены к моменту t. Выражения, заключенные в квадратные скобки, обращаются
в нуль. Имеем
(3.5) ![]()
(3.6) 
Обозначим
матрицу условной
ковариации вклада t-го наблюдения градиент:
(3.7)
.
Вследствие (3.5) безусловное ожидание градиента критериальной функции равно нулю:
(3.8)
.
Определим информационную матрицу как безусловную ковариацию градиента в точке
:
(3.9)
.
Поскольку последовательность вкладов наблюдений в градиент критериальной функции серийно не коррелирует (равенство (3.5)), информационная матрица может быть также вычислена по формуле
(3.10)
.
Для дальнейшего изложения существенно, что соотношения (3.3)-(3.10) были выведены вне связи с гипотезой (N).
ИНФОРМАЦИОННАЯ МАТРИЦА.
В теории метода максимального правдоподобия известно равенство
(3.11)
,
которое нетрудно установить и в данном случае. Внешнее произведение вклада
t-го наблюдения в градиент
содержит
в степени от первой
до четвертой. Условные мат. ожидание и дисперсия истинных остатков определены
равенствами (М.3)-(М.4), тогда как для вычисления третьего и четвертого
моментов необходимо прибегнуть к дополнительному предположению (N). (3.11)
влечет равенство
(3.12)
,
однако вычислить полные ожидания не представляется возможным.
В некоторых случаях вектор q можно разделить
на компоненты b и g , первая из которых
параметризует условное среднее, вторая – условную дисперсию. Тогда
,
однако даже в этом случае
.
Если, кроме того, распределение
симметрично, выполнены некоторые ограничения на функциональную форму
,
то информационная матрица является блочно-диагональной:
.
Engle (1982) приводит набор достаточных условий и формальное доказательство для ARCH(q)-N модели. Блочная диагональность информационной матрицы между параметрами b и g означает, что оценки параметров среднего состоятельны даже при неверной спецификации функции условной дисперсии. В частности, оценки методом наименьших квадратов являются состоятельными, однако, выигрыш в эффективности от использования ММП по сравнению с МНК может оказаться сколь угодно великим. Более того, оценки g, полученные на основе состоятельных, но не эффективных оценок b (например, на основе МНК), сохраняют свойство асимптотической эффективности.
Не обладают свойством блочной диагональности информационные матрицы ARCH-M
моделей: для них разбиения q = (b, g)
не существует. Иное исключение составляют EGARCH модели и другие, в которых
является асимметричной функцией
остатков. Присутствие ошибок в спецификации функции условной дисперсии приводит
к несостоятельности оценок параметров среднего, и наоборот. Состоятельное оценивание
требует верной спецификации полной модели.
При определенных условиях регулярности оценки максимального правдоподобия состоятельны, асимптотически нормальны и эффективны с асимптотической матрицей ковариации
(3.13)
.
Существуют два базовых способа состоятельно оценить информационную матрицу.
Первый способ основан на связи информационной матрицы и гессиана (равенства
(3.11)-(3.12)). В качестве оценки приемлема матрица
,
где
(3.14)
.
Данная оценка построена как сумма выражений вида
,
причем участвующие в
функции
исчислены в точке
.
Второй способ вытекает из равенства (3.10) для информационной матрицы. Опустив знаки мат. ожиданий и воспользовавшись оценками неизвестных параметров, приходим к
(3.15)
.
Второй способ восходит к статье Berndt, Hall, Hall, and Hausman и потому называется BHHH. Другое название - метод внешнего произведения градиента (outer product of the gradient, OPG).
Как
, так и
состоятельны
для I. Обращенная информационная матрица служит оценкой матрицы ковариации
оценок максимального правдоподобия
.
Возможны, следовательно, два выражения:
(3.16.а) ![]()
(3.16.б)
.
Гипотезу (N) позволяет протестировать верное в нуле свойство независимости
и нормальной распределенности стандартизованных остатков. Как правило, гипотеза
отклоняется из-за того, что оцененные
демонстрируют положительный куртозис. Реже причиной отклонения нулевой гипотезы
становится асимметрия (необходимые ссылки представлены Bollerslev, Chou и Kroner
(1992)).
Рядом авторов реализован ММП в предположении о том, что плотность распределения
принадлежит некоторому параметризованному
семейству ¦(z,u).
Так, Bollerslev (1987), Nelson (1990), Bollerslev, Engle и Nelson (1993) применяют,
соответственно, t-Стьюдента, GED, и обобщенное t-Стьюдента
распределения. Плотности t и GED имеют единственный параметр,
регулирующий величину куртозиса, плотность обобщенного t-распределения
имеет два параметра и включает t и GED как частные случаи (свойства
GED обсуждались в параграфе 2). Параметры u
и q оцениваются одновременно максимизацией логарифмической
функции правдоподобия
.
С точки зрения асимптотической эффективности ММП с корректно определенной функцией плотности ¦ (× ,× ) является наилучшим решением. Реализация его, однако, технически крайне трудна: поскольку производные соответствующих функций правдоподобия не могут быть представлены аналитически, для максимизации их прибегают к методам численного дифференцирования.
Качество подбора функции плотности ¦
(× ,×
) можно установить, сравнивая фактическое и ожидаемое
количества таких значений
,
которые превосходят некоторое заданное Z. В
этом смысле GED не вполне адекватно
отражает частоту “хвостовых событий”: фактическое число выбросов гораздо больше,
чем если бы
были реализациями GED-распределенной
случайной величины со значением параметра u
, равным оцененному. Кроме того, t и
GED симметричны, тогда как асимметрия
– одна из важных особенностей изучаемых в данной работе российских финансовых
активов. По этим причинам ММП был предпочтен методам квази-максимального правдоподобия
и моментов. Среди других распределений, примененных при оценивании ARCH
модели, – смесь нормального и логнормального,
нормального и Пуассона распределений.
Установлено, что максимизация критериальной функции
(3.1)-(3.2) приводит к состоятельным и асимптотически
нормальным оценкам независимо от того, как именно распределены случайные величины
.
В тех случаях, когда истинное распределение
неизвестно, эту процедуру принято называть методом квази- (псевдо-) максимального
правдоподобия (МКМП). Отличие ее от традиционного ММПсостоит в матрице ковариации
оценок:
(3.17) ![]()
.
Равенство
неверно в общем случае без предположения об условной нормальности, поэтому (3.17)
не эквивалентно (3.13). МКМПнеизбежно
приводит к потере асимптотической эффективности. Потери эффективности, возникающие,
в частности, при t-распределенных
ошибках невелики, однако могут быть весьма существенными, если распределение
ошибок асимметрично.
Для вывода равенств (3.5), (3.6), (3.8),
и (3.10) предположение (N)
не привлекалось, все они являются следствием верной спецификации функций условного
среднего и дисперсии, т.е. (M.1)-(M.2).
Поэтому матрица
остается состоятельной для гессиана,
– состоятельной для информационной матрицы. Однако
и
не являются асимптотически эквивалентными, как не являются асимптотически эквивалентными
минус гессиан и информационная матрица. Оценкой ковариацонной матрицы КМП-оценок
служит
(3.18)
.
Оценка (3.18) устойчива
к нарушению гипотезы об условной нормальности в том смысле, что остается состоятельной
для ковариации оценок, полученных максимизацией (3.1)-(3.2).
Оценки
и
при указанном нарушении свойства состоятельности не сохраняют.
ТЕСТИРОВАНИЕ
Асимптотическая нормальность оценок КМП позволяет воспользоваться стандартными процедурами. Пусть нулевая гипотеза формулируется как
(3.19)
,
где
дифференцируема на
и
l<m. Если
и
матрица
имеет ранг l, то применима статистика
Вальда
(3.20)
,
где
-
оценки параметров при альтернативной гипотезе (оценки полной модели, без ограничений
(3.19)),
-
состоятельная оценка ковариации
.
При верной гипотезе (N) следует использовать
,
в противном случае -
.
Верно предположение (N) или нет,
в нуле статистика Вальда имеет асимптотическое хи-квадрат распределение с m-l
степенями свободы. Тест Вальда
(3.21) 
где
- 5%-й квантиль
распределения, характеризуется асимптотической ошибкой первого рода 5%: вероятность
отвергнуть
тогда как она верна
при увеличении числа наблюдений сходится к
.
Асимптотические результаты могут оказаться неприемлемыми
для малых выборок и при некорректном выборе матрицы
.
Bollerslev и Wooldridge
(1992) сообщают результаты имитационных экспериментов, проливающих свет на характер
искажений, связанных с использованием в тестировании несостоятельных оценок
при нарушении гипотезы (N). Общий
вывод исследования состоит в следующем: ковариационные матрицы
систематически недооценивают истинные размеры стандартных ошибок.
Схема исследования такова. Построены 1000 реализаций
AR(1)-GARCH(1,1) процесса,
имеющего условное
распределение. Для каждой реализации вычислены
Имитационные эксперименты позволяют построить
эмпирические распределения трех вариантов статистики Вальда при верной нулевой
гипотезе, которые затем сопоставляются с хи-квадрат распределением. Полученные
распределения имеют более толстые хвосты, чем
.
Так, например, доля реализаций статистики Вальда типов HE и
OPG, лежащих правее 5%-го квантиля
,
больше 0.05, скажем, 0.1. Это означает, что тест (3.18)
имеет ошибку первого рода 10%, а не 5%. Иными словами, вероятность отвергнуть
нулевую гипотезу
в то время как она верна составляет 0.1:
.
Распределение RB-статистики
близко к
.
Использование устойчивой формы статистики Вальда, как и следовало ожидать, предпочтительнее
двух других, причем OPG-статистика
наименее точна. Таким образом, как
,
так и
систематически преуменьшают вариацию оценок и вводят в заблуждение относительно
того уровня значимости, с которым нуль может быть отвергнут.
Точность всех форм статистик снижается при переходе
к несимметричному
распределению
.
Аналогичные результаты были получены и для LM
статистики.
ЧИСЛЕННЫЕ МЕТОДЫ НАХОЖДЕНИЯ ОЦЕНОК
Значения, доставляющие максимум критериальной функции (с соответствующими оговорками), удовлетворяют условиям первого порядка
(3.22)
.
Нахождение численного решения системы (3.22) предполагает реализацию алгоритма, i-й шаг которого задается формулой
(3.23)
.
-
некоторая симметричная, положительно определенная матрица размерности m´
m. В качестве
могут быть использованы гессиан или оценка информационной матрицы, вычисленные
на i-м шаге с использованием
.
Стационарная точка последовательности
удовлетворяет (3.22).
Для упрощения вычислений разработан прием, называемый
искусственной регрессией (auxiliary regression):
вектор приращений параметров
приводится к характерному виду
при помощи некоторых искусственных переменных A и
C.
Запишем в форме искусственной регрессии шаг алгоритма,
использующего в качестве взвешивающей матрицы минус условный гессиан
.
Воспользуемся матрицей регрессоров размерности 2n´
m и 2n-компонентным
вектором зависимой переменной
,
.
Градиент и минус гессиан записываются через переменные A и C как

Шаг алгоритма приобретает вид
.
Запишем искусственную регрессию для алгоритма
со взвешивающей матрицей вида
.
Независимые переменные данной регрессии формируют n´
m матрицу вкладов в градиент
со строками
.
В качестве независимой переменной выступает n´
1 вектор i
, все компоненты которого равны единице. Тогда

Шаг алгоритма приобретает вид
.
Выбор матрицы F в (3.22) влияет на скорость сходимости алгоритма. С этой точки зрения рассмотренная выше форма HE взвешивающей матрицы предпочтительнее OPG. Для оптимизации скорости сходимости алгоритма можно корректировать длину вектора изменения параметров в заданном направлении с помощью дополнительного параметра l :
.
Целесообразно выбирать l , максимизируя по нему критериальную функцию:
.
Использование l особенно полезно тогда, когда точка максимума критериальной функции лежит вблизи границы Q . В этих случаях промежуточные оценки, вычисляемые с помощью (3.23), могут оказаться вне Q , что приводит к остановке алгоритма.
Продолжение: