Критерий Колмогорова



Критерий Колмогорова применяется в случае, когда ф.р.  F(t)  непрерывна, то есть для статистической модели  X1 ~ FF О FC,  где  FC  - множество всех непрерывных функций распределения. Рассмотрим следующее расстояние между эмпирической и теоретической ф.р., называемое расстоянием Колмогорова:
Dn=D(Fn*,F)=
sup
-Ґ < t < Ґ 
|Fn*(t)-F(t)| =
max
-Ґ < t < Ґ 
|Fn*(t)-F(t)|.
Распределение статистики  Dn=Dn(X1,X2,...,Xn обладает тем замечательным свойством, что при выполнении гипотезы  H0 : F=F0 это распределение не зависит от конкретного вида  F0 и совпадает с распределением, соответствующим, например, модели X1 ~ U(0, 1). Указанное свойство называется непараметричностью критерия. Обозначим через Fn(t) функцию распределения статистики Dn при выполнении гипотезы H0: F=F0. В качестве статистики критерия Колмогорова выбирается расстояние Колмогорова умноженное на n1/2, где n - объем выборки:
Tn=n1/2
sup
-Ґ < t < Ґ 
|Fn*(t)-F(t)|.

А. Н. Колмогоров доказал следующие два свойства статистики Tn:
1) Если гипотеза H0 верна, то Tn с ростом n сходится к случайной величине J с функцией распределения, называемой функцией распределения Колмогорова:
FJ(t)=1-2 Ґ
е
k=1 
(-1)k+1exp(-2k2 t2);
2) Если гипотеза H0 неверна, то Tn сходится почти наверное к Ґ при n®Ґ.
Таким образом, "асимптотический" достигаемый уровень значимости критерия Колмогорова равен:
a*=1-FJ(Tn)=2 Ґ
е
k=1 
(-1)k+1exp(-2k2 Tn2).
В то время как "истинный" достигаемый уровень значимости равен: a**=1-Fn(Dn).





Электронные таблицы

Правила пользования таблицами.

U[a,b] N(a,s) E(a)
a b a s a



Результаты вычислений
Объем выборки Значение Dn на выборке Значение Tn на выборке Асимптотический
достигаемый уровень значимости
Истинный
достигаемый уровень значимости



Реализация исследуемой выборки








Правила пользования таблицами

С помощью радиокнопки выделяется, какую основную гипотезу следует проверять. Предлагается проверка гипотезы о том, что выборка имеет равномерное (U[a,b]), нормальное (N(a,s)) либо экспоненциальное распределение (E(a)). Далее следует задать параметры распределения и в текстовое поле поместить изучаемую выборку (это можно сделать, набрав соответствующие значения вручную либо скопировав, скажем из Excel), затем нажать кнопку "Вычислить", после чего в таблице "Результаты вычислений" появятся соответствующие значения.
Отметим, что в качестве десятичного разделителя в числах можно использовать и точку, и запятую. Удалять значения из первой таблицы можно двойным щелчком мыши. Особо обратим внимание! В качестве разделителя между отдельными числами ни в коем случае не следует использовать точку и запятую, так как эти знаки используются в качестве десятичного разделителя. Отделить одно число от другого можно используя "пробел" или "ввод". Скажем, такой ввод в текстовое поле верен:

0,23 0,56 0.98
0,98 1,56 9,9 7.908

Соответственно будут обрабатываться семь значений: 0.23 0.56 0.98 1.56 9.9 7.908.