А.Д. Манита. ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 6.6 Методы построения оценок Подпункты этого параграфа

А.Д. Манита ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
6.6 Методы построения оценок
Подпункты этого параграфа:
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]

Метод моментов
Идея этого метода заключается в приравнивании теоретических и эмпирических моментов. Поэтому мы начнем с обсуждения этих понятий.
Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- независимая выборка из распределения [ Cкачайте файл, чтобы посмотреть картинку ], зависящего от неизвестного параметра [ Cкачайте файл, чтобы посмотреть картинку ]Теоретическим моментом [ Cкачайте файл, чтобы посмотреть картинку ]-го порядка называется функция
[ Cкачайте файл, чтобы посмотреть картинку ]
где [ Cкачайте файл, чтобы посмотреть картинку ]-- случайная величина с функцией распределения [ Cкачайте файл, чтобы посмотреть картинку ]. Особо отметим, что теоретический момент есть функция от неизвестных параметров, коль скоро распределение [ Cкачайте файл, чтобы посмотреть картинку ]зависит от этих параметров. Будем считать, что математические ожидания [ Cкачайте файл, чтобы посмотреть картинку ]существуют, по крайней мере, для [ Cкачайте файл, чтобы посмотреть картинку ].
Эмпирическим моментом [ Cкачайте файл, чтобы посмотреть картинку ]-го порядка называется
[ Cкачайте файл, чтобы посмотреть картинку ]
Отметим, что по своему определению эмпирические моменты являются функциями от выборки. Заметим, что [ Cкачайте файл, чтобы посмотреть картинку ]-- это хорошо нам известное выборочное среднее.
Для того, чтобы найти оценки неизвестных параметров по методу моментов следует:
явно вычислить теоретические моменты [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ], и составить следующую систему уравнений для неизвестных переменных [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
(35)


В этой системе [ Cкачайте файл, чтобы посмотреть картинку ]рассматриваются как фиксированные параметры.
решить систему ([ Cкачайте файл, чтобы посмотреть ссылку ]) относительно переменных [ Cкачайте файл, чтобы посмотреть картинку ]. Так как правая часть системы зависит от выборки, то в результате [ Cкачайте файл, чтобы посмотреть картинку ]окажутся функциями от [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
Это и есть искомые оценки параметров по методу моментов.
Замечание 6.7  
В общей ситуации вопрос о разрешимости (вообще говоря, нелинейной) системы ([ Cкачайте файл, чтобы посмотреть ссылку ]) не является простым. Он близок хорошо известной в анализе задаче о неявной функции. Мы не приводим здесь никаких теорем, гарантирующих существование решения и его единственность, так как в этом нет большого практического смысла для статистических приложений. Дело в том, что в большом числе важных статистических моделей, соответствующих основным вероятностным распределениям, эта система без труда решается в каждом конкретном случае. При этом оказывается, что оценки, получаемые по методу моментов, оказываются состоятельными (см. Определение [ Cкачайте файл, чтобы посмотреть ссылку ]).
Метод наибольшего правдоподобия
Пусть, как и прежде, [ Cкачайте файл, чтобы посмотреть картинку ]-- независимая выборка из распределения с функцией распределения [ Cкачайте файл, чтобы посмотреть картинку ], зависящей от неизвестного параметра [ Cкачайте файл, чтобы посмотреть картинку ]Определим функцию правдоподобия, полагая
[ Cкачайте файл, чтобы посмотреть картинку ]
если [ Cкачайте файл, чтобы посмотреть картинку ]-- абсолютно непрерывна и имеет плотность [ Cкачайте файл, чтобы посмотреть картинку ], либо
[ Cкачайте файл, чтобы посмотреть картинку ]
если [ Cкачайте файл, чтобы посмотреть картинку ]есть функция распределения некоторой дискретной случайной величины [ Cкачайте файл, чтобы посмотреть картинку ], причем [ Cкачайте файл, чтобы посмотреть картинку ].
Переменные [ Cкачайте файл, чтобы посмотреть картинку ]следует считать основными для функции [ Cкачайте файл, чтобы посмотреть картинку ], а [ Cкачайте файл, чтобы посмотреть картинку ]-- дополнительными параметрами. Считая [ Cкачайте файл, чтобы посмотреть картинку ]фиксированными, найдем точку [ Cкачайте файл, чтобы посмотреть картинку ], в которой функция правдоподобия [ Cкачайте файл, чтобы посмотреть картинку ]принимает наибольшее значение. Понятно, что эта точка будет зависеть от заранее фиксированной выборки [ Cкачайте файл, чтобы посмотреть картинку ], следовательно, мы получим набор функций от выборки:
[ Cкачайте файл, чтобы посмотреть картинку ]
(36)


что и будет искомой оценкой по методу наибольшего правдоподобия.
Сформулируем вышесказанное в виде формального определения.
Определение 6.6  
Функция от выборки ([ Cкачайте файл, чтобы посмотреть ссылку ]) называется оценкой наибольшего правдоподобия (о.н.п.), если
[ Cкачайте файл, чтобы посмотреть картинку ]
Замечание 6.8  
Если функция правдоподобия [ Cкачайте файл, чтобы посмотреть картинку ]является дифференцируемой по переменным [ Cкачайте файл, чтобы посмотреть картинку ], то о.н.п.  удовлетворяет следующей системе уравнений:
[ Cкачайте файл, чтобы посмотреть картинку ]
Это хорошо известные из курса математического анализа необходимые условия экстремума функции нескольких переменных.
Пример 6.10  
Рассмотрим статистическую модель нормальной выборки из Примера [ Cкачайте файл, чтобы посмотреть ссылку ]. Обозначим [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ]. Будем искать точку, в которой достигается максимум функции правдоподобия:
[ Cкачайте файл, чтобы посмотреть картинку ]
Очевидно, что максимум достигается в той же точке, что и у функции [ Cкачайте файл, чтобы посмотреть картинку ]. Чтобы найти ее точки экстремума, приравняем к нулю частные производные:
[ Cкачайте файл, чтобы посмотреть картинку ]Теперь следует обосновать, что это действительно точка глобального максимума. Это упражнение оставляется читателю для самостоятельного решения.
Оценки максимального правдоподобия широко применяются. Во многих регулярных (т.е., хороших) ситуациях они оказываются состоятельными и асимптотически нормальными.
Отметим, что далеко не всегда функцию правдоподобия можно считать гладкой. В этом случае, изложенная выше схема бесполезна, но, тем не менее, задача не является безнадежной. Проиллюстрируем это примером.
Пример 6.11  
Рассмотрим независимую выборку [ Cкачайте файл, чтобы посмотреть картинку ]из равномерного распределения в отрезке [ Cкачайте файл, чтобы посмотреть картинку ], где [ Cкачайте файл, чтобы посмотреть картинку ]-- неизвестный параметр. Выпишем функцию правдоподобия
[ Cкачайте файл, чтобы посмотреть картинку ]
и перепишем ее в более удобном виде:
[ Cкачайте файл, чтобы посмотреть картинку ]
Легко видеть, что максимальное значение эта функция принимает в точке [ Cкачайте файл, чтобы посмотреть картинку ]. Это и есть искомая оценка наибольшего правдоподобия для параметра [ Cкачайте файл, чтобы посмотреть картинку ].
8.1 Понятие доверительного интервала
Будем считать, что независимая выборка [ Cкачайте файл, чтобы посмотреть картинку ]взята из распределения, зависящего от скалярного параметра [ Cкачайте файл, чтобы посмотреть картинку ]. Будем обозначать через [ Cкачайте файл, чтобы посмотреть картинку ]распределение вероятностей, соответствующее значению [ Cкачайте файл, чтобы посмотреть картинку ]неизвестного параметра.
Определение 8.1  
[ Cкачайте файл, чтобы посмотреть картинку ]-доверительным интервалом называется интервал вида [ Cкачайте файл, чтобы посмотреть картинку ]    где [ Cкачайте файл, чтобы посмотреть картинку ]такой, что
[ Cкачайте файл, чтобы посмотреть картинку ]
Число [ Cкачайте файл, чтобы посмотреть картинку ]называют доверительной вероятностью.
Другими словами, доверительный интервал обладает тем свойством, что, во-первых, его границы вычисляются исключительно по выборке (и, следовательно, не зависят от неизвестного параметра), и, во-вторых, он накрывает неизвестный параметр с вероятностью [ Cкачайте файл, чтобы посмотреть картинку ].
Значение доверительной вероятности [ Cкачайте файл, чтобы посмотреть картинку ]выбирается заранее, этот выбор определяется конкретными практическими приложениями. Смысл величины [ Cкачайте файл, чтобы посмотреть картинку ]-- вероятность допустимой ошибки. Часто берут значения [ Cкачайте файл, чтобы посмотреть картинку ]и т.п.
Ниже мы приводим один из методов построения доверительных интервалов. Он состоит из трех этапов.
Выбираем функцию [ Cкачайте файл, чтобы посмотреть картинку ], зависящую от выборки и от неизвестного параметра, такую, что ее функция распределения
[ Cкачайте файл, чтобы посмотреть картинку ]
не зависит от неизвестного параметра [ Cкачайте файл, чтобы посмотреть картинку ].
Выбираем два числа [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]таким образом, чтобы [ Cкачайте файл, чтобы посмотреть картинку ]. Подбираем [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ], удовлетворяющие условиям
[ Cкачайте файл, чтобы посмотреть картинку ]
(41)


Таким образом,
[ Cкачайте файл, чтобы посмотреть картинку ]
(42)


причем [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]не зависят от [ Cкачайте файл, чтобы посмотреть картинку ].
Решим двойное неравенство [ Cкачайте файл, чтобы посмотреть картинку ]относительно [ Cкачайте файл, чтобы посмотреть картинку ]. В том случае, когда его решением является интервал, обозначим его левый и правый концы через [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]соответственно. Естественно, они зависят от выборки: [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ]. В силу ([ Cкачайте файл, чтобы посмотреть ссылку ])
[ Cкачайте файл, чтобы посмотреть картинку ]
Следовательно, [ Cкачайте файл, чтобы посмотреть картинку ]-- искомый [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал.
Замечание 8.1  
Описанная процедура, разумеется, не является универсальной. Во-первых, вопрос о выборе функции [ Cкачайте файл, чтобы посмотреть картинку ] решается в каждом конкретном случае и по этому поводу нет общих рекомендаций. Во-вторых, совершенно не гарантировано, что решением неравенства в п. 3 будет интервал конечной длины. Вместе с тем, во многих важных случаях изложенный выше метод приводит к хорошим доверительным интервалам. Например, оправдано применение такого метода в случае, когда при каждой фиксированной выборке [ Cкачайте файл, чтобы посмотреть картинку ]функция [ Cкачайте файл, чтобы посмотреть картинку ]является строго монотонной и непрерывной по переменной [ Cкачайте файл, чтобы посмотреть картинку ].
Замечание 8.2  
В силу неоднозначности выбора функции [ Cкачайте файл, чтобы посмотреть картинку ]и чисел  [ Cкачайте файл, чтобы посмотреть картинку ]и  [ Cкачайте файл, чтобы посмотреть картинку ], можно заключить, что [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал неединственен.
Пример 8.1  
Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- независимая выборка из равномерного распределения в отрезке [ Cкачайте файл, чтобы посмотреть картинку ]с неизвестным параметром [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
Пусть задана доверительная вероятность [ Cкачайте файл, чтобы посмотреть картинку ]. Построим доверительный интервал для [ Cкачайте файл, чтобы посмотреть картинку ].
Рассмотрим функцию [ Cкачайте файл, чтобы посмотреть картинку ]. Вычислим ее функцию распределения:
[ Cкачайте файл, чтобы посмотреть картинку ]
13 INCLUDEPICTURE
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·–
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·–
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·–
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·gif" \* MERGEFORMATINET 1415
 


Таким образом,
[ Cкачайте файл, чтобы посмотреть картинку ]
и, следовательно, не зависит от [ Cкачайте файл, чтобы посмотреть картинку ].
Зафиксируем [ Cкачайте файл, чтобы посмотреть картинку ]так, чтобы [ Cкачайте файл, чтобы посмотреть картинку ]. Тогда [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]удовлетворяют ([ Cкачайте файл, чтобы посмотреть ссылку ]).
Решая неравенство [ Cкачайте файл, чтобы посмотреть картинку ], получаем [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал для [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
(43)


Очевидно, что следует отдавать предпочтение тем [ Cкачайте файл, чтобы посмотреть картинку ]-доверительным интервалам, у которых длина короче.
Упражнение 8.1  
Показать, что при [ Cкачайте файл, чтобы посмотреть картинку ]математическое ожидание длины доверительного интервала ([ Cкачайте файл, чтобы посмотреть ссылку ]) стремится к нулю.
8.2 Вероятностные распределения, связанные с нормальным
Подпункты этого параграфа:
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]

Здесь мы кратко обсудим распределение хи-квадрат и распределение Стьюдента, играющие исключительную роль в статистике. Наше изложение близко содержанию [ Cкачайте файл, чтобы посмотреть картинку ] 2.6 книги [[ Cкачайте файл, чтобы посмотреть ссылку ]].
Хи-квадрат распределение
Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- независимые стандартные нормальные случайные величины ([ Cкачайте файл, чтобы посмотреть картинку ]). [ Cкачайте файл, чтобы посмотреть картинку ]-распределением с [ Cкачайте файл, чтобы посмотреть картинку ]степенями свободы называется распределение следующей случайной величины:
[ Cкачайте файл, чтобы посмотреть картинку ]
(44)


Это распределение сосредоточенно на положительной полуоси и имеет плотность
[ Cкачайте файл, чтобы посмотреть картинку ]
где [ Cкачайте файл, чтобы посмотреть картинку ]-- гамма-функция.
Упражнение 8.2  
Начертить графики плотности [ Cкачайте файл, чтобы посмотреть картинку ]при [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ].
Упражнение 8.3  
Найти [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ].
Квантили распределения [ Cкачайте файл, чтобы посмотреть картинку ]будем обозначать [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ]. По определению они являются решениями уравнения
[ Cкачайте файл, чтобы посмотреть картинку ]
(45)


где [ Cкачайте файл, чтобы посмотреть картинку ]-- функция хи-квадрат распределения с [ Cкачайте файл, чтобы посмотреть картинку ]степенями свободы. На этом чертеже изображены плотность [ Cкачайте файл, чтобы посмотреть картинку ]и ее квантиль.
[ Cкачайте файл, чтобы посмотреть картинку ]
Для значений функции распределения [ Cкачайте файл, чтобы посмотреть картинку ]имеются таблицы, из которых находят квантили. Кроме этого, хи-квадрат распределение интегрировано в большое число прикладных компьютерных программ [[ Cкачайте файл, чтобы посмотреть ссылку ]]. На странице [ Cкачайте файл, чтобы посмотреть ссылку ] настоящей брошюры также приведена небольшая таблица квантилей хи-квадрат распределения.
Распределение Стьюдента
Это распределение получило свое название от псевдонима Student, которым английский ученый Госсет подписывал свои работы по статистике.
Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- независимые стандартные нормальные случайные величины. Распределением Стьюдента с [ Cкачайте файл, чтобы посмотреть картинку ]степенями свободы называется распределение следующей случайной величины:
[ Cкачайте файл, чтобы посмотреть картинку ]
(46)


Если вспомнить введенную формулой ([ Cкачайте файл, чтобы посмотреть ссылку ]) случайную величину  [ Cкачайте файл, чтобы посмотреть картинку ], то можно сказать, что отношение [ Cкачайте файл, чтобы посмотреть картинку ]имеет распределение Стьюдента. Плотность этого распределения представляет собой симметричную функцию, задаваемую формулой
[ Cкачайте файл, чтобы посмотреть картинку ]
По форме график функции [ Cкачайте файл, чтобы посмотреть картинку ]напоминает график плотности стандартного нормального закона, но с более медленным убыванием ``хвостов''. При [ Cкачайте файл, чтобы посмотреть картинку ]последовательность функций [ Cкачайте файл, чтобы посмотреть картинку ]сходится к функции [ Cкачайте файл, чтобы посмотреть картинку ], которая есть плотность распределения  [ Cкачайте файл, чтобы посмотреть картинку ]. Чтобы понять, почему этот факт имеет место, следует обратить внимание на то, что по закону больших чисел знаменатель выражения ([ Cкачайте файл, чтобы посмотреть ссылку ]) при [ Cкачайте файл, чтобы посмотреть картинку ]стремится к  [ Cкачайте файл, чтобы посмотреть картинку ].
[ Cкачайте файл, чтобы посмотреть картинку ]
На чертеже представлены плотность распределения Стьюдента [ Cкачайте файл, чтобы посмотреть картинку ] и плотность стандартного нормального закона.
В дальнейшем нам понадобятся квантили распределения [ Cкачайте файл, чтобы посмотреть картинку ], которые мы будем обозначать  [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ],
[ Cкачайте файл, чтобы посмотреть картинку ]
Небольшую таблицу квантилей распределения Стьюдента можно найти на странице [ Cкачайте файл, чтобы посмотреть ссылку ].
8.3 Теорема Фишера для нормальных выборок
В этом параграфе мы приводим теорему, впервые доказанную Р.А. Фишером в 1925 г. Она существенно облегчает статистический анализ независимых выборок из нормального распределения.
Теорема Фишера. Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- независимая выборка из распределения  [ Cкачайте файл, чтобы посмотреть картинку ]. Тогда
выборочное среднее [ Cкачайте файл, чтобы посмотреть картинку ]и выборочная дисперсия [ Cкачайте файл, чтобы посмотреть картинку ] независимы;
[ Cкачайте файл, чтобы посмотреть картинку ]имеет [ Cкачайте файл, чтобы посмотреть картинку ]-распределение с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы.
С доказательством этой теоремы можно познакомиться, обратившись к книгам [[ Cкачайте файл, чтобы посмотреть ссылку ],[ Cкачайте файл, чтобы посмотреть ссылку ]].
8.4 Доверительное оценивание параметров нормальных выборок
Подпункты этого параграфа:
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]

Всюду в этом параграфе мы рассматриваем независимые выборки [ Cкачайте файл, чтобы посмотреть картинку ]из нормального распределения [ Cкачайте файл, чтобы посмотреть картинку ]. Мы построим доверительные интервалы для параметров распределения при различных предположениях относительно статистической модели.
Доверительный интервал для среднего при известной дисперсии
Предположим, что параметр [ Cкачайте файл, чтобы посмотреть картинку ]неизвестен, а дисперсия [ Cкачайте файл, чтобы посмотреть картинку ]-- известное фиксированное число. Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- доверительная вероятность. Применим метод, изложенный в [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ]. Выберем функцию
[ Cкачайте файл, чтобы посмотреть картинку ]
Из Упражнения [ Cкачайте файл, чтобы посмотреть ссылку ] вытекает, что [ Cкачайте файл, чтобы посмотреть картинку ]имеет нормальное распределение. Нетрудно видеть, что это стандартное нормальное распределение [ Cкачайте файл, чтобы посмотреть картинку ]. Следовательно, [ Cкачайте файл, чтобы посмотреть картинку ]. Выбирая [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ], заключаем, что неравенство
[ Cкачайте файл, чтобы посмотреть картинку ]
выполнено с вероятностью [ Cкачайте файл, чтобы посмотреть картинку ]. Решая его, находим доверительный интервал:
[ Cкачайте файл, чтобы посмотреть картинку ]
Если теперь заметить, что [ Cкачайте файл, чтобы посмотреть картинку ], то [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал можно записать еще проще:
[ Cкачайте файл, чтобы посмотреть картинку ]
Замечательно то, что выборочное среднее является серединой этого интервала, а его длина стремится к нулю с увеличением объема выборки.
Доверительный интервал для дисперсии при известном среднем
Здесь среднее [ Cкачайте файл, чтобы посмотреть картинку ]считается известным фиксированным числом, а дисперсия [ Cкачайте файл, чтобы посмотреть картинку ]выступает в роли неизвестного параметра. Положим
[ Cкачайте файл, чтобы посмотреть картинку ]
Так как [ Cкачайте файл, чтобы посмотреть картинку ]-- [ Cкачайте файл, чтобы посмотреть картинку ], то [ Cкачайте файл, чтобы посмотреть картинку ]имеет стандартное нормальное распределение. Тем самым, функция [ Cкачайте файл, чтобы посмотреть картинку ]имеет [ Cкачайте файл, чтобы посмотреть картинку ]-распределение с [ Cкачайте файл, чтобы посмотреть картинку ]степенями свободы, никаким образом не зависящее от неизвестного параметра  [ Cкачайте файл, чтобы посмотреть картинку ]. Обозначая через [ Cкачайте файл, чтобы посмотреть картинку ]квантили этого распределения и фиксируя некоторые [ Cкачайте файл, чтобы посмотреть картинку ], такие, что [ Cкачайте файл, чтобы посмотреть картинку ], приходим к неравенству
[ Cкачайте файл, чтобы посмотреть картинку ]
(47)


которое выполнено с вероятностью [ Cкачайте файл, чтобы посмотреть картинку ]. Откуда получаем [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал для  [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
Доверительный интервал для дисперсии при неизвестном среднем
Теперь оба параметра [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]будем считать неизвестными. Нас интересует доверительный интервал для [ Cкачайте файл, чтобы посмотреть картинку ]. В этом смысле параметр [ Cкачайте файл, чтобы посмотреть картинку ]является мешающим. Выберем
[ Cкачайте файл, чтобы посмотреть картинку ]
Заметим, что функция [ Cкачайте файл, чтобы посмотреть картинку ]определена таким образом, что при заданной выборке ее значения зависят лишь от параметра  [ Cкачайте файл, чтобы посмотреть картинку ]. Что касается распределения случайной величины [ Cкачайте файл, чтобы посмотреть картинку ], то по теореме Фишера (см.  [ Cкачайте файл, чтобы посмотреть картинку ][ Cкачайте файл, чтобы посмотреть ссылку ]) оно является [ Cкачайте файл, чтобы посмотреть картинку ]-распределением с [ Cкачайте файл, чтобы посмотреть картинку ]степенями свободы и, следовательно, не зависит от неизвестных параметров. Фиксируя [ Cкачайте файл, чтобы посмотреть картинку ], такие, что [ Cкачайте файл, чтобы посмотреть картинку ], и рассуждая как в ([ Cкачайте файл, чтобы посмотреть ссылку ]), приходим к следующему [ Cкачайте файл, чтобы посмотреть картинку ]-доверительному интервалу для  [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
который, используя обозначение ([ Cкачайте файл, чтобы посмотреть ссылку ]), можно переписать так
[ Cкачайте файл, чтобы посмотреть картинку ]
Доверительный интервал для среднего при неизвестной дисперсии
Как и в предыдущем пункте, оба параметра [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]считаются неизвестными, при этом [ Cкачайте файл, чтобы посмотреть картинку ]является мешающим параметром. По теореме Фишера
[ Cкачайте файл, чтобы посмотреть картинку ]    и [ Cкачайте файл, чтобы посмотреть картинку ]
независимы и имеют распределения [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]-распределение с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы соответственно. Следовательно, отношение
[ Cкачайте файл, чтобы посмотреть картинку ]
(48)


имеет распределение Стьюдента с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы. Выберем функцию [ Cкачайте файл, чтобы посмотреть картинку ]равной правой части ([ Cкачайте файл, чтобы посмотреть ссылку ]):
[ Cкачайте файл, чтобы посмотреть картинку ]
где [ Cкачайте файл, чтобы посмотреть картинку ]-- выборочная дисперсия, определенная формулой ([ Cкачайте файл, чтобы посмотреть ссылку ]). Функция [ Cкачайте файл, чтобы посмотреть картинку ]не зависит явно от мешающего параметра [ Cкачайте файл, чтобы посмотреть картинку ]. Обозначая через [ Cкачайте файл, чтобы посмотреть картинку ]квантиль распределения Стьюдента с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы, получим, что неравенство
[ Cкачайте файл, чтобы посмотреть картинку ]
выполнено с вероятностью [ Cкачайте файл, чтобы посмотреть картинку ]. Отсюда получаем [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал для [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
Так как распределение Стьюдента симметрично, то по Предложению [ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть картинку ]
Поэтому доверительный интервал можно записать в виде
[ Cкачайте файл, чтобы посмотреть картинку ]
(49)


Таким образом, выборочное среднее [ Cкачайте файл, чтобы посмотреть картинку ]является серединой этого интервала.
Пример 8.2  
Обратимся к Примеру [ Cкачайте файл, чтобы посмотреть ссылку ]. Предположим, что каждая из выборок [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]взята из нормального распределения с неизвестными параметрами -- [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ]соответственно. (О том, на основании чего можно сделать такое допущение, мы поговорим позже в  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ].)
Наша цель -- найти доверительные интервалы для [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ], теоретических значений содержания углерода и прочности на разрыв стали GS50. Напомним, что объем каждой из выборок [ Cкачайте файл, чтобы посмотреть картинку ]. Зафиксируем доверительную вероятность, близкую к единице, скажем [ Cкачайте файл, чтобы посмотреть картинку ]. По таблице распределения Стьюдента на стр. [ Cкачайте файл, чтобы посмотреть ссылку ] определим приближенно, что [ Cкачайте файл, чтобы посмотреть картинку ]. Вспоминая значения [ Cкачайте файл, чтобы посмотреть картинку ] и [ Cкачайте файл, чтобы посмотреть картинку ], найденные в Примере [ Cкачайте файл, чтобы посмотреть ссылку ] на стр. [ Cкачайте файл, чтобы посмотреть ссылку ], вычисляем
[ Cкачайте файл, чтобы посмотреть картинку ]
[ Cкачайте файл, чтобы посмотреть картинку ]), получаем [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал для процентного содержания углерода
[ Cкачайте файл, чтобы посмотреть картинку ]
и [ Cкачайте файл, чтобы посмотреть картинку ]-доверительный интервал для значения прочности на разрыв
[ Cкачайте файл, чтобы посмотреть картинку ]

[ Cкачайте файл, чтобы посмотреть ссылку ]

[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]


[ Cкачайте файл, чтобы посмотреть картинку ]
 


 
Зеркала сайта:   [ Cкачайте файл, чтобы посмотреть ссылку ]   [ Cкачайте файл, чтобы посмотреть ссылку ]   [ Cкачайте файл, чтобы посмотреть ссылку ]  
 


[ Cкачайте файл, чтобы посмотреть картинку ]


[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ] [ Cкачайте файл, чтобы посмотреть ссылку ]

Глава 9
Статистические гипотезы
Как отмечалось выше, в математической статистике считается, что данные, получаемые в результате наблюдений, подчинены некоторому неизвестному вероятностному распределению, и задача состоит в том, чтобы извлечь из данных правдоподобную информацию об этом неизвестном распределении. В настоящей главе мы обсудим еще один подход к этой общей задаче, состоящий в проверке гипотез. Статистической гипотезой называют предположение о распределении вероятностей, которое необходимо проверить по имеющимся данным.
Параграфы этой главы:
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]
[ Cкачайте файл, чтобы посмотреть ссылку ]


9.1 Простые и сложные гипотезы и их проверка
Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- независимая выборка, соответствующая неизвестной функции распределения [ Cкачайте файл, чтобы посмотреть картинку ]. Простой гипотезой называют предположение, состоящее в том, что неизвестная функция [ Cкачайте файл, чтобы посмотреть картинку ] отвечает некоторому совершенно конкретному вероятностному распределению. Пример простой гипотезы:
            [ Cкачайте файл, чтобы посмотреть картинку ]: данные являются выборкой из равномерного распределения                     в отрезке [ Cкачайте файл, чтобы посмотреть картинку ].
Сложной гипотезой называют предположение о том, что неизвестная функция [ Cкачайте файл, чтобы посмотреть картинку ] принадлежит некоторому множеству распределений, состоящему из более чем одного элемента. В качестве иллюстрации можно привести Пример [ Cкачайте файл, чтобы посмотреть ссылку ].
Проверить статистическую гипотезу [ Cкачайте файл, чтобы посмотреть картинку ] -- это значит на основе имеющихся данных [ Cкачайте файл, чтобы посмотреть картинку ]принять или отвергнуть сделанное предположение. Для этого используется подход, основанный на выборе так называемого критического множества [ Cкачайте файл, чтобы посмотреть картинку ]. Мы поступаем следующим образом: если данные наблюдений попадают в критическое множество (то есть, [ Cкачайте файл, чтобы посмотреть картинку ]), то гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] отвергается; если же данные находятся вне критического множества (то есть, [ Cкачайте файл, чтобы посмотреть картинку ]), то гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] принимается. Такое решающее правило будем называть критерием, основанным на критическом множестве [ Cкачайте файл, чтобы посмотреть картинку ].
Существует много методов построения критических множеств для проверки статистических гипотез, некоторые из этих методов обсуждаются в последующих параграфах. Сейчас мы кратко коснемся вопроса о возможных ошибках, которые мы допускаем, принимая или отвергая гипотезы.
В силу случайной природы наблюдаемых данных возможна ситуация [ Cкачайте файл, чтобы посмотреть картинку ]в то время, когда гипотеза [ Cкачайте файл, чтобы посмотреть картинку ]справедлива. Однако, согласно решающему правилу, в этом случае мы отвергнем верную гипотезу [ Cкачайте файл, чтобы посмотреть картинку ] и, тем самым, допустим ошибку. Очевидно, что в случае простой гипотезы [ Cкачайте файл, чтобы посмотреть картинку ]вероятность такой ошибки равна [ Cкачайте файл, чтобы посмотреть картинку ]. Эту вероятность называют также уровнем значимости статистического критерия. Такого рода ошибки неизбежны при анализе случайных данных, и их не следует драматизировать. На практике уровень значимости критерия задается изначально, исходя из реальных приложений и потенциальных последствий возможных ошибок.
9.2 Критерий согласия Пирсона
Наше изложение близко к [[ Cкачайте файл, чтобы посмотреть ссылку ], § 30.1] и [[ Cкачайте файл, чтобы посмотреть ссылку ], § 10.4]. Мы рассматриваем независимую выборку [ Cкачайте файл, чтобы посмотреть картинку ], обозначая неизвестную функцию распределения [ Cкачайте файл, чтобы посмотреть картинку ]. Нас интересует вопрос о том, согласуются ли данные наблюдений [ Cкачайте файл, чтобы посмотреть картинку ]с простой гипотезой
[ Cкачайте файл, чтобы посмотреть картинку ]
где [ Cкачайте файл, чтобы посмотреть картинку ]-- некоторая конкретная фиксированная функция распределения.
Вначале разобъем множество [ Cкачайте файл, чтобы посмотреть картинку ]на конечное число непересекающихся подмножеств [ Cкачайте файл, чтобы посмотреть картинку ]. Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- вероятность, соответствующая функции распределения [ Cкачайте файл, чтобы посмотреть картинку ], обозначим [ Cкачайте файл, чтобы посмотреть картинку ]Очевидно, что
[ Cкачайте файл, чтобы посмотреть картинку ]
Теперь сделаем группировку данных аналогично процедуре, описанной в  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ], а именно, определим
[ Cкачайте файл, чтобы посмотреть картинку ]
(50)


Очевидно, что в силу случайных колебаний эмпирические частоты [ Cкачайте файл, чтобы посмотреть картинку ]будут отличаться от теоретических вероятностей [ Cкачайте файл, чтобы посмотреть картинку ]. Чтобы контролировать это различие, следует подобрать хорошую меру расхождения между экспериментальными данными и гипотетическим теоретическим распределением. По аналогии с идеей метода наименьших квадратов в качестве такой меры расхождения можно взять, например, [ Cкачайте файл, чтобы посмотреть картинку ], где положительные числа [ Cкачайте файл, чтобы посмотреть картинку ]можно выбирать более или менее произвольно. Как показал К. Пирсон, если выбрать [ Cкачайте файл, чтобы посмотреть картинку ], то полученная величина будет обладать рядом замечательных свойств. Таким образом, положим
[ Cкачайте файл, чтобы посмотреть картинку ]
(51)


Подчеркнем, что величина [ Cкачайте файл, чтобы посмотреть картинку ]вычисляется по выборке. Функцию [ Cкачайте файл, чтобы посмотреть картинку ] принято называть статистикой Пирсона. Обсудим ее свойства.
Поведение [ Cкачайте файл, чтобы посмотреть картинку ], когда гипотеза [ Cкачайте файл, чтобы посмотреть картинку ]верна.
Речь идет о поведении при увеличении объема выборки: [ Cкачайте файл, чтобы посмотреть картинку ].
Теорема К. Пирсона. Предположим, что гипотеза [ Cкачайте файл, чтобы посмотреть картинку ]верна. Тогда при [ Cкачайте файл, чтобы посмотреть картинку ]распределение величины [ Cкачайте файл, чтобы посмотреть картинку ]сходится к распределению хи-квадрат с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы, то есть,
[ Cкачайте файл, чтобы посмотреть картинку ]
Практический смысл этой теоремы в том, что при большом объеме выборки распределение [ Cкачайте файл, чтобы посмотреть картинку ] можно считать распределением хи-квадрат с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы.
Поведение [ Cкачайте файл, чтобы посмотреть картинку ], когда гипотеза [ Cкачайте файл, чтобы посмотреть картинку ]неверна.
Предположим теперь, что [ Cкачайте файл, чтобы посмотреть картинку ]и разбиение [ Cкачайте файл, чтобы посмотреть картинку ]таково, что
[ Cкачайте файл, чтобы посмотреть картинку ]
где вероятности [ Cкачайте файл, чтобы посмотреть картинку ]вычислены по функции распределения [ Cкачайте файл, чтобы посмотреть картинку ]. Тогда можно показать (см., например, [[ Cкачайте файл, чтобы посмотреть ссылку ], § 10.4]), что
[ Cкачайте файл, чтобы посмотреть картинку ]    если [ Cкачайте файл, чтобы посмотреть картинку ]
(52)


Критерий проверки.
То обстоятельство, что поведение [ Cкачайте файл, чтобы посмотреть картинку ]существенно различно в зависимости от того верна или нет гипотеза [ Cкачайте файл, чтобы посмотреть картинку ], дает возможность построить критерий для ее проверки. Зададимся некоторым уровнем значимости [ Cкачайте файл, чтобы посмотреть картинку ](допустимой вероятностью ошибки) и возьмем квантиль [ Cкачайте файл, чтобы посмотреть картинку ], определенную формулой ([ Cкачайте файл, чтобы посмотреть ссылку ]):
[ Cкачайте файл, чтобы посмотреть картинку ]
Определим критическое множество [ Cкачайте файл, чтобы посмотреть картинку ]:
[ Cкачайте файл, чтобы посмотреть картинку ]
Таким образом, наши действия по принятию (или отвержению) гипотезы [ Cкачайте файл, чтобы посмотреть картинку ] состоят в следующем. Подстановкой имеющихся данных [ Cкачайте файл, чтобы посмотреть картинку ]в формулу ([ Cкачайте файл, чтобы посмотреть ссылку ]) вычисляется значение функции [ Cкачайте файл, чтобы посмотреть картинку ], которое затем сравнивается с  [ Cкачайте файл, чтобы посмотреть картинку ]:
если [ Cкачайте файл, чтобы посмотреть картинку ], то гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] отвергается (при этом говорят, что выборка обнаруживает значимое отклонение от гипотезы [ Cкачайте файл, чтобы посмотреть картинку ]),
если [ Cкачайте файл, чтобы посмотреть картинку ], то гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] принимается (говорят, что выборка совместима с гипотезой [ Cкачайте файл, чтобы посмотреть картинку ]).
Действительно, такое решающее правило соответствует вышеизложенным фактам о поведении функции [ Cкачайте файл, чтобы посмотреть картинку ]. Приведем аргументы, основанные на здравом смысле, свидетельствующие в пользу этого решающего правила. Если значения функции [ Cкачайте файл, чтобы посмотреть картинку ] оказались ``слишком большими'', то, принимая во внимание ([ Cкачайте файл, чтобы посмотреть ссылку ]), разумно считать, что гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] не имеет места. Если же значения [ Cкачайте файл, чтобы посмотреть картинку ] ``не слишком большие'', то, скорее всего, гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] верна, поскольку это согласуется с теоремой Пирсона.
При таком решающем правиле мы может допустить ошибку, отвергнув верную гипотезу [ Cкачайте файл, чтобы посмотреть картинку ]. Из теоремы Пирсона вытекает, что при больших [ Cкачайте файл, чтобы посмотреть картинку ]величина вероятности этой ошибки близка к  [ Cкачайте файл, чтобы посмотреть картинку ].
Границы применимости критерия на практике.
Утверждения теоремы Пирсона и ([ Cкачайте файл, чтобы посмотреть ссылку ]) относятся к пределам при [ Cкачайте файл, чтобы посмотреть картинку ]. На практике, конечно, мы имеем дело лишь с выборками ограниченного объема. Поэтому, применяя вышеописанный критерий, необходимо проявлять осторожность. Согласно рекомендациям, изложенным в [[ Cкачайте файл, чтобы посмотреть ссылку ]], применение критерия дает хорошие результаты, когда все ожидаемые частоты [ Cкачайте файл, чтобы посмотреть картинку ]. Если же какие-то из этих чисел малы, рекомендуется, укрупняя некоторые группы, перегруппировать данные таким образом, чтобы ожидаемые частоты всех групп были не меньше десяти. Если число [ Cкачайте файл, чтобы посмотреть картинку ]достаточно велико, то, как указывается в книге [[ Cкачайте файл, чтобы посмотреть ссылку ]], порог для ожидаемых частот может быть понижен до [ Cкачайте файл, чтобы посмотреть картинку ] или даже до [ Cкачайте файл, чтобы посмотреть картинку ], если [ Cкачайте файл, чтобы посмотреть картинку ]имеет порядок нескольких десятков.
9.3 Критерий согласия для сложных гипотез
На практике задача о согласии данных наблюдений с некоторым совершенно конкретным распределением, рассмотренная в  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ], встречается реже, чем задача проверки сложной гипотезы, которую мы рассматриваем ниже. Итак, рассмотрим независимую выборку [ Cкачайте файл, чтобы посмотреть картинку ], соответствующую неизвестной функции распределения [ Cкачайте файл, чтобы посмотреть картинку ]. Поставим вопрос о том, согласуются ли данные наблюдений [ Cкачайте файл, чтобы посмотреть картинку ]со сложной гипотезой
[ Cкачайте файл, чтобы посмотреть картинку ]
где [ Cкачайте файл, чтобы посмотреть картинку ]-- (вообще говоря) многомерный параметр. В эту формальную схему можно включить, например, рассмотрение гипотезы о принадлежности к классу показательных распределений (без уточнения параметра показательного распределения) и т. п.
Группируя данные аналогично [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ] и вычисляя [ Cкачайте файл, чтобы посмотреть картинку ]по функции распределения [ Cкачайте файл, чтобы посмотреть картинку ], обнаруживаем, что теперь эти вероятности являются функциями от неизвестного параметра:
[ Cкачайте файл, чтобы посмотреть картинку ]
Это обстоятельство делает невозможным непосредственное воспроизведение метода  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ], так как, если бы мы подставили эти вероятности в ([ Cкачайте файл, чтобы посмотреть ссылку ]), то мы бы получили совершенно непригодную с практической точки зрения функцию: ведь для ее вычисления, кроме полученных в эксперименте данных  [ Cкачайте файл, чтобы посмотреть картинку ], требовалось бы также знать сами неизвестные параметры. Чтобы выйти из положения, следует подставить в [ Cкачайте файл, чтобы посмотреть картинку ]вместо параметра [ Cкачайте файл, чтобы посмотреть картинку ]его оценку [ Cкачайте файл, чтобы посмотреть картинку ], вычисленную по выборке. Это можно сделать разными способами, но мы остановимся на одном из них.
Пусть числа [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ], вычислены по выборке согласно формуле ([ Cкачайте файл, чтобы посмотреть ссылку ]). Запишем следующую функцию правдоподобия
[ Cкачайте файл, чтобы посмотреть картинку ]
Находя значение [ Cкачайте файл, чтобы посмотреть картинку ], при котором эта функция максимальна, получим оценку наибольшего правдоподобия [ Cкачайте файл, чтобы посмотреть картинку ]. Особо отметим, что для ее вычисления достаточно знать только [ Cкачайте файл, чтобы посмотреть картинку ]. По аналогии с ([ Cкачайте файл, чтобы посмотреть ссылку ]) определим
[ Cкачайте файл, чтобы посмотреть картинку ]
(53)


Справедлив следующий вариант теоремы Пирсона[ Cкачайте файл, чтобы посмотреть ссылку ]: Предположим, что гипотеза [ Cкачайте файл, чтобы посмотреть картинку ]верна. Тогда при [ Cкачайте файл, чтобы посмотреть картинку ]распределение величины [ Cкачайте файл, чтобы посмотреть картинку ], определяемой по формуле ([ Cкачайте файл, чтобы посмотреть ссылку ]), сходится к распределению хи-квадрат с [ Cкачайте файл, чтобы посмотреть картинку ]степенью свободы.
Заметим, что по сравнению с теоремой из  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ] за замену [ Cкачайте файл, чтобы посмотреть картинку ]-мерного неизвестного параметра его оценкой нам пришлось ``заплатить'' [ Cкачайте файл, чтобы посмотреть картинку ]степенями свободы в предельном распределении хи-квадрат.
В дальнейшем, фиксируя   [ Cкачайте файл, чтобы посмотреть картинку ]и выбирая критическое множество
[ Cкачайте файл, чтобы посмотреть картинку ]
получим искомый критерий уровня значимости   [ Cкачайте файл, чтобы посмотреть картинку ]для проверки сложной гипотезы [ Cкачайте файл, чтобы посмотреть картинку ].
Все примечания относительности применимости этого критерия, сделанные в  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ], разумеется, остаются в силе.
Замечание 9.1  
То обстоятельство, что оценка [ Cкачайте файл, чтобы посмотреть картинку ], которую мы используем в определении ([ Cкачайте файл, чтобы посмотреть ссылку ]), зависит от выборки только через значения [ Cкачайте файл, чтобы посмотреть картинку ], является важным для утверждения сформулированной выше теоремы. Как показано в книге [[ Cкачайте файл, чтобы посмотреть ссылку ], § 10.6], замена параметра [ Cкачайте файл, чтобы посмотреть картинку ]произвольной его оценкой по выборке [ Cкачайте файл, чтобы посмотреть картинку ]приводит к тому, что [ Cкачайте файл, чтобы посмотреть картинку ]больше не является удовлетворительной аппроксимацией для [ Cкачайте файл, чтобы посмотреть картинку ].
9.4 О критериях согласия Колмогорова и Смирнова
Часто при проверке гипотез о распределении тех или иных данных недостаточно применить какой-то один критерий, в особенности, когда данные наблюдений не показывают значимого отклонения от гипотезы, и ситуация представляется сомнительной. В этих случаях целесообразно воспользоваться другими критериями, основанными на других вероятностных идеях, чтобы при их помощи подвергнуть анализу те же данные. Таким образом, очень важно иметь широкий арсенал методов для статистической обработки данных.
В настоящем параграфе мы кратко опишем два других эффективных подхода, приводящих к хорошим критериям согласия. Критерий Пирсона, изложенный в  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ] и  [ Cкачайте файл, чтобы посмотреть картинку ] [ Cкачайте файл, чтобы посмотреть ссылку ], может применяться в самой общей ситуации, являясь весьма универсальным. Его применение особенно оправдано в случае выборок из дискретных распределений. Однако для ряда статистических моделей выводы этого критерия могут быть недостаточно эффективными.
Критерии Колмогорова и Смирнова, о которых идет речь ниже, очень широко применяются в случае непрерывных функций распределения.
Мы ограничимся лишь рассмотрением случая простой гипотезы
[ Cкачайте файл, чтобы посмотреть картинку ]
Основой всех методов является рассмотрение некоторой удачно выбранной меры расхождения между выборкой и гипотетическим распределением, а также возможность описать асимптотическое распределение этой меры расхождения при росте объема выборки. В случае критерия Пирсона этой мерой расхождения была функция [ Cкачайте файл, чтобы посмотреть картинку ].
Для критериев Колмогорова и Смирнова выбор меры расхождения связан с эмпирической функцией распределения  [ Cкачайте файл, чтобы посмотреть картинку ](см. Определение [ Cкачайте файл, чтобы посмотреть ссылку ]). А именно, рассматривается статистика Колмогорова
[ Cкачайте файл, чтобы посмотреть картинку ]
и статистика Смирнова
[ Cкачайте файл, чтобы посмотреть картинку ]
соответственно. Замечательно то, что эти функции легко могут быть вычислены по выборке (не требуется брать какие-либо интегралы, все сводится к простым выражениям, содержащим конечное суммирование и взятие максимума, см., например, [ Cкачайте файл, чтобы посмотреть картинку ] 10.2 в [[ Cкачайте файл, чтобы посмотреть ссылку ]]).
Коснемся вопроса об асимптотическом распределении этих функций. По теореме Гливенко (см. ([ Cкачайте файл, чтобы посмотреть ссылку ])) при выполнении гипотезы [ Cкачайте файл, чтобы посмотреть картинку ] статистика [ Cкачайте файл, чтобы посмотреть картинку ] стремится к нулю при [ Cкачайте файл, чтобы посмотреть картинку ]. Оказывается, что если ее домножить на [ Cкачайте файл, чтобы посмотреть картинку ], то в пределе получится нетривиальное распределение. Более точно, верна теорема Колмогорова: Если гипотеза [ Cкачайте файл, чтобы посмотреть картинку ] верна и [ Cкачайте файл, чтобы посмотреть картинку ]непрерывна, то
распределение статистики [ Cкачайте файл, чтобы посмотреть картинку ]является одним и тем же для любой функции распределения [ Cкачайте файл, чтобы посмотреть картинку ]и
у последовательности [ Cкачайте файл, чтобы посмотреть картинку ]существует предельное распределение при [ Cкачайте файл, чтобы посмотреть картинку ].
Это предельное распределение не совпадает ни с одним упоминавшемся здесь ранее и носит название распределения Колмогорова.
Аналогичное по характеру утверждение имеет место и для статистики Смирнова, а именно, при верной гипотезе [ Cкачайте файл, чтобы посмотреть картинку ] и непрерывной [ Cкачайте файл, чтобы посмотреть картинку ]
распределение [ Cкачайте файл, чтобы посмотреть картинку ]зависит только от [ Cкачайте файл, чтобы посмотреть картинку ]и не зависит от [ Cкачайте файл, чтобы посмотреть картинку ],
у последовательности [ Cкачайте файл, чтобы посмотреть картинку ]существует предельное распределение при [ Cкачайте файл, чтобы посмотреть картинку ].
Теоремы Колмогорова и Смирнова являются основой для построения соответствующих критериев согласия с критическими множествами вида
[ Cкачайте файл, чтобы посмотреть картинку ]    и [ Cкачайте файл, чтобы посмотреть картинку ]
соответственно. Числа [ Cкачайте файл, чтобы посмотреть картинку ]определяются по заданным уровням значимости из таблиц допредельных (или предельных, если [ Cкачайте файл, чтобы посмотреть картинку ]очень велико) распределений Колмогорова и Смирнова. Сами эти таблицы могут быть взяты, например, из книги [[ Cкачайте файл, чтобы посмотреть ссылку ]].
9.5 Проверка нормальности при помощи вероятностной бумаги
Этот простой графический метод часто используют для первоначальной прикидки, правдоподобно ли предположение о том, что независимая выборка [ Cкачайте файл, чтобы посмотреть картинку ]взята из нормального распределения. Эта прикидка осуществляется в буквальном смысле ``на глазок'', поэтому здесь не идет речь о количественных показателях, таких как вероятность ошибки и т.п.
Чтобы пояснить идею этого метода, сформулируем вспомогательное утверждение. Пусть [ Cкачайте файл, чтобы посмотреть картинку ]-- функция распределения закона [ Cкачайте файл, чтобы посмотреть картинку ], [ Cкачайте файл, чтобы посмотреть картинку ].
Лемма 9.1  
Рассмотрим отображение [ Cкачайте файл, чтобы посмотреть картинку ], действующее по формуле
[ Cкачайте файл, чтобы посмотреть картинку ]
где [ Cкачайте файл, чтобы посмотреть картинку ]обозначает функцию, обратную к функции распределения стандартного нормального закона [ Cкачайте файл, чтобы посмотреть картинку ]. При этом отображении график [ Cкачайте файл, чтобы посмотреть картинку ]переходит в прямую линию [ Cкачайте файл, чтобы посмотреть картинку ], а график [ Cкачайте файл, чтобы посмотреть картинку ]переходит в прямую линию [ Cкачайте файл, чтобы посмотреть картинку ].
Доказательство. Достаточно заметить, что [ Cкачайте файл, чтобы посмотреть картинку ]. См. по этому поводу также Упражнение [ Cкачайте файл, чтобы посмотреть ссылку ] на стр. [ Cкачайте файл, чтобы посмотреть ссылку ].
[ Cкачайте файл, чтобы посмотреть картинку ]
[ Cкачайте файл, чтобы посмотреть картинку ]

Предположим, что в нашей выборке [ Cкачайте файл, чтобы посмотреть картинку ]все числа различны. Переупорядочим выборку в порядке возрастания:
[ Cкачайте файл, чтобы посмотреть картинку ]
То, что получается после такого переупорядочения, называют вариационным рядом.
Из Определения [ Cкачайте файл, чтобы посмотреть ссылку ] легко вытекает, что в этом случае эмпирическая функция распределения может быть выражена формулой
[ Cкачайте файл, чтобы посмотреть картинку ]
(54)


В частности, [ Cкачайте файл, чтобы посмотреть картинку ].
С другой стороны, теорема Гливенко утверждает, что при большом объеме выборки эмпирическая функция распределения близка к теоретической функции распределения. Принимая во внимание Лемму [ Cкачайте файл, чтобы посмотреть ссылку ], заключаем, что если выборка [ Cкачайте файл, чтобы посмотреть картинку ]действительно взята из нормального распределения [ Cкачайте файл, чтобы посмотреть картинку ], то точки
[ Cкачайте файл, чтобы посмотреть картинку ]
(55)


должны приблизительно оказаться на одной прямой линии (а именно, на прямой [ Cкачайте файл, чтобы посмотреть картинку ]).
Замечание 9.2  
Мы намеренно не включаем в перечень ([ Cкачайте файл, чтобы посмотреть ссылку ]) точку, соответствующую [ Cкачайте файл, чтобы посмотреть картинку ], так как [ Cкачайте файл, чтобы посмотреть картинку ], а отображение [ Cкачайте файл, чтобы посмотреть картинку ]в точках вида [ Cкачайте файл, чтобы посмотреть картинку ]не определено.
Таким образом, мы пришли к очень простому глазомерному способу проверки нормальности выборки: наносим на плоскость точки
[ Cкачайте файл, чтобы посмотреть картинку ]
и смотрим, лежат ли они вблизи какой-либо прямой линии. Если такую прямую можно провести, то по ее чертежу можно грубо оценить значения неизвестных параметров [ Cкачайте файл, чтобы посмотреть картинку ]и [ Cкачайте файл, чтобы посмотреть картинку ].
Чтобы было удобнее наносить эти точки, прибегают к так называемой вероятностной бумаге. Вероятностная бумага получается выбором неравномерной шкалы координат вдоль оси ординат. А именно, на расстоянии [ Cкачайте файл, чтобы посмотреть картинку ]от оси абсцисс мы ставим пометку [ Cкачайте файл, чтобы посмотреть картинку ]для новой неравномерной шкалы. На вероятностную бумагу (в системе новых координат) наносят точки [ Cкачайте файл, чтобы посмотреть картинку ][ Cкачайте файл, чтобы посмотреть картинку ].
Замечание 9.3  
В силу того, что данные наблюдений и измерений, как правило, округлены до некоторого знака, предположение о том, что все [ Cкачайте файл, чтобы посмотреть картинку ]различны, нередко нарушается. Это приводит к тому, что в вариационном ряду некоторые соседние значения могут совпадать и формула ([ Cкачайте файл, чтобы посмотреть ссылку ]) для выражения [ Cкачайте файл, чтобы посмотреть картинку ]через вариационный ряд несколько видоизменяется. Но, тем не менее, изложенный выше глазомерный метод определения нормальности остается пригодным.
Замечание 9.4  
Мы не используем точку [ Cкачайте файл, чтобы посмотреть картинку ], тем самым теряя некоторую информацию, содержащуюся в выборке. Имея в виду приблизительность этого метода, можно надеяться, что в случае больших выборок, эта потеря не слишком существенна. Отметим, однако, что существуют приемы, позволяющие учитывать и значение [ Cкачайте файл, чтобы посмотреть картинку ]. Нетрудно модифицировать этот метод для проверки гипотез о выборках из распределений, не являющих нормальными, но зависящих от неизвестных параметров сдвига-растяжения. Детали можно найти, например, в [[ Cкачайте файл, чтобы посмотреть ссылку ], § 5.1] и [[ Cкачайте файл, чтобы посмотреть ссылку ], § 4].
Пример 9.1  
Вернемся к нашему числовому Примеру [ Cкачайте файл, чтобы посмотреть ссылку ] и зададимся вопросом, насколько в Примере [ Cкачайте файл, чтобы посмотреть ссылку ] было обоснованным предположение о нормальности выборок [ Cкачайте файл, чтобы посмотреть картинку ] и [ Cкачайте файл, чтобы посмотреть картинку ]. Для этого проведем их проверку на нормальность при помощи вероятностной бумаги.
Для выборки [ Cкачайте файл, чтобы посмотреть картинку ], соответствующей содержанию углерода в пробах, чертеж представлен на рисунке [ Cкачайте файл, чтобы посмотреть ссылку ].
[ Cкачайте файл, чтобы посмотреть картинку ]

Рис. Данные о процентном содержании углерода в пробах

Для выборки [ Cкачайте файл, чтобы посмотреть картинку ], содержащей значения прочности на разрыв, чертеж представлен на рисунке [ Cкачайте файл, чтобы посмотреть ссылку ].
[ Cкачайте файл, чтобы посмотреть картинку ]

Рис. Данные о значениях прочности на разрыв


Видно, что и в том, и в другом случае точки располагаются вблизи некоторой прямой линии. Таким образом, имеются основания для гипотез о нормальности выборок [ Cкачайте файл, чтобы посмотреть картинку ] и [ Cкачайте файл, чтобы посмотреть картинку ].
Большое число естественно-научных примеров, при анализе которых используется вероятностная бумага, содержится во второй части книги [[ Cкачайте файл, чтобы посмотреть ссылку ]].


Приложенные файлы

  • doc 4352657
    Размер файла: 709 kB Загрузок: 0

Добавить комментарий