Математическая статистика
  
 карта письмо
 

 
 
 
Статистические гипотезы. Критерии. Статистика

Очень важно знать закон распределения генеральной совокупности. Часто оказывается так, что закон распределения неизвестен, но имеются основания предполагать, что он имеет определенный вид (назовем его H). Выдвигают гипотезу: генеральная совокупность распределена по закону H. В этом случае гипотеза предполагает вид распределения.

Однако нельзя исключать случай, когда закон распределения известен, а его параметры неизвестны. Тогда есть основания сделать предположение о том, что неизвестный параметр Q равен определённому значению Q0. Выдвигают гипотезу: H:Q=Q0. Таким образом, эта гипотеза предполагает величину одного параметра известного распределения. Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многом другом.

Статистической гипотезой – называется любое утверждение о виде неизвестного распределения генеральной совокупности или о параметрах этого распределения, или о параметрах известных распределений. Например, статистическими являются гипотезы: 1. генеральная совокупность распределена нормально; 2. дисперсии двух совокупностей, распределённых по закону Пуассона, равны между собой; В первой гипотезе сделано предположение о виде неизвестного распределения, во второй – о параметрах двух известных распределений.

Наряду с выдвинутой гипотезой рассматриваются и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы следует различать. Нулевой (основной) называют выдвинутую гипотезу и обозначают H0. Конкурирующей (альтернативной) называют гипотезу H1, которая противоречит нулевой. Выбор конкурирующей гипотезы определяется условиями поставленной задачи.

Правило, которым руководствуются при отклонении или принятии нулевой гипотезы H0, называется критерием. Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

Например. Пусть

f(x,m,sigma)-плотность нормального распределения

плотность нормального распределения, зависящая от двумерного параметра (m,sigma^2). Гипотеза (m,sigma^2)=(0,1) является простой, а гипотеза (m=m0,sigma)=(0,1), где m0 фиксировано, – сложной.

Замечание. Правильное решение может быть принято в двух случаях:
1. гипотеза принимается, причём и в действительности она правильная;
2. гипотеза отвергается, причём и в действительности она неверна.

Решение об истинности или ложности нулевой гипотезы, принимается на основе анализа некоторой функции выборки, которая называется статистикой.


_


Критические области. Ошибки первого и второго рода.

Проверка статистических гипотез основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, считаются достоверными. Этот принцип можно реализовать следующим образом. Перед анализом выборки фиксируется некоторая малая вероятность alfaуровень значимости.

Пусть S – множество значений статистики z, а Sk<(S – такое подмножество, что при условии истинности гипотезы H0 вероятность попадания статистики критерия в S(k) равна alfa, то есть P{z<(Sk|H0}=alfa. Множество значений S статистики можно разбить на два подмножества: подмножество S(k) значений статистики, при которых нулевая гипотеза H0 отклоняется и принимается гипотеза H1, называется критической областью; подмножество S\Sk значений статистики, при которых нулевая гипотеза не отклоняется, называется областью принятия гипотезы H0.

Так как гипотеза проверяется путем анализа выборки, полученной из генеральной совокупности, то из-за случайности выборки в результате проверки возможны ошибки. Различают ошибки первого и второго рода. Ошибка первого рода возникает, если будет опровергнута правильная нулевая гипотеза. При ошибке второго рода принимается неправильная нулевая гипотеза. Вероятность ошибки первого рода равна вероятности попадания статистики критерия в критическую область при условии, что верна нулевая гипотеза, то есть, равна уровню значимости alfa:

P{z<(Sk|H0}=alfa

Вероятность ошибки второго рода betta можно вычислить по формуле

P{z<S\Sk|H1}=betta

Критерий, основанный на использовании заранее заданного уровня значимости, называется критерием значимости. Уровень значимости alfa определяет размер критической области S(k). Положение критической области на множестве значений статистики z зависит от формулировки альтернативной гипотезы. Например, если проверяется гипотеза H0:Q=Q0, а альтернативная гипотеза формулируется, как H1:Q>Q0(Q>Q0), то критическая область размещается на правом (левом) “хвосте” распределения статистики z, то есть имеет вид неравенства z>z(1-alfa)(z<z(alfa)), где z(1-alfa) и z(alfa) квантили распределения статистики z, при условии что верна гипотеза H0.

В этом случае критерий называется односторонним, соответственно правосторонним и левосторонним. Если альтернативная гипотеза формируется, как H1:Q<>Q0, то критическая область размещается на обоих «хвостах» распределения z, то есть определяется совокупностью неравенств z<z(alfa/2) и z>z(1-alfa/2); в этом случае критерий называется двусторонним.

Замечание. Наиболее часто уровень значимости принимают равный 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).


_


Первая   Предыдущие 3 задачи

 


~Генеральная совокупность. Случайная выборка. Вариационный ряд.~
к вопросу »

~Выборочные характеристики: выборочное ожидание и выборочная дисперсия~
к вопросу »

~Нормальное распределение. Распределение "хи-квадрат". Распределение Стьюдента.~
к вопросу »

~Статистические гипотезы. Критерии. Статистика~
к вопросу »