Математическая статистика
  
 карта письмо
 

 
 
 
Генеральная совокупность. Случайная выборка. Вариационный ряд.

Генеральной совокупностью называется вероятностное пространство (Сигма,S,P) и определённая на этом пространстве случайная величина X. Здесь Сигма пространство элементарных событий, S сигма-алгебра, P вероятность событий.

Выборкой объёма n называется последовательность {Xn} независимых одинаково распределённых случайных величин, распределение каждой из них совпадает с распределением исследуемой случайной величины X.

Другими словами, случайная выборка – результат n последовательных наблюдений над случайной величиной X, представляющей генеральную совокупность. При этом предполагается, что условия проведения наблюдений не изменяются от эксперимента к эксперименту.

Числа, x1,x2,x3,...,xn получаемые при n кратном повторений экспериментов в неизменных условиях, представляют собой конкретную реализацию выборочного случайного вектора {X1,X2,X3,..Xn}, компоненты которого независимы и распределены по одному и тому же закону.

Вариационным рядом выборки x1,x2,x3,...,xn называется такое представление, при котором элементы записываются в виде неубывающей последовательности x(1) x(2) x(3)..x(n), где x(1)<=x(2)<=x(3)<=...<=x(n). Разность между максимальным и минимальным элементами выборки x(n)-x(1) называется размахом выборки.

В общем случае не все элементы выборки различны, некоторые из них могут совпадать. Пусть выборка содержит k различных элементов z(1) z(2) z(3)...z(n), причём элемент z(i) встречается n(i) раз. Число n(i) называется частотой элемента выборки z(i)i=1,k.


_


Выборочные характеристики: выборочное ожидание и выборочная дисперсия

Выборочным средним – называется число

x_=(1/n)*Sum(x(i)*n(i),i=1,2,...,n)

где x1,x2,x3,..xn – элементы выборки объёма n из генеральной совокупности; n(i) – соответствующие этим элементам частоты.

Выборочной дисперсией – называется число

D=(1/n)*Sum((x(i)-x_)^2*n(i),i=1,2,...,n)

Выборочное среднее и выборочная дисперсия представляют собой соответственно оценку математического ожидания и дисперсию генеральной совокупности. Однако на практике часто оказывается так, что выборочная дисперсия является заниженной оценкой генеральной дисперсии. Поэтому важно отметить ещё один вид дисперсии, который является более точным оцениванием этой характеристики.

Исправленной дисперсией – называется число

s^2=(1/(n-1))*Sum((x(i)-x_)^2*n(i),i=1,2,...,n.

Объясняется это тем, что выборочная дисперсия является смещённой оценкой, тогда как исправленная нет.

Замечание: Сравнивая последние две формулы, замечаем, что они отличаются лишь значениями в знаменателях. Очевидно, при больших значениях объёма выборки выборочная и исправленная дисперсии ведут себя почти одинаково. На практике пользуются исправленной дисперсией, если примерно n<30.


_


Нормальное распределение. Распределение "хи-квадрат". Распределение Стьюдента.

Нормальное распределение играет исключительно важную роль в математической статистике. Такое распределение наиболее часто встречается на практике. Главная особенность, выделяющая нормальное распределение среди других распределений, состоит в том, что оно является предельным, к которому приближаются остальные распределения при весьма часто встречающихся типичных условиях.

Распределение случайной величины X) называется нормальным, если это распределение характеризуется плотностью следующего вида

плотность

где m математическое ожидание X, а sigma среднеквадратическое отклонение X (sigma^2 дисперсия). Таким образом, мы видим, что нормальное распределение описывается двумя параметрами m и sigma^2.

Замечание 1. Общим называют нормальное распределение с произвольными параметрами m и sigma^2. Замечание 1*. Нормированной называют нормальное распределение с параметрами m=0 и sigma^2=1
Замечание 2. Генеральная совокупность называется нормальной, если она распределена нормально.

Распределение основных статистик, которые вычисляются по выборке из нормально распределенной генеральной совокупности, связаны с распределением “хи-квадрат” HI(k)^2 и Стьюдента T(k).

Распределением HI^2 с k степенями свободы называется распределение случайной величины HI^2, равной сумме квадратов k независимых нормально распределенных по закону N(0,1) случайных величин Xi, i=1,2,...,k, то есть величины

Hik^2=X1^2+X2^2+...+Xn^2

Плотность этого распределения

плотность Hi^2

где G(x) – гамма функция; в частности, G(n+1)=n!

Отсюда видно, что распределение “хи квадрат” определяется одним параметром – числом степеней свободы k.

Замечание 3. С увеличением числа степеней свободы распределение медленно приближается к нормальному.

Распределением Стьюдента с k степенями свободы называется распределение случайной величины T(k), равной отношению двух независимых случайных величин U и sqrt(Hi(k)^2/k), то есть

U/sqrt(Hi(k)^2/k),

где U имеет нормальное распределение U.

Замечание 4. С возрастанием числа степеней свободы распределение Стьюдента быстро приближается к нормальному распределению.


_


Следующие 3 задачи  Последняя

 


~Генеральная совокупность. Случайная выборка. Вариационный ряд.~
к вопросу »

~Выборочные характеристики: выборочное ожидание и выборочная дисперсия~
к вопросу »

~Нормальное распределение. Распределение "хи-квадрат". Распределение Стьюдента.~
к вопросу »

~Статистические гипотезы. Критерии. Статистика~
к вопросу »