Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Выборочная дисперсия. Правила расчета дисперсии

До сих пор термин "дисперсия" использовался в смысле теоретической дисперсии, то есть относящейся ко всей генеральной совокупности. Для целей, которые прояснятся при обсуждении регрессионного анализа, целесообразно ввести понятие выборочной дисперсии. Для выборки из п наблюдений х1,...х п выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

Var (x) = 2 9.

Сделаем три важных замечания:

1. Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. Выборочная дисперсия, определенная как

s2 = (x - 2 10.

является несмещенной оценкой s2. Отсюда следует, что ожидаемое значение величины Var (x) равно [(n - 1)/ n ] s2 и что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки п становится большим, то (п - 1)/ п стремится к единице и, таким образом, математическое ожидание величины Var (x) стремится к s2. Можно показать, что ее предел по вероятности (plim) равен s2 и, следовательно, она является примером состоятельной оценки, которая смещена для небольших выборок.

2. Так как величина s2 является несмещенной, то в некоторых работах ее часто определяют как выборочную дисперсию и либо избегают ссылок на Var(x), либо дают ей какое-то другое название. В русскоязычной литературе величина Var (x) обычно называется выборочной дисперсией, а s2 -"исправленной" или несмещенной, выборочной дисперсией. К сожалению, общепринятой договоренности по этому поводу нет.

3. Поскольку указанная договоренность отсутствует, отсутствует и договоренность относительно условного обозначения данного понятия, и для этого используются самые различные символы. Мы условимся теоретическую (или генеральную) дисперсию переменной х обозначать как рор.var (x) или s. Если ясно, о какой переменной идет речь, то нижний индекс может быть опущен. Выборочную дисперсию будем обозначать как Var (х).

Почему выборочная дисперсия в среднем занижает значение теоретической дисперсии? Причина заключается в том, что она вычисляется как среднеквадратичное отклонение от выборочного среднего, а не от истинного значения. Так как выборочное среднее автоматически находится в центре выборки, то отклонения от него в среднем меньше отклонений от теоретического среднего значения.

Существует несколько простых и очень полезных правил для расчета дисперсии, являющихся аналогами правил для ковариации, рассмотренных в разделе 2.

 

Правило дисперсии 1.

Если у = v + w, то Var (y) = Var (v) + Var (w) + 2 Cov (v,w) 11.

Правило дисперсии 2.

Если y = a z, где а является постоянной, то Var (y) = a 2 Var (z) 12.

Правило дисперсии 3.

Если у = а, где а является постоянной, то Var (y) = 0 13.

Правило дисперсии 4.

Если у = v + a, где a является постоянной, то Var (y) = Var (v). 14.

Кроме того, заметим, что дисперсия переменной х может рассматриваться как ковариация между двумя величинами х:

Var (x) = = Cov (x, x) 15.

Учитывая это правило, мы можем воспользоваться правилами расчета выборочной ковариации, чтобы вывести правила расчета дисперсии. Кроме того, мы можем получить другую формулу для представления Var (x), используя соотношение (15) для выборочной ковариации.

Var (x) = 16.

Если две переменные независимы и, следовательно, их совокупная ковариация равняется нулю, то теоретическая дисперсия суммы этих переменных будет равна сумме их теоретических дисперсий:

pop.var (x + y) = pop.var (x) + pop. var (y) + 2 pop.cov (x, y) = pop.var (x) + + pop.var (y) = s+ s 17.

Из данного результата можно получить общее правило о том, что теоретическая дисперсия суммы любого числа переменных равняется сумме их дисперсий при условии, что наблюдения независимы друг от друга. При этом можно показать, что если случайная переменная х имеет дисперсию s2, то дисперсия выборочного среднего будет равна s2/ п, где п - число наблюдений в выборке:

pop.var () = pop.var var (x1 +... + xvar (x1) +...

+ pop.var (x 18.

 

 

<== предыдущая лекция | следующая лекция ==>
Теоретическая ковариация | Коэффициент корреляции
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 2465; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.