Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Описательная статистика




Эта статистика служит для описания самых общих свойств наблюдаемых величин. К числу основных описательных (выборочных) статистик относятся меры оценки центральной тенденции (среднее, медиана, мода) и меры вариации (выборочная дисперсия, стандартное отклонение, максимальное и минимальное значения, размах, квантили).

Среднее выборочное значение – сумма всех значений, деленная на их число, определяется средним арифметическим[4] Физическая аналогия – центр тяжести тела. Формула для выборочного среднего имеет вид: .

Выборочное среднее является той точкой, сумма отклонений от которой всех рассматриваемых наблюдений равна 0. Формально это записывается следующим образом:

.

Таким образом, выборочное среднее – единственная точка, которая обладает данным свойством, и это выделяет ее среди всех других.

Кроме того, выборочное среднее обладает еще одним замечательным свойством: сумма квадратов расстояний между наблюдаемыми значениями и их средним арифметическим является минимальной.

Ошибка среднего – характеризует точность вычисления среднего значения с учетом величины разброса выборочных значений.

Медиана – медиана m представляет собой значение, которое делит выборку пополам: число выборочных значений, меньших m, равно числу значений, больших m. При симметричном распределении значений переменной выборочное среднее обычно близко к значению медианы.

Квартили – представляют собой значения, которые делят выборку на четыре равные части (здесь есть аналогия с медианой).

Стандартное (среднеквадратическое) отклонение – показывает, насколько сильно выборочные значения разбросаны относительно среднего, и рассчитывается по формуле: .

Дисперсия [5] - степень «разбросанности» признака, его вариация, порождаемая всей совокупностью действующих на него факторов. Вычисляется как квадрат стандартного отклонения.

«Истинное» среднее и доверительный интервал оценки.

В большинстве исследований используется такая важная описательная статистика, как среднее. Среднее - очень информативная мера "центрального положения" наблюдаемой переменной, особенно если сообщается ее доверительный интервал. Исследователю нужны такие статистики, которые позволяют сделать вывод относительно популяции в целом. Одной из таких статистик является среднее.

Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия находится "истинное" (неизвестное) среднее популяции. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции. Если вы установите больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот. Хорошо известно, например, что чем "неопределенней" прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.




Поделиться с друзьями:


Дата добавления: 2014-12-26; Просмотров: 1209; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.