Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Анализ первичных статистик

МАТЕМАТИКО-СТАТИСТИЧЕСКАЯ ОБРАБОТКА

Для определения способов математико-статистической обработки преж­де всего необходимо оценить характер распределения по всем используе­мым параметрам. Для параметров, имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической ста­тистики, которые во многих случаях являются более мощными, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.

 

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение - модель варьи­рования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Число таких факторов велико, а эффект влияния каждого из них в отдельности очень мал. Такой характер взаимовлияний весьма характерен для психических яв­лений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение. Однако так бывает не всегда, поэтому в каж­дом случае форма распределения должна быть проверена.

Важнейшими первичными статистиками являются:

 

а) средняя арифметическая - это величина, сумма отрицательных и
положительных отклонений от которой равна нулю. В статистике ее обо­значают буквой Мили х. Чтобы ее подсчитать, надо суммировать все значе­ния ряда и разделить сумму на количество суммированных значений. Если в ряду есть числа со знаком «минус», то суммирование производят с учетом знаков;

 

б) среднее квадратичное отклонение (обозначаемое греческой буквой а (сигма) и называемое также основным, или стандартным, отклонением) - мера разнообразия входящих в группу объектов; она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах - разность между наи­большим и наименьшим значением в ряду. Однако сигма полнее характери­зует разброс значений относительно средней арифметической;

в) коэффициент вариации - частное от деления сигмы на среднюю арифметическую, умноженное на 100 %. Обозначается CV:

CV = O 100% М

M *

Сигма - величина именованная и зависит не только от степени варьиро­вания, но и от единиц измерения. Поэтому по сигме можно сравнивать из­менчивость лишь одних и тех же показателей, а сопоставлять сигмы раз­ных признаков по абсолютной величине нельзя. Для того, чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в раз­личных единицах измерения) и избежать влияния масштаба измерений сред­ней арифметической на величину сигмы, применяют коэффициент вариа­ции, который представляет собой по существу приведение к одинаковому масштабу величины а.

 

Для нормального распределения известны точные количественные за­висимости частот и значений, позволяющие прогнозировать появление но­вых вариант:

1) слева и справа от средней арифметической лежит 50% ва­риант;

2) в интервале от М- 1о до М + 1o - 68,7 % вариант;

3) в интервале от М /-1,96o до М + 1,96o - 95 % вариант.

Таким образом, ориентируясь на эти характеристики нормального рас­пределения, можно оценить степень близости к нему рассматриваемого рас­пределения.

 

 

Следующими по важности являются такие первичные статистики, как коэффициент асимметрии и эксцесс.

Коэффициент асимметрии - показа­тель скошенности распределения в левую или правую сторону по оси абс­цисс. Если правая ветвь кривой длиннее левой - говорят о положительной асимметрии, в противоположном случае - об отрицательной.

Эксцесс - по­казатель островершинности. Кривые, более высокие в своей средней час­ти - островершинные, называются эксцессивными, у них большая величи­на эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины - с прогибом в средней части.

 

Эти параметры позволяют составить первое приближенное представ­ление о характере распределения: у нормального распределения редко можно обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1и+1). Подчеркну, что это только приблизительная оценка. Точную и строгую оценку нормальности распределения можно получить, используя один из су­ществующих методов проверки (см., например, главы 2 и 5 книги Г. В. Суходольского «Основы математической статистики для психологов». Л., 1972.). Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант. Большие вели­чины эксцесса и асимметрии часто являются индикатором ошибок при под­счетах вручную или ошибок при введении данных через клавиатуру для компьютерной обработки. Грубые промахи при введении данных в обра­ботку можно обнаружить, если сравнить величины сигм у аналогичных па­раметров. Выделяющаяся величиной сигма может указывать на ошибки.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные - трижды), причем желательно разными способами, с вариацией последовательности обращения к число­вому массиву.

По части никогда не удается полностью охарактеризовать целое, всегда остается вероятность того, что оценка генеральной совокупности на осно­ве выборочных данных недостаточно точна, имеет некоторую большую или меньшую ошибку. Такие ошибки, представляющие собой ошибки обобще­ния, экстраполяции, связанные с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, называются ошиб­ками репрезентативности.

Репрезентативность - степень соответствия вы­борочных показателей генеральным параметрам.

Статистические ошибки репрезентативности показывают, в каких пре­делах могут отклоняться от параметров генеральной совокупности (от ма­тематического ожидания или истинных значений) наши частные определе­ния, полученные на основе конкретных выборок. Очевидно, величина ошиб­ки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, ха­рактеризующих варьирование выборочных показателей вокруг их генераль­ных параметров.

 

В число первичных статистик входит статистическая ошибка сред­ней арифметической.

Формула для ее вычисления такова:

Mм = + O

n

где тм - ошибка средней, о - сигма, п - число значений признака. Это ос­новные первичные статистики, которые позволяют оценить характер рас­пределения данных в экспериментальном массиве.

<== предыдущая лекция | следующая лекция ==>
Проверка данных | Общее представление о методе наблюдения
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 604; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.018 сек.