КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Достоверность различий выборочных распределений частот антропометрических признаков. Асимметрия и эксцесс
Ни одно эмпирическое распределение антропометрических признаков, как правило, не имеет точного совпадения с теоретической кривой нормального распределения. Расхождения между эмпирическим и теоретическим распределениями численно оцениваются с помощью особых критериев. При этом исследуемое распределение рассмаривается как результат выборки, имеющей нормальный закон распределения, и в силу ограниченности ее объема не вполне совпадающее с ним. Найдя численное значение расхождения с помощью какого-либо критерия, определяют вероятность того, что случайная выборка дает расхождение, достигающее такого же или большего значения. Различия могут считаться случайными, если эмпирическое значение выбранного критерия не превышает заданного порога вероятности. Таким способом определяют соответствует ли наблюдаемое распределение закону нормального распределения исходной совокупности, из которой взята выборка. Наиболее распространенным критерием соответствия является критерий «хи-квадрат» — χ2 Функция χ2 представляет собой сумму квадратов отклонений эмпирических численностей от теоретической, поделенных на теоретическую численность: где f — эмпирические f1— теоретические частоты в каждом i -м классе значений признака [6]. Эта функция хорошо изучена, составлены таблицы ее вероятностей Р ( χ 2) (см. приложение 6). Различие между эмпирическим и теоретическим распределением считается достоверным, если полученный критерий χ2 больше табличною с вероятностью 0.99. Конкретные примеры оценки различий между эмпирическим и теоретическим распределением приведены в приложении 6. Ранее считалось, что распределение всех без исключения антропометрических признаков подчинено закону нормального распределения. Однако работы в области прикладной антропологии показали, что далеко не все признаки имеют нормальное распределение частот. Оказывается, что этой закономерности в достаточной мере подчиняются лишь признаки, связанные с размерами скелета. В то же время, все признаки, связанные с жироотложением, т. е. обхватные размеры, дают эмпирические распределения, значительно уклоняющиеся от нормального [1; 7; 15]. Для расчета теоретического распределения этих признаков прибегают к особому математическому приему, который позволяет превратить распределения, отклоняющиеся от нормального, в нормальные. Такое преобразование можно провести при помощи соответствующей преобразующей функции. Сама случайная величина х может не иметь нормального распределения, но ее функция при правильном выборе будет подчиняться закону нормального распределения. Вид преобразующей функции зависит от природы изучаемого явления. Для преобразования распределений обхватпых антропометрических признаков применяется метод логарифмической трансформации с использованием функции [1; 8-10; 15]: Более подробно этот метод описан в конце параграфа. Преобразования эмпирических распределений, отклоняющихся от нормальных, необходимы, так как если при расчете теоретических распределений пренебречь отклонением и вести разработку данных исходя из нормального распределения признаков возникнет погрешность из-за несоответствия эмпирических и теоретических кривых распределения. При разработке размерной типологии эта погрешность приведет к тому, что часть людей не найдет для себя одежды, а для части людей одежда, наоборот, будет в избытке. Погрешность П, % может быть вычислена как полусумма абсолютных разностей (без учета знака) между эмпирическими и теоретическими частотами, деленная на общую численность выборки [5]: тому, что часть людей не найдет для себя одежды, а для части людей одежда, наоборот, будет в избытке. Погрешность П, % может быть вычислена как полусумма абсолютных разностей (без учета знака) между эмпирическими и теоретическими частотами, деленная на общую численность выборки [5]: Погрешность, превышающая 5%, считается значимой. Так для основных обхватных признаков в группе женщин (21-59 лет) (по данным 1990 г.) величина погрешности выражается цифрами, приведенными в табл. 3.7. Согласно приложению 6, табл. 3 доверительные уровни значимости χ2 для приведенных признаков соответственно равны: Высокие цифры погрешности П, % и критерия х2 в табл. 3.7, которые в значительной степени превышают приведенные выше значения доверительных уровней значимости, говорят о том, что исходные распределения обхватных признаков в значительной степени отличаются от нормальных. В табл. 3.7 приведены значения тех же показателей после обработки данных методом логарифмической трансформации. Как видим, распределения после преобразования стали нормальными. Более подробно об эффективности применения данного метода при построении размерной типологии будет сказано в главе 4. Погрешность, возникающая из-за несоответствия эмпирических и теоретических кривых распределения, является следствием наличия в эмпирическом распределении асимметрии и эксцесса. Как уже отмечалось, теоретическая кривая нормального распределения симметрична и средняя арифметическая величина совпадает с модой и медианой. В то же время любая эмпирическая кривая обнаруживает большую или меньшую асимметрию и, как правило, средняя арифметическая величина, мода и медиана не совпадают друг с другом. Асимметричные кривые показаны на рис. 3.6. При асимметричном распределении наблюдается увеличение частот в правой или левой половине кривой. Средняя арифметическая величина в таком распределении перемещается в ту сторону кривой, где находится большая численность. Условно принимают асимметрию положительной при увеличении правой половины кривой и отрицательной, если увеличена левая половина кривой. При положительной асимметрии (см. рис. 3.6, а) средняя величина находится справа от наиболее часто встречающегося значения признака — моды, т. е. М > М, при отрицательной — слева от нее (см. рис. 3.6, б), т. е. М < М0. Следует отметить, что для антропометрических признаков характерна преимущественно правосторонняя (положительная) асимметрия [4].
Значения погрешности и критерия х2 Таблица 3.7 Помимо асимметрии, у некоторых кривых можно подметить еще одну особенность: наличие высоко- или плоско-вершинности, или эксцессивности (экс-цессивные кривые изображены на рис. 3.7). Высоковершинность, или эксцес-сивность, характеризуется значительным увеличением численностей в классе, где находится средняя арифметическая величина, и уменьшением в классах с крайними значениями признака. В этом случае кривая распределения 1 имеет вид острой пирамиды с расширенным основанием. Вершина кривой, как видно из рисунка, в этом случае лежит выше вершины нормальной кривой 2. Такой эксцесс принято считать положительным. В случае, если вершина кривой распределения 3 лежит ниже вершины нормальной кривой, эксцесс отрицательный [4]. Для каждого вариационного ряда можно рассчитать количественную характеристику асимметрии и эксцесса: коэффициенты асимметрии γ, и эксцесса γ2. Для определения коэффициентов асимметрии и эксцесса, так же как при вычислении средней арифметической величины и среднего квадратичного отклонения, используется метод моментов. При определении коэффициента асимметрии пользуются суммой третьих степеней отклонений от средней арифметической величины х, деленной на общее число случаев, т. е.
При определении коэффициента эксцесса используется сумма четвертых степеней отклонений от средней арифметической величины, деленная на общее число случаев, т. е. Характеристики µ3 и µ.4 носят название центральных моментов соответственно третьей и четвертой степени. Центральные моменты характеризуют отклонения от средней арифметической величины.V, деленные на общее число случаев п. Таким образом, центральным моментом первой степени будет сумма отклонений первой степени от х, деленная на общее число случаев: Центральным моментом второй степени будет сумма отклонений второй степени от х, деленная на общее число случаев: В том случае, если отклонения берут не от средней арифметической величины, а от условной средней А, принимаемой за 0, то момент называется начальным. Так, начальный момент первой степени от условной средней величины выражается как а момент второй степени При вычислении коэффициентов асимметрии и эксцесса также удобней пользоваться отклонениями от условной средней величины, а не от средней арифметической величины, так как в этом случае можно использовать условные отклонения. Начальные моменты третьей и четвертой степени будут выражаться как суммы отклонений третьей и четвертой степени от условной средней величины в условных единицах, деленные на общее число случаев: Между центральными и начальными моментами имеется соответствующая зависимость. Так, µ4 = v 2- v 12 т. е. центральный момент второй степени есть не что иное, как s2. Центральный момент третьей степени определяют по формуле µ3 = v 3- 3 v 3 v 1 + 2v13, а централь-ный момент четвертой степени — по формуле µ4 = v4- 4v3v1 + 6v2v1 - 3 v14. Вычислив значения центральных моментов второй, третьей, четвертой степени (центральный момент первой степени, как известно, всегда равен нулю), переходят к вычислению коэффициентов асимметрии и эксцесса. Так, коэффициент асимметрии γ вычисляют путем отнесения центрального момента третьей степени к среднему квадратич- ному отклонению в кубе, т. е. γ1 =µ3/ s3 Приведение к s3 нужно для того, чтобы можно было оперировать с числом не именованным, а отвлеченным и сравнивать коэффициенты асимметрии и эксцесса в различных рядах. Как показывает анализ, в вариационных рядах, не отклоняющихся от нормального, µ4=3µ22 отсюда µ4/µ22= µ4/s22=3 В эксцессивном ряду эта величина будет больше трех. Поэтому формула для расчета коэффициента эксцесса имеет вид: Степень выраженности асимметрии и эксцесса указывает на отклонение данного распределения от нормального. Если кривая симметрична, то γ1 = 0, γ2 = 0. Однако из этого еще не следует, что при γ1 и γ2, не равных нулю, распределение нельзя считать нормальным; возможны случайные отклонения эмпирического ряда от нормального, которые при достаточно большой величине выборки -могут и не возникнуть. В приложении 7 приведены граничные значения коэффициентов асимметрии γ1 и эксцесса γ2, зависящие от величины выборки /; при различных степенях вероятности. Если полученные значения коэффициента асимметрии и эксцесса (при заданном п) меньше или равны первому порогу вероятности Р 0.95, то распределение можно считать нормальным. Коэффициенты асиммет рии и эксцесса следует считать значимыми, а отклонение выборочного распределения от нормального — существенным, если оно превышает первый и тем более второй порог вероятности Р0.99(см. приложение 7). В качестве примера приведем схему расчета коэффициентов асимметрии γ1 и эксцесса γ2, для данных, представленных в табл. 3.8. Для этого примера n = 104; ∑ Рxаx=- 59 ∑ Рxаx2= 1333; ∑ Рxаx3 = -2319; ∑ Рxаx4= 50965 vlx=- 0,5673; v2x= 12,8173; v3x = - 22,2981 v4x = 490,0481. По формулам при условии µ2x2 = s1x4 — 156.137 5 рассчитывают значения S 1x = (1/2)( l 2,4955) - 3,535; γ1 = -0,0192 = -0,02: γ2 = -0,0290 = -0,03. При помощи коэффициентов асимметрии и эксцесса можно непосредственно определить погрешность П (%), которая, как уже было сказано, получается из-за несоответствия друг другу эмпирических и теоретических кривых распределения [II]: Для нашего примера погрешность П = [(0,125- 0,02) + (0,058- (-0,03)] 100% = 0,42%. Коэффициенты асимметрии и эксцесса для данного вариационного ряда, а также погрешность (П<5%) показывают, что отклонения эмпирического ряда от нормального несущественны (см. приложение 6). Таким образом, зная коэффициенты асимметрии и эксцесса исследуемых антропометрических признаков, при построении размерной типологии можно определить степень отклонения распределения того или иного признака от нормального и установить, для каких признаков при расчете распределений следует применять метод логарифмической трансформации [1; 8-10; 15]. Как уже отмечалось, этот метод заключается в том, что с помощью преобразующей функции типа где х0 = const, распределение, отклоняющееся от нормального, можно привести к нормальному виду. Для функции рассчитывается средняя арифметическая величина и среднее квадратичное отклонение в логарифмических единицах. Построенная по ним теоретическая кривая нормального распределения хорошо согласуется с эмпирическим распределением частот функции. Естественно, что симметричная в логарифмической шкале теоретическая кривая (рис. 3.8, а) в абсолютной шкале становится правосторонне-асимметрич-ной (рис. 3.8, б) и учитывает таким образом скошенность эмпирического ряда. Расчеты средних арифметических величин и средних квадратичных отклонений в логарифмических единицах несложны, определенную трудность составляет расчет л(|. Расчеты, необходимые для проведения логарифмической трансформации, приводятся в приложениях 8-10.
Дата добавления: 2015-06-04; Просмотров: 2166; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |