КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Сравнение выборок
6.2.1. Значимость различия выборок. В исследованиях и при осуществлении контроля возникает необходимость сравнивать исследуемые (контролируемые) выборки между собой на предмет определения, принадлежат ли они к одной и той же генеральной совокупности или к разным. Например: тренер хочет определить сравнительную эффективность разработанной им системы развития выносливости, ее преимущество перед общепринятой системой (он, естественно, предполагает, что его система лучше общепринятой). Но это нуждается в проверке по возможности более объективным способом, который позволил бы получить веские доводы в пользу такого предположения. В качестве этого способа может быть применено сравнение выборок на значимость их различия. Нужно особо подчеркнуть: статистические методы в принципе неспособны дать твердых доказательств, их применением позволяет получить лишь вероятностные утверждения, которые могут быть использованы в качестве более или менее веских доводов «в пользу» той или иной точки зрения. В статистике все выводы и утверждения построены на вероятностной основе, и статистическое подтверждение имеет ограниченную достоверность, пропорциональную избранной в каждом конкретном случае доверительной вероятности. Для проверки эффективности методики нужно сформировать не менее 2 групп — экспериментальную и контрольную (желательно сформировать несколько экспериментальных и несколько контрольных групп, чтобы ослабить действие различных случайных и системных искажающих факторов). Эти группы должны тренироваться: контрольные — по общепринятой методике, экспериментальные —по такой же методике, но с включением предлагаемых проверяемой методикой изменений для лучшего развития выносливости: тут применяется проверяемая методика. По истечении намеченного времени по результатам в тестировании выносливости группы сравнивают. Экспериментальные и контрольные группы должны быть исходно приблизительно одинаковы по особо важным факторам и по исходному (к началу исследования) уровню выносливости, а оценить это без статистической проверки нельзя. Что значит «приблизительно одинаковы»? Это значит, что их можно считать — с удовлетворяющей нас степенью вероятности — относящимися к одной и той же генеральной совокупности, а формально — что у них может быть (такая вероятность больше заданной нами) одинаковое генеральное среднее (). Тогда говорят, что различие между ними незначимо. Если же мы выясняем, что выборки — с удовлетворяющей нас мерой вероятности (доверительной вероятностью) — принадлежат разным генеральным совокупностям, мы говорим: различие между ними значимо. Это определяют вычислением границ доверительного интервала для каждого выборочного среднего с последующим сопоставлением полученных доверительных интервалов. Отметим важное, принципиальное обстоятельство: при некоторой доверительной вероятности можно утверждать, что 2 выборки различаются значимо, но может оказаться, что при выборе большей доверительной вероятности приходится считать их различие незначимым (см. 6.2.3. и рис. 6.4). 6.2.2. Связанные и несвязанные выборки. Часто нужно определить, случайно или же принципиально различие выборок. Различают попарно связанные (связанные, сопряженные) и несвязанные (независимые) выборки. Различие между ними необходимо ясно понять. Заключается оно в следующем. Попарно связанными (связанными) называют выборки, состоящие из значений одного и того же признака, измеренного у одной и той же выборки объектов в различное время. В результате обе сравниваемые выборки состоят из сопряженных пар вариант: каждая такая пара — значения признака, измеренные у одного и того же объекта в разное время. Разделяющий эти измерения интервал времени может быть значительным, измеряясь днями, месяцами, даже годами — например, если замер признака производят в начале и в конце эксперимента. Но этот интервал времени может быть и совсем малым, равным нескольким секундам — например, при сравнении результативности 1-го и 2-го выстрелов в сериях биатлониста. Иногда считают попарно связанными выборки, где сопряженные пары — значения признаков, измеренные у очень сходных между собой в интересующем нас плане пар объектов — мы каждую пару сходных объектов как бы принимаем за один. При сравнении связанных выборок интерес представляет приращение (положительное или отрицательное) значения признака, а не его абсолютная величина. Например, если проверяется эффективность новой методики развития силы, нужно протестировать рассматриваемую группу до начала применения этой методики и через некоторое время, достаточное, по нашим расчетам, для того, чтобы убедительно проявился эффект тренировки по-новому. При этом нас интересует, насколько сильнее стали спортсмены в результате тренировки, а не какова их сила. Это отражено в процедуре сравнения: анализируют выборку попарных (в сопряженных парах) разностей вариант, при этом все уменьшаемые берутся из одной выборки, а вычитаемые — из другой. Порядок пар в выборках можно произвольно менять, но сами пары «разлучать» ни в коем случае нельзя, чтобы не исказить результаты. В основе статистической процедуры лежит образование на базе двух сравниваемых выборок одной выборки разностей в сопряженных парах. Совсем другое дело — несвязанные выборки. Они состоят из результатов измерений хотя тоже одного и того же признака, но в разных совокупностях объектов. Например: результаты в подтягивании у школьников X и XI классов, результаты в прыжка в длину у группы лыжников и группы конькобежцев, места, занятые спортсменами разных спортивных обществ на соревнованиях. В таком случае процедура основана на сравнении средних абсолютных значений вариант, то есть выборочных средних. При проведении педагогического эксперимента с участием экспериментальной и контрольной групп нужно: 1) начать эксперимент со сравнения результатов тестирования (данных измерения контрольного признака в каждой из этих групп) как 2-х несвязанных выборок, чтобы определить, можно ли считать их незначимо различающимися в рассматриваемом плане — только в таком случае можно начинать эксперимент (в противном случае нужно так скорректировать состав испытуемых в группах, чтобы различия оказались незначимыми: нельзя сравнивать изменения признаков в группах, если они исходно существенно по этому признаку различаются, так как такое исходное различие предопределяет различную реакцию и на одинаковое воздействие; 2) в завершение эксперимента группы тестируют по тому же признаку и сравнивают результаты с исходными, т.е. в каждой из групп сравнивают попарно связанные (связанные) выборки, тем самым определяя, значимо ли приращение признака; 3) сравнивая выборки приращений в экспериментальной и контрольной группах (как несвязанные выборки), определяют, значимо ли они различаются: если значимо в пользу экспериментальной группы, значит экспериментальная методика лучше использованной в контрольной группе, если незначимо — значит нет оснований полагать, что одна методика лучше другой; 4) вместо указанного в п.3 можно сравнить конечные результаты тестирования в экспериментальной и контрольной группах как несвязанные выборки, и в случае значимости различия сделать вывод о преимуществе, в случае незначимости — о недоказанности преимущества сравниваемых воздействий. Достоверность выводов из сравнения определяют по критериям значимости, их несколько для разных случаев. 6.2.3. Определение значимости различий выборок. Критерий оценивания — признак, на основании которого производят оценивание, определение, идентификацию, классификацию чего-либо, это как бы мерило того, что мы рассматриваем, или некоторое граничное значение, разделяющее качественно различные числовые значения или состояния рассматриваемого объекта. Выше уже упоминались критерии согласия. В этом разделе рассмотрены критерии значимости как средство сравнения выборок при определении степени их различия. Критерии могут быть количественными или качественными (содержательными). В статистике критерии, естественно, количественные, числовые. Значения их различны для разных уровней значимости различия (так называют принимаемую в расчете (базовую) вероятность ошибки при определении степени различия выборок). Для вероятностного определения степени различия сравниваемых выборок существуют несколько различных (по заложенным в них математическим основаниям) процедур вычисления критериев значимости: полученные расчетами их значения сравнивают с табличными и на этом основании делают выводы. Критерии значимости — числовые значения, позволяющие по результатам соответствующих вычислительных процедур, проводимых над сравниваемыми выборочными совокупностями (выборками) подтвердить либо отвергнуть выдвинутую статистическую гипотезу о значимости либо незначимости различия этих выборок, т.е. гипотезу о том, принадлежат они к одной и той же генеральной совокупности либо к разным. Выдвигается либо нулевая гипотез а (нуль-гипотеза, 0-гипотеза), которую обозначают символом Но., либо альтернативная ей. Математически нуль-гипотеза (Но) выражается предположением о том, что с некоторой выбранной нами доверительной вероятностью Р (либо вероятностью ошибки р) генеральные средние 1 и 2, соответствующие сравниваемым между собой выборкам 1 и 2, могут оказаться одинаковыми, совпасть, оказаться одним и тем же числом, то есть 1 º 2, и потому можно считать, что, поскольку у них общее генеральное среднее, выборки принадлежат к одной генеральной совокупности и различаются лишь случайно, из-за случайности выбора и значений вариант. В таком случае говорят: нуль-гипотеза (Но) подтверждается, в противном случае — отвергается. Альтернативная гипотеза — предположение о том, что с выбранной доверительной вероятностью либо вероятностью ошибки) генеральные средние сравниваемых выборок не могут оказаться равными, совпасть по значению: 1 ¹ 2, в связи с чем можно считать, что выборки принадлежат к разным генеральным совокупностям. Это тоже вероятностный вывод, и он зависит от выбранного нами значения доверительной вероятности: чем оно больше, тем больше должны различаться выборочные средние, чтобы можно было утверждать, что различие выборок значимо. Действительно: с увеличением доверительной вероятности возрастают размеры доверительных интервалов, и если при меньшей доверительной вероятности они не пересекались (что подтверждает альтернативную гипотезу — рис.6.4,а), то при большей доверительной вероятности могут пересечься (рис.6.4,б) — и подтверждается 0-гипотеза (генеральная характеристика может быть одна и та же — различие не доказано). Вычисленное значение критерия сравнивают с табличным (граничным, критическим) — со значением, определяемым по таблице выбранного критерия значимости (по традиции и сами по себе методы вычисления критериев условно называют критериями). Так 1 2 1 = или ¹ 2
Дата добавления: 2015-04-30; Просмотров: 7359; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |