КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Информативность тестов 1 страница
Информативность теста — это степень точности, с которой он измеряет свойство (качество, способность, характеристику и т.п.), для оценки которого используется. В литературе до 1980 г. вместо термина «информативность» применялся адекватный ему термин «валидность». В настоящее время информативность подразделяют (классифицируют) на несколько видов. Структура видов информации показана на рис. 4. Так, в частности, если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, тест должен обладать прогностической информативностью. Тест может быть диагностически информативен, а прогностически нет, и наоборот. Степень информативности может характеризоваться количественно — на основе опытных данных (так называемая эмпирическая информативность) и качественная — на основе содержательного анализа ситуации (содержательная, или логическая, информативность). В этом случае тест называют содержательно, или логически, информативным на основе мнений экспертов-специалистов. Факторная информативность — одна из очень частых моделей теоретической информативности. Информативность тестов по отношению к скрытому критерию, который искусственно составляется из их результатов, определяется на основе показателей батареи тестов при помощи факторного анализа. Факторная информативность связана с понятием размерности тестов в том смысле, что число факторов вынужденно определяет и число скрытых критериев. При этом размерность тестов зависит не только от числа оцениваемых двигательных способностей, но и от остальных свойств моторного теста. Когда это влияние можно частично исключить, то факторная информативность остается подвижным модельным приближением теоретической или конструктной информативности, т.е. валидности моторных тестов к двигательным способностям. Простую или сложную информативность различают по числу тестов, для которых выбран критерий, т.е. для одного или двух и более тестов. С вопросами взаимного отношения простой и сложной информативности тесно связаны следующие три вида информативности. Чистая информативность выражает степень повышения сложной информативности батареи тестов, когда данный тест включают в батарею тестов более высокого порядка. Параморфная информативность выражает внутреннюю информативность теста в рамках прогноза одаренности к определенной деятельности. Она определяется специалистами-экспертами с учетом профессиональной оценки одаренности. Ее можно определить как скрытую (для специалистов - «интуитивную») информативность отдельных тестов. Очевидная информативность в значительной степени связана с содержательной и показывает, насколько очевидно содержание тестов для тестируемых лиц. Она связана с мотивацией испытуемых. Информативность внутренняя или внешняя возникает в зависимости от того, определяется ли информативность теста на основе сравнения с результатами других тестов или на основе критерия, который по отношению к данной батарее тестов является внешним. Абсолютная информативность касается определения одного критерия в абсолютном понимании, без привлечения каких-либо других критериев. Дифференциальная информативность характеризует взаимные различия между двумя или более критериями. Например, при выборе спортивных талантов может встретиться ситуация когда тестируемый проявляет способности к двум разным спортивным дисциплинам. При этом нужно решить вопрос, к какой из этих двух дисциплин он наиболее способен. В соответствии с временным интервалом между измерением (тестированием) и определением результатов критерия различают два вида информативности - синхронную и диахронную. Диахронная информативность, или информативность к неодновременным критериям, может иметь две формы. Одной из них является случай, когда критерий измерялся бы раньше, чем тест - ретроспективная информативность. Если говорить об оценке подготовленности спортсменов, то наиболее информативным показателем является результат в соревновательном упражнении. Однако он зависит от большого количества факторов, и один и тот же результат в соревновательном упражнении могут показывать люди, заметно отличающиеся друг от друга по структуре подготовленности. Например, спортсмен с отличной техникой плавания и относительно невысокой физической работоспособностью и спортсмен со средней техникой, но с высокой работоспособностью будут соревноваться одинаково успешно (при прочих равных условиях). Для выявления ведущих факторов, от которых зависит результат в соревновательном упражнении, и используются информативные тесты. Но как узнать меру информативности каждого из них? Например, какие из перечисленных тестов информативны при оценке подготовленности теннисистов: время простой реакция, время реакции выбора, прыжок вверх с места, бег на 60 м? Для ответа на эти вопросы необходимо знать методы определения информативности. Их два: логический (содержательный) и эмпирический. Логический метод определения информативности тестов. Суть этого метода определения информативности заключается в логическом (качественном) сопоставлении биомеханических, физиологических, психологических и других характеристик критерия и тестов. Предположим, что мы хотим подобрать тесты для оценки подготовленности высококвалифицированных бегунов на 400 м. Расчеты показывают, что в этом упражнении при результате 45 с примерно 72% энергии поставляется за счет анаэробных механизмов энергопродукции и 28 % - за счет аэробных. Следовательно, наиболее информативными будут тесты, позволяющие выявить уровень и структуру анаэробных возможностей бегуна: бег на отрезках 200—300 м с максимальной скоростью, прыжки с ноги на ногу в максимальном темпе на дистанции 100-200 м, повторный бег на отрезках до 50 м с очень короткими интервалами отдыха. Как показывают клинико-биохимические исследования, по результатам этих заданий можно судить о мощности и емкости анаэробных источников энергии и, следовательно, их можно использовать в качестве информативных тестов. Приведенный выше простой пример имеет ограниченное значение, так как в циклических видах спорта логическая информативность может быть проверена экспериментально. Чаще всего логический метод определения информативности используется в таких видах спорта, где нет четкого количественного критерия. Например, в спортивных играх логический анализ фрагментов игры позволяет вначале сконструировать специфический тест, а затем проверить его информативность. Эмпирический метод определения информативности тестов при наличии измеряемого критерия. Ранее говорилось о важности использования единичного логического анализа для предварительной оценки информативности тестов. Эта процедура позволяет отсеять заведомо неинформативные тесты, структура которых мало соответствует структуре основной деятельности спортсменов или физкультурников. Остальные тесты, содержательная информативность которых признана высокой, должны пройти дополнительную эмпирическую проверку. Для этого результаты теста сопоставляют с критерием. В качестве критерия обычно используют: 1) результат в соревновательном упражнении; 2) наиболее значимые элементы соревновательных упражнений; 3) результаты тестов, информативность которых для спортсменов данной квалификации была установлена ранее; 4) сумму очков, набранную спортсменом при выполнении комплекса тестов; 5) квалификацию спортсменов. При использовании первых четырех критериев общая схема определения информативности теста следующая. А. Измеряются количественные значения критериев. Для этого необязательно проводить специальные соревнования. Можно, например, использовать результаты ранее прошедших соревнований. Важно только, чтобы соревнование и тестирование не были разделены длительным временным промежутком. Если в качестве критерия предполагается использовать какой-либо элемент соревновательного упражнения, необходимо, чтобы он был наиболее информативным. Рассмотрим методику определения информативности показателей соревновательного упражнения на следующем примере. На чемпионате страны по лыжным гонкам на дистанции 15 км на подъеме крутизной 7* регистрировали длину шагов и скорость бега. Полученные значения сравнили с местом, занятым спортсменом на соревнованиях (табл. 10). Таблица 10. Соотношения между результатами в лыжной гонке на 15 км, длиной шагов и скоростью на подъеме
Уже визуальная оценка ранжированных рядов указывает, что высоких результатов на соревнованиях добились спортсмены с большей скоростью на подъеме и с большей длиной шага. Расчет ранговых коэффициентов корреляции подтверждает это: между местом на соревнованиях и длиной шага г = 0,88; между местом на соревнованиях и скоростью на подъеме — 0,86. Следовательно, оба эти показателя обладают высокой информативностью. Необходимо отметить, что их значения также взаимосвязаны: г = 0,86. Значит, длина шага и скорость бега на подъеме — эквивалентные тесты и для контроля соревновательной деятельности лыжников можно использовать любой из них. Б. Следующий шаг — проведение тестирования и оценка его результатов. В. Последний этап работы — вычисление коэффициентов корреляции между значениями критерия и тестов. Полученные в ходе расчетов наибольшие коэффициенты корреляции будут указывать на высокую информативность тестов. Эмпирический метод определения информативности тестов при отсутствии единичного критерия. Эта ситуация наиболее типична для массовой физической культуры, где единичного критерия либо нет, либо форма его представления не позволяет использовать описанные выше методы для определения информативности тестов. Предположим, что нам необходимо составить комплекс тестов для контроля за физической подготовленностью студентов. С учетом того, что студентов в стране несколько миллионов и такой контроль должен быть массовым, к тестам предъявляются определенные требования: они должны быть просты по технике, выполняться в простейших условиях и иметь несложную и объективную систему измерений. Таких тестов сотни, но нужно выбрать наиболее информативные. Сделать это можно следующим способом: 1) отобрать несколько десятков тестов, содержательная информативность которых кажется бесспорной; 2) с их помощью оценить уровень развития физических качеств у группы студентов; 3) обработать полученные результаты на ЭВМ, используя для этого факторный анализ. В основе этого метода лежит положение о том, что результаты множества тестов зависят от сравнительно небольшого количества причин, которые для удобства названы факторами. Например, результаты в прыжке в длину с места, метании гранаты, подтягивании, жиме штанги предельного веса, в беге на 100 и 5000 м зависят от выносливости, силовых и скоростных качеств. Однако вклад этих качеств в результат каждого из упражнений неодинаков. Так, результат в беге на 100 м сильно зависит от скоростно-силовых качеств и немного — от выносливости, жим штанги — от максимальной силы, подтягивание - от силовой выносливости и т.д. Кроме того, результаты некоторых из этих тестов взаимосвязаны, так как в их основе лежит проявление одних и тех же качеств. Факторный же анализ позволяет, во-первых, сгруппировать тесты, имеющие общую качественную основу, и, во-вторых (и это самое главное), определить их удельный вес в этой группе. Тесты с наибольшим факторным весом считаются самыми информативными. Наилучший пример использования такого подхода в отечественной практике представлен в работе В.М.Зациорского и Н.В.Аверковича (1982 г.). Было обследовано 108 студентов по 15 тестам. С помощью факторного анализа удалось выявить три наиболее важных для этой группы испытуемых фактора: 1) сила мышц верхних конечностей; 2) сила мышц нижних конечностей; 3) сила мышц брюшного пресса и сгибателей бедра. По первому фактору наибольший вес имел тест - отжимание в упоре, по второму - прыжок в длину с места, по третьему — поднимание прямых ног в висе и переходы в сед из положения лежа на спине в течение 1 минуты. Эти четыре теста из 15 обследованных и были наиболее информативными. При оценке информативности конкретного теста необходимо учитывать факторы, в значительной степени влияющие на величину коэффициента информативности.
Оценка — унифицированный измеритель спортивных результатов и тестов Как правило, любая программа комплексного контроля предполагает использование не одного, а нескольких тестов. Так, комплекс для контроля за подготовленностью спортсменов включает следующие тесты: время бега на тредбане, частоту сердечных сокращений, максимальное потребление кислорода, максимальную силу и т.д. Если для контроля используется один тест, то оценивать его результаты с помощью специальных методов нет необходимости: и так видно, кто сильнее и насколько. Если же тестов много и они измеряются в разных единицах (например, сила - в кГ или Н; время - в с; МПК -в мл/кг/мин; ЧСС - в уд/мин и т.д.), то сравнить достижения по абсолютным значениям показателей невозможно. Решить эту проблему можно лишь в том случае, если результаты тестирования представить в виде оценок (очков, баллов, отметок, разрядов и т.п.). На итоговую оценку квалификации спортсменов оказывают влияние возраст, состояние здоровья, экологические и другие особенности условий проведения контроля. С получением результатов измерения или тестирования контрольное испытание спортсмена не заканчивается. Необходимо дать оценку полученным результатам. Оценкой (или педагогической оценкой) называется унифицированная мера успеха в каком-либо задании, в частном случае - в тесте. Различают учебные оценки, которые выставляет преподаватель ученикам по ходу учебного процесса, и квалификационные, под которыми понимаются все прочие виды оценок (в частности, результаты официальных соревнований, тестирования и др.). Процесс определения (выведения, расчета) оценок называется оцениванием. Он состоит из следующих стадий: 1) подбирается шкала, с помощью которой возможен перевод результатов теста в оценки; 2) в соответствии с выбранной шкалой результаты теста преобразовываются в очки (баллы); 3) полученные очки сравниваются с нормами и выводится итоговая оценка. Она и характеризует уровень подготовленности спортсмена относительно других членов группы (команды, коллектива). Не во всех случаях оценивание происходит по развернутой схеме. Иногда промежуточное и итоговое оценивания сливаются. Задачи, которые решаются в ходе оценивания, многообразны. Среди них можно выделить основные: 1) по результатам оценивания необходимо сопоставить разные достижения в соревновательных упражнениях. На базе этого можно создать научно обоснованные разрядные нормы в видах спорта. Следствием заниженных норм является увеличение числа разрядников, недостойных этого звания. Завышенные же нормы становятся для многих недостижимыми и вынуждают людей прекращать занятия спортом; 2) сопоставление достижений в разных видах спорта позволяет решить задачу равенства и их разрядных норм (несправедлива ситуация, если, предположим, в волейболе легко выполнить норму I разряда, а в легкой атлетике — трудно); 3) необходимо классифицировать множество тестов по результатам, которые показывает в них конкретный спортсмен; 4) следует установить структуру тренированности каждого из спортсменов, подвергшихся тестированию. Перевести результаты тестирования в баллы можно разными способами. На практике для этого часто используют ранжирование, или упорядочение зарегистрированного ряда измерений. Пример такого ранжирования приведен в табл. 11.
Таблица 11. Ранжирование результатов тестов
Из табл. 11 видно, что лучший результат оценивается в 1 балл, а каждый последующий — на балл больше. При всей простоте и удобстве такого подхода его несправедливость очевидна. Если взять бег на 30 м, то различия между 1-м и 2-м местом (0,4 с) и между 2-м и 3-м (0,1 с) оцениваются одинаково - в 1 балл. Точно так же и в оценке подтягивания: разница в одно повторение и в семь оценивается одинаково. Оценка проводится для того, чтобы стимулировать спортсмена на достижение максимальных результатов. Но при описанном выше подходе спортсмен А, подтянувшись на 6 раз больше, получит столько же баллов, сколько и за прибавку в одно повторение. С учетом всего сказанного преобразование результатов тестирования и оценки нужно проводить не с помощью ранжирования, а использовать для этого специальные шкалы. Закон преобразования спортивных результатов в очки называется шкалой оценок. Шкала может быть задана в виде математического выражения (формулы), таблицы или графика. На рис. 7 представлены четыре типа таких шкал, встречающихся в спорте и физическом воспитании. Первая — пропорциональная шкала (А). При ее использовании равные приросты результатов в тесте поощряются равными приростами в баллах. Так, в этой шкале, как это видно из рис. 7, уменьшение времени бега на 0,1 с оценивается в 20 очков. Их получит спортсмен, пробежавший 100 м за 12,8 с, и пробежавший эту же дистанцию за 12,7 с, и спортсмен, улучшивший свой результат с 12,1 до 12 с. Пропорциональные шкалы приняты в современном пятиборье, конькобежном спорте, гонках на лыжах, лыжном двоеборье, биатлоне и других видах спорта. Второй тип — прогрессирующая шкала (Б). Здесь, как это видно из рисунка, равные приросты результатов оцениваются по-разному. Чем выше абсолютные приросты, тем больше приставка в оценке. Так, за улучшение результата в беге на 100 м с 12,8 до 12,7 с дается 20 очков, с 12,7 до 12,6 с — 30 очков. Прогрессирующие шкалы применяются в плавании, отдельных видах легкой атлетики, тяжелой атлетике. Третий тип — регрессирующая шкала (В). В этой шкале, как и предыдущей, равные приросты результатов в тестах также уцениваются по-разному, но чем выше абсолютные прирост, тем меньше прибавка в оценке. Так, за улучшение результата беге на 100 м с 12,8 до 12,7 с дается 20 очков, с 12,7 до 12,6 с — 18 очков... с 12,1 до 12,0 с — 4 очка. Шкалы такого типа приняты в некоторых видах легкоатлетических прыжков и метаний. Четвертый тип - ситовидная (или S-образная) шкала (Г). Видно, что здесь выше всего оцениваются приросты в средней зоне, а улучшение очень низких или очень высоких результатов поощряется слабо. Так, за улучшение результата с 12,8 до 12,7с и с 12,1 до 12,0 с начисляется по 10 очков, а с 12,5 до 12,4 с — 30 очков. В спорте такие шкалы не используются, но они применяются при оценке физической подготовленности. Например, так выглядит шкала стандартов физической подготовленности населения США. Каждая из этих шкал имеет как свои достоинства, так и недостатки. Устранить последние и усилить первые можно правильно применяя ту или иную шкалу. Оценка как унифицированный измеритель спортивных результатов может быть эффективной, если она справедлива и с пользой применяется в практике. А это зависит от критериев, на основе которых оцениваются результаты. При выборе критериев следует иметь в виду такие вопросы: 1) какие результаты должны быть положены в нулевую точку шкалы? и 2) как оценивать промежуточные и максимальные достижения? Целесообразно использование следующих критериев: 1. Равенство временных интервалов, необходимых для достижения результатов, соответствующих одинаковым разрядам в разных видах спорта. Естественно, что это возможно лишь в том случае, если содержание и организация тренировочного процесса в этих видах спорта не будут резко отличаться. 2. Равенство объемов нагрузок, которые необходимо затратить на достижение одинаковых квалификационных норм в разных видах спорта. 3. Равенство мировых рекордов в разных видах спорта. 4. Равные соотношения между числом спортсменов, выполнивших разрядные нормы в разных видах спорта. В практике для оценок результатов тестирования используется несколько шкал. Таблица 12. Некоторые стандартные шкалы
Стандартная шкала (табл. 12). В ее основе лежит пропорциональная шкала, а свое название она получила потому, что масштабом в ней служит стандартное (среднеквадратическое) отклонение. Наиболее распространена T-шкала. При ее использовании средний результат приравнивается к 50 очкам, а вся формула выглядит следующим образом:
где Т— оценка результата в тесте; Х — показанный результат; Х - средний результат; — стандартное отклонение. Пример. Если средняя величина в прыжках в длину с места равнялась 224 см, а стандартное отклонение — 20 см, то за результат 222 см начисляется 49 очков, а за 266 см — 71 очко (проверьте правильность этих вычислений). В практике используются и другие стандартные шкалы. Перцентильная шкала (рис. 8). В основе этой шкалы лежит следующая операция: каждый спортсмен из группы получает за свой результат (в соревнованиях или в тесте) столько очков, сколько процентов спортсменов он опередил. Таким образом, оценка победителя - 100 очков, оценка последнего – 0 очков. Перцентильная шкала наиболее пригодна для оценки результатов больших групп спортсменов. В таких группах статистическое распределение результатов нормальное (или почти нормальное). Это значит, что очень высокие и очень низкие результаты показывают единицы из группы, а средние — большинство. Главное достоинство такой шкалы - простота, здесь не нужны формулы, а единственное, что нужно вычислить - какое количество результатов спортсменов укладывается в один перцентиль (или сколько перцентилей приходится на одного человека. Перцентиль — это интервал шкалы. При 100 спортсменах в одном перцентиле — один результат; при 50 — один результат укладывается в два перцентиля (т.е. если спортсмен обошел 30 человек, он получает 60 очков). Простота обработки результатов и наглядность перцентильной шкалы обусловили ее широкое применение в практике. Шкалы выбранных точек. При разработке таблиц по видам спорта не всегда удается получить статистическое распределение результатов теста. Тогда поступают следующим образом: берут какой-нибудь высокий спортивный результат (например, мировой рекорд или 10-й результат в истории данного вида спорта) и приравнивают его, скажем, к 1000 или 1200 Очкам. Затем на основе результатов массовых испытаний определяют среднее достижение группы слабо подготовленных лиц и приравнивают его, скажем, к 100 очкам. После этого, если используется пропорциональная шкала, остается выполнить лишь арифметические вычисления — ведь две точки однозначно определяют прямую линию. Шкала, построенная таким образом, называется шкалой выбранных точек. Последующие шаги для построения таблиц по видам спорта — Выбор шкалы и установление межклассовых интервалов — пока научно не обоснованы, и здесь допускается определенный субъективизм, основанный на личном мнении специалистов, Поэтому многие спортсмены и тренеры почти во всех видах спорта, где применяются таблицы очков, считают их не вполне справедливыми. Параметрические шкалы. В видах спорта циклического характера и в тяжелой атлетике результаты зависят от таких параметров, как длина дистанции и масса спортсмена. Эти зависимости называют параметрическими. Можно найти параметрические зависимости, которые являются геометрическим местом точек эквивалентных достижений. Шкалы, построенные на основе этих зависимостей, называются параметрическими и относятся в числу наиболее точных. Шкала ГЦОЛИФКа. Рассмотренные выше шкалы используются для оценки результатов группы спортсменов, и цель их применения заключается в определении межиндивидуальных различий (в баллах). В практике спорта тренеры постоянно сталкиваются с еще одной проблемой — необходимостью оценки результатов периодического тестирования одного и того же спортсмена в разные периоды цикла или этапа подготовки. Для этой цели предложена шкала ГЦОЛИФКа, выраженная в формуле: Смысл такого подхода заключается в том, что результат теста рассматривается не как отвлеченная величина, а во взаимосвязи с лучшим и худшим результатами, показанными в этом тесте спортсменом. Как видно из формулы, лучший результат всегда оценивается в 100 очков, худший — в 0 очков. Эту шкалу целесообразно применять для оценки вариативных показателей. Пример. Лучший результат в тройном прыжке с места — 10 м 26 см, худший — 9 м 37 см. Текущий результат —10 м ровно.
Оценка комплекса тестов. Существует два основных варианта оценки результатов тестирования спортсменов по комплексу тестов. Первый заключается в выведении обобщенной оценки, которая информативно характеризует подготовленность спортсмена в соревнованиях. Это позволяет использовать ее для прогноза: рассчитывается уравнение регрессии, решив которое, можно предсказать результат в соревновании по сумме баллов за тестирование. Однако просто суммировать результаты конкретного спортсмена по всем тестам не совсем правильно, так как сами тесты неравнозначны. Например, из двух тестов (времени реагирования на сигнал и времени удержания максимальной скорости бега) второй более важен для спринтера, чем первый. Эту важность (весомость) теста можно учитывать тремя способами: 1. Дается экспертная оценка. В этом случае специалисты договариваются, что одному из тестов (например, времени удержания V max) приписывается коэффициент 2. И тогда очки, начисленные по этому тесту, вначале удваиваются, а затем суммируются с очками за время реакции. 2. Коэффициент каждому тесту устанавливается на основе факторного анализа. Он, как известно, позволяет выделить показатели с большим или меньшим факторным весом. 3. Количественной мерой весомости теста может быть значение коэффициента корреляции, рассчитанного между его результатом и достижением в соревнованиях. Во всех этих случаях полученные оценки называются «взвешенными». Второй вариант оценки результатов комплексного контроля заключается в построении «профиля» спортсмена — графическую форму представления результатов тестирования. Линии графиков наглядно отражают сильные и слабые стороны подготовленности спортсменов. Нормы — основы сравнения результатов
Дата добавления: 2015-05-10; Просмотров: 2240; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |