Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Требования к тестам

Понятие и классификация тестов.

ЛЕКЦИЯ 11.

 

Тема: Математико-статистические основы теории тестов.

 

Вопросы для рассмотрения:

 

1. Тестом называется измерение или испытание, проводимое с целью определение состояния или способностей спортсмена.

Тесты, в основе которых лежат двигательные задания, называют двигательными или моторными.

Тест, в основе которого лежат двигательные задания, называется двигательным. Существует три группы двигательных тестов:

1) Контрольные упражнения, выполняя которые спортсмен получает задание показать максимальный результат. Результатом теста является двигательное достижение. Например, время, за которое спортсмен пробегает дистанцию 100 м.

2) Стандартные функциональные пробы, в ходе которых задание, одинаковое для всех, дозируется либо по величине выполненной работы, либо по величине физиологических сдвигов. Результатом теста являются физиологические или биохимические показатели при стандартной работе либо двигательные достижения при стандартной величине физиологических сдвигов. Например, процент увеличения ЧСС после 20 приседаний или скорость, с которой бежит спортсмен при фиксируемой величине ЧСС 160 ударов в минуту.

3) Максимальные функциональные пробы, в ходе которых спортсмен должен показать максимальный результат. Результатом теста являются физиологические или биохимические показатели при максимальной работе. Например, максимальное потребление кислорода или максимальная величина кислородного долга.

2. Тестами могут считаться только те измерения, которые отвечают специальным требованиям:

1) цель тестирования;

2) стандартность (процедура и условия тестирования должны быть одинаковыми во всех случаях применения теста);

3) наличие системы оценок;

4) надежность – качество, характеризующее повторяемость результатов теста при одинаковых условиях тестирования с одними и теми же испытуемыми;

5) информативность – степень точности, с которой тест измеряет свойство, для оценки которого используется.

Тест, удовлетворяющий требованиям надёжности и информативности называется добротным.

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей (или других объектов) в одинаковых условиях. Вариацию результатов при повторных измерениях называют внутрииндивидуальной или (используя более общую терминологию математической статистики) внутригрупповой либо внутриклассовой. Четыре основные причины вызывают эту вариацию.

1) Изменение состояния испытуемых (утомление, врабатывание, научение, изменение мотивации, концентрации внимания и т.п.)

2) Неконтролируемые изменения внешних условий и аппаратуры (температура, ветер, влажность, напряжение в электросети, присутствие посторонних лиц и т.п.), т.е. все то, что объединяется термином «случайная ошибка измерения».

3) Изменение состояния человека, проводящего или оценивающего тест (и, конечно, замена одного экспериментатора другим или замена судьи).

4) Несовершенство теста (есть такие тесты, которые заведомо малонадежны, например, штрафные броски в баскетбольную корзину до первого промаха. Даже баскетболист, имеющий высокий процент попадания, может случайно ошибиться при первых бросках).

Говоря о надежности тестов, различают их стабильность (воспроизводимость), согласованность, эквивалентность.

Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом.

Степень надежности тестов определяется с помощью коэффициентов взаимосвязи, полученных из корреляционного или дисперсионного анализа.

Выбор коэффициента взаимосвязи зависит от типа применяемой шкалы измерений, от числа выполненных попыток (попыткой считается, например, исходное или повторное тестирование) и количества факторов, влияние которых надо исследовать.

Если изучается влияние только одного фактора и при этом количество попыток не более двух, то надежность теста может быть приближенно оценена с помощью коэффициента корреляции между тестом и ретестом. В остальных случаях рекомендуется использовать дисперсионный анализ.

Стабильность теста зависит от:

1) вида теста;

2) контингента испытуемых;

3) временного интервала между тестом и ретестом.

Например, морфологические характеристики при небольших временных интервалах весьма стабильны; наименьшую стабильность имеют тесты на точность движений (например, броски в цель).

У взрослых результаты тестирования более стабильны, чем у детей; у спортсменов¾более стабильны, чем у не занимающихся спортом.

С увеличением временного интервала между тестом и ретестом стабильность теста снижается.

Согласованность характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Согласованность определяется по степени совпадения результатов, полученных на одних и тех же испытуемых разными экспериментаторами, судьями, экспертами. При этом возможны два варианта:

1) лицо, проводящее тест, только оценивает его результаты, не влияя на них. Например, одну и ту же письменную работу разные экзаменаторы могут оценивать по-разному. Нередко различаются оценки судей в гимнастике, фигурном катании на коньках, боксе, показатели ручного хронометрирования, оценка электрокардиограммы или рентгенограммы разными врачами и т.п.;

2) лицо, проводящее тест, влияет на его результаты. Например, некоторые экспериментаторы более настойчивы и требовательны, чем другие, лучше мотивируют испытуемых. Это сказывается на результатах (которые сами по себе могут измеряться вполне объективно).

Согласованность теста¾это, по существу, надежность оценки его результатов при проведении теста разными людьми.

Особенно актуальна задача оценки согласованности при количественном определении качественных показателей. Для этого разработаны специальные методы.

Нередко тест выбирают из определенного числа однотипных тестов. Например, броски в баскетбольную корзину можно выполнять с разных точек; спринтерский бег может проводиться на дистанции, скажем, 50, 60 или 100 м; подтягивания можно выполнять на кольцах или перекладине, хватом сверху или снизу и т.п. В таких случаях может использоваться так называемый метод параллельных форм, когда испытуемым предлагают выполнить две разновидности одного и того же теста и затем оценивают степень совпадения результатов.

Рассчитанный между результатами тестирования коэффициент корреляции называют коэффициентом эквивалентности. Отношение к эквивалентности тестов зависит от конкретной ситуации. С одной стороны, если два или больше тестов эквивалентны, их совместное применение повышает надежность оценок; с другой¾может оказаться полезным применять только один эквивалентный тест: это упростит тестирование и лишь незначительно снизит информативность батареи тестов. Решение этого вопроса зависит от таких причин, как сложность и громоздкость тестов, степень необходимой точности тестирования и т.п.

Если же тесты, входящие в какой-либо комплекс тестов, высокоэквивалентны, он называется гомогенным. Весь этот комплекс измеряет одно какое-то свойство моторики человека. Скажем, комплекс, состоящий из прыжков с места в длину, вверх и тройного, вероятно, будет гомогенным. Наоборот, если в комплексе нет эквивалентных тестов, то все тесты, входящие в него, измеряют разные свойства. Такой комплекс называется гетерогенным. Пример гетерогенной батареи тестов: подтягивание на перекладине, наклон вперед (для проверки гибкости), бег на 1500 м.

Информативность теста - это степень точности, с какой он измеряет свойство (качество, способность, характеристику и т.п.), для оценки которого используется. Информативность нередко называют валидностью (обоснованность, действительность, законность).

Вопрос об информативности теста распадается на 2 частных вопроса:

1) Что измеряет данный тест?

2) Как точно он измеряет?

Если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности теста. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, - о прогностической информативности. Тест может быть диагностически информативен, а прогностически - нет, и наоборот.

Степень информативности может характеризоваться количественно на основе опытных данных (так называемая эмпирическая информативность) и качественно ¾ на основе содержательного анализа ситуации (содержательная, или логическая информативность). Хотя в практической работе содержательный анализ всегда должен предшествовать математическому, здесь для удобства изложения рассматриваются сначала методы расчета эмпирической информативности.

Идея определения эмпирической информативности состоит в том, что результаты теста сравнивают с некоторым критерием. Для этого рассчитывают коэффициент корреляции между критерием и тестом (и такой коэффициент называют коэффициентом информативности и обозначают rtk, где t ¾ первая буква в слове «тест»; k ¾ в слове «критерий»).

В качестве критерия берется показатель, заведомо и бесспорно содержащий то свойство, которое собираются измерять с помощью теста.

Чаще всего в спортивной метрологии критериями служат:

1) Спортивный результат.

2) Какая-либо количественная характеристика соревновательной деятельности (например, длина шага в беге, сила отталкивания в прыжках, успешность борьба под щитом в баскетболе, выполнение подачи в теннисе или волейболе, процент точных длинных передач в футболе).

3) Результаты другого теста, информативность которого доказана если проведение теста-критерия громоздко и сложно и можно подобрать другой тест, столь же информативный, но более простой. Например, вместо газообмена определять ЧСС). Этот частный случай, когда критерием является другой тест, называют конкурентной информативностью.

4) Принадлежность к определенной группе. Например, можно сравнивать мастеров спорта и спортсменов низших разрядов. Принадлежность к одной из этих групп является критерием. В данном случае используются специальные разновидности корреляционного анализа.

5) Так называемый составной критерий. Например, сумма очков в многоборье. При этом виды многоборья и таблицы очков могут быть как общепринятыми, так и заново составленные экспериментатором. Составным критерием пользуются, когда нет единичного критерия (например, если стоит задача оценить общую физическую подготовленность, мастерство игрока в спортивных играх и т.п., ни один показатель, взятый сам по себе, не может служить критерием).

При практическом использовании показателей эмпирической информативности следует иметь в виду, что они справедливы лишь по отношению к тем испытуемым и условиям, для которых они рассчитаны.

Информативность теста не всегда может быть установлена с помощью эксперимента и статистической обработки его результатов. Например, требуется подготовить билеты для экзамена или темы дипломных работ и т.д. При этом надо отобрать наиболее информативные вопросы, по которым можно точнее всего оценить знания учащихся и подготовленность к практической работе. В этом случае опираются на содержательный (логический) анализ.

 

Контрольные вопросы для самопроверки:

1. Что называют тестом?

2. Классификация двигательных тестов.

3. Требования, предъявляемые к тестам.

4. Добротность тестов.

5. Надёжность тестов.

6. Стабильность тестов.

7. Согласованность тестов.

8. Эквивалентность тестов.

9. Информативность тестов.

10. Диагностическая и прогностическая информативность.

11. Эмпирическая и логическая информативность.

12. Критерии информативности.

 

Литература:

1. Годик М.А. Спортивная метрология. Учебник для ин-тов физической культуры. – М.: Физкультура и спорт, 1988. – С. 17 – 36.

2. Спортивная метрология. Учебник для ин-тов физической культуры (под общ. ред. В.М. Зациорского). – М.: Физкультура и спорт, 1982. – С. 63 – 80/

3. Рукавицына С.Л., Волков Ю.О., Солтанович Л.Л. Спортивная метрология. Проверка эффективности методики тренировки с применением методов математической статистики. Практикум для студентов БГУФК. – Минск: БГУФК, 2006. – С. 8, 51 – 56.

 

<== предыдущая лекция | следующая лекция ==>
Доверительный интервал. Доверительная вероятность. | Лекция 13
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 2194; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.024 сек.