Повторное тестирование (ретестирование)

⇐ Предыдущая 21 22 23 242526 27 28 29 30 Следующая ⇒

Вид коэффициента надежности

Источники дисперсии ошибок, связываемые с коэффициентами надежности

Одни

Метод расщепления на эквивалентные половины

Метод Кьюдера –Ричардсона

Метод взаимозаменяемых форм (непосредственный)

Два

Метод «тест-ретест»

Метод взаимозаменяемых форм (отсроченный)

Дисперсия ошибок

Ретестовый

Временн а я выборка

Взаимозаменяемых форм (непосредственный)

Выборка содержания

Взаимозаменяемых форм (в временн ы м интервалом)

Временн а я выборка и выборка содержания

Эквивалетных половин теста

Выборка содержания

Кьюдера-Ричардсона и альфа

Выборка содержания и неоднородность содержания

Оценщика

Различия между оценщиками

Самый очевидный и понятный м-д опр-я надежности рез-тов теста — его повторное проведение. В этом случае коэф-т надежности (r_n) просто равен корр-и между показателями, полученными теми же исп-ми в каждом из двух случаев проведения теста. Дисперсия ошибок соответствует случайным колеб-ям в выполнении заданий от одного сеанса тестир-я к другому. Эти колеб-я м. отчасти б. рез-том неконтролируемых усл-й тестир-я — таких, как резкие изменения погоды, внезапные шумы и др. отвлекающие факторы или, скажем, сломавшийся некстати карандаш. В какой-то степени они м.б. вызваны и изменениями в сост-и самих тестируемых — напр. болезнью, утомлением, эмоц. напряжением, беспокойством, недавними приятными или неприятными переживаниями и т. д. Ретестовая надежность показывает, в какой степени рез-ты теста м. распространить на различные случаи его применения. Чем выше надежность, тем менее чувствительны тестовые показатели к случайным суточным изменениям сост-я тестируемых и обстановки тестир-я.

Приводя в руководстве к тесту его ретестовую надежность, всегда следует указывать, в каком интервале времени она измерена. Поскольку ретестовые корр-и постепенно снижаются по мере увеличения этого интервала, для любого теста существует не один, а бесконечное мн-во ретестовых коэф-тов надежности. Желательно также давать некоторые сведения о событиях, происшедших за время между двумя сеансами тестирования с теми, на ком измерялась надежность теста, и касающихся их учебы, работы, семейной жизни, консульт-я, Ψтерапии и т. д.

Кроме желательности сообщения длины интервала между двумя тестир-ями, хорошо бы знать, какими соображениями направлялся выбор именно этого интервала? М. привести немало примеров тестов, надежность которых остается высокой в течение нескольких дней или недель, но спустя 10 – 15 их рез-ты уже практически не коррелируют с первоначальными. Так, многие из тестов инт-та для дошкольников дают достаточно устойчивые показатели на протяжении дошкол. периода, но совершенно бесполезны в качестве инструментов предсказания и в позднем детстве или во взр-ти. На практике, однако, чаще всего следуют простому правилу в установлении границ ретестового интервала. Обычно дисперсия ошибок тестового показателя определяется кратковременными, случайными колебаниями, происходящими в интервалах от нескольких часов до нескольких месяцев. Поэтому, при проверке этого типа тестовой надежности, стараются придерживаться небольших временных интервалов. При тестир-и маленьких детей этот период д.б. еще короче, чем у исп-х старшего возраста, поскольку в первые годы жизни связанные с возр. развитием изменения наблюдаются ежемесячно и даже быстрее. В целом, для любого типа обследуемых лиц ретестовый интервал, по-видимому, редко превышает 6 месяцев.

К-л доп. изменения в относительном выполн-и теста одними и теми же людьми, происходящие в более длит. промежутки t, уместнее относить к кумулятивным и прогрессирующим, а не к чисто случайным. Кроме того, такие изменения, вероятно, характеризуют более широкую сферу пов-я, чем та, которая проявляется при выполн-и данного теста. Так, общий ур-нь сп-ти чел-ка к обуч-ю, пониманию технич. устр-тв или искусства м. за 10 лет сущ-но измениться вслед-е каких-то произошедших с ним неординарных событий. Его статус с годами м. заметно возрасти или упасть отн-но статуса др. людей того же возраста вслед-е обстоят-в жизни дома, в школе или условий соц. окр-я, а также по таким причинам, как физич. болезнь или эмоц. расстр-во.

Степень влияния таких факторов на Ψ. разв-е чел-ка явл. важной исследоват.проблемой. Однако этот вопрос не следует смешивать с вопросом надежности конкретного теста. Напр., при измерении надежности тестов Стэнфорд—Бнне, мы обычно вычисляем корр-ю между показателями, полученными с интервалом не в 10 лет и даже не в 1 год, а в несколько недель, Конечно, с этими тестами проводились и долгосроч. ретестовые испытания, но их рез-ты обычно обсуждаются с (.) зр. предсказуемости ур-ня инт-та взр-го на основе выполн-я теста в детском возрасте, а не с точки зрения надежности конкретного теста. Понятие надежности в основном ограничивается сферой краткосроч. случайных изменений, характеризующих технические характеристики самого теста, а не тестируемую область пов-я.

Следует отметить, что различные поведенч. ff сами м. различаться по степени обнаруживаемых суточных колеб-й. Напр., на отточенности дв-й пальцев рук м. сказаться самые незначит. изменения в сост-и чел-ка, никак не влияющие на понимание им речи. Если хотят получить полную оценку хар-ра дв-й пальцев, свойственного конкретному чел-ку, то, по всей видимости, придется провести повторные тесты в течение нескольких дней; в то же t для оценки ур-ня его верб. понимания достаточно было бы одного сеанса тестир-я. Всякий раз мы д. обращаться к ан-зу целей теста и всестороннему осмыслению того пов-я, для предсказания которого предназначен данный тест.

Несмотря на кажущуюся простоту и очевидность м-ки повтор. тестир-я, ее применение к бол-ву Ψ. тестов представляет немалые трудности. Улучшение показателей как рез-т тренировки при повторении теста будет, вероятно, различным у разных людей. Кроме того, если промежуток t между первым и вторым тестир-ем достаточно мал, исп-е могут припомнить многие из своих прежних ответов. Иными словами, та же картина правильных и ошибочных ответов, вероятно, воспроизводится благодаря работе одной только памяти. След-но, рез-ты двух предъявлений теста не б. независимыми, и корр-я между ними окажется обманчиво высокой. К тому же повтор. проведение м. изменить саму сущность теста. В первую очередь это относится к задачам, требующим логич. рассужд-й или сообразит-ти. Исп-й, однажды ухватив пр-п реш-я или построив всю цепь рассужд-й, в дальнейшем может воспроизводить правильный ответ, минуя промежуточные ступени. М-ка повторного тестир-я применима только к тем тестам, на которые их повтор. проведение на одних и тех же исп-х не оказ. заметного влияния. К этой категории относится ряд моторных тестов и тестов сенсорного различения. Однако для подавляющего бол-ва Ψ. тестов эта м-ка опр-я коэф-та надежности оказ. неприменимой.

⇐ Предыдущая 21 22 23 242526 27 28 29 30 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2015-06-04; Просмотров: 2068; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.007 сек.