КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Повторное тестирование (ретестирование)
Вид коэффициента надежности Источники дисперсии ошибок, связываемые с коэффициентами надежности Одни Метод расщепления на эквивалентные половины Метод Кьюдера –Ричардсона Метод взаимозаменяемых форм (непосредственный) Два Метод «тест-ретест» Метод взаимозаменяемых форм (отсроченный) Дисперсия ошибок Ретестовый Временн а я выборка Взаимозаменяемых форм (непосредственный) Выборка содержания Взаимозаменяемых форм (в временн ы м интервалом) Временн а я выборка и выборка содержания Эквивалетных половин теста Выборка содержания Кьюдера-Ричардсона и альфа Выборка содержания и неоднородность содержания Оценщика Различия между оценщиками
Самый очевидный и понятный м-д опр-я надежности рез-тов теста — его повторное проведение. В этом случае коэф-т надежности (rn) просто равен корр-и между показателями, полученными теми же исп-ми в каждом из двух случаев проведения теста. Дисперсия ошибок соответствует случайным колеб-ям в выполнении заданий от одного сеанса тестир-я к другому. Эти колеб-я м. отчасти б. рез-том неконтролируемых усл-й тестир-я — таких, как резкие изменения погоды, внезапные шумы и др. отвлекающие факторы или, скажем, сломавшийся некстати карандаш. В какой-то степени они м.б. вызваны и изменениями в сост-и самих тестируемых — напр. болезнью, утомлением, эмоц. напряжением, беспокойством, недавними приятными или неприятными переживаниями и т. д. Ретестовая надежность показывает, в какой степени рез-ты теста м. распространить на различные случаи его применения. Чем выше надежность, тем менее чувствительны тестовые показатели к случайным суточным изменениям сост-я тестируемых и обстановки тестир-я. Приводя в руководстве к тесту его ретестовую надежность, всегда следует указывать, в каком интервале времени она измерена. Поскольку ретестовые корр-и постепенно снижаются по мере увеличения этого интервала, для любого теста существует не один, а бесконечное мн-во ретестовых коэф-тов надежности. Желательно также давать некоторые сведения о событиях, происшедших за время между двумя сеансами тестирования с теми, на ком измерялась надежность теста, и касающихся их учебы, работы, семейной жизни, консульт-я, Ψтерапии и т. д. Кроме желательности сообщения длины интервала между двумя тестир-ями, хорошо бы знать, какими соображениями направлялся выбор именно этого интервала? М. привести немало примеров тестов, надежность которых остается высокой в течение нескольких дней или недель, но спустя 10 – 15 их рез-ты уже практически не коррелируют с первоначальными. Так, многие из тестов инт-та для дошкольников дают достаточно устойчивые показатели на протяжении дошкол. периода, но совершенно бесполезны в качестве инструментов предсказания и в позднем детстве или во взр-ти. На практике, однако, чаще всего следуют простому правилу в установлении границ ретестового интервала. Обычно дисперсия ошибок тестового показателя определяется кратковременными, случайными колебаниями, происходящими в интервалах от нескольких часов до нескольких месяцев. Поэтому, при проверке этого типа тестовой надежности, стараются придерживаться небольших временных интервалов. При тестир-и маленьких детей этот период д.б. еще короче, чем у исп-х старшего возраста, поскольку в первые годы жизни связанные с возр. развитием изменения наблюдаются ежемесячно и даже быстрее. В целом, для любого типа обследуемых лиц ретестовый интервал, по-видимому, редко превышает 6 месяцев. К-л доп. изменения в относительном выполн-и теста одними и теми же людьми, происходящие в более длит. промежутки t, уместнее относить к кумулятивным и прогрессирующим, а не к чисто случайным. Кроме того, такие изменения, вероятно, характеризуют более широкую сферу пов-я, чем та, которая проявляется при выполн-и данного теста. Так, общий ур-нь сп-ти чел-ка к обуч-ю, пониманию технич. устр-тв или искусства м. за 10 лет сущ-но измениться вслед-е каких-то произошедших с ним неординарных событий. Его статус с годами м. заметно возрасти или упасть отн-но статуса др. людей того же возраста вслед-е обстоят-в жизни дома, в школе или условий соц. окр-я, а также по таким причинам, как физич. болезнь или эмоц. расстр-во. Степень влияния таких факторов на Ψ. разв-е чел-ка явл. важной исследоват.проблемой. Однако этот вопрос не следует смешивать с вопросом надежности конкретного теста. Напр., при измерении надежности тестов Стэнфорд—Бнне, мы обычно вычисляем корр-ю между показателями, полученными с интервалом не в 10 лет и даже не в 1 год, а в несколько недель, Конечно, с этими тестами проводились и долгосроч. ретестовые испытания, но их рез-ты обычно обсуждаются с (.) зр. предсказуемости ур-ня инт-та взр-го на основе выполн-я теста в детском возрасте, а не с точки зрения надежности конкретного теста. Понятие надежности в основном ограничивается сферой краткосроч. случайных изменений, характеризующих технические характеристики самого теста, а не тестируемую область пов-я. Следует отметить, что различные поведенч. ff сами м. различаться по степени обнаруживаемых суточных колеб-й. Напр., на отточенности дв-й пальцев рук м. сказаться самые незначит. изменения в сост-и чел-ка, никак не влияющие на понимание им речи. Если хотят получить полную оценку хар-ра дв-й пальцев, свойственного конкретному чел-ку, то, по всей видимости, придется провести повторные тесты в течение нескольких дней; в то же t для оценки ур-ня его верб. понимания достаточно было бы одного сеанса тестир-я. Всякий раз мы д. обращаться к ан-зу целей теста и всестороннему осмыслению того пов-я, для предсказания которого предназначен данный тест. Несмотря на кажущуюся простоту и очевидность м-ки повтор. тестир-я, ее применение к бол-ву Ψ. тестов представляет немалые трудности. Улучшение показателей как рез-т тренировки при повторении теста будет, вероятно, различным у разных людей. Кроме того, если промежуток t между первым и вторым тестир-ем достаточно мал, исп-е могут припомнить многие из своих прежних ответов. Иными словами, та же картина правильных и ошибочных ответов, вероятно, воспроизводится благодаря работе одной только памяти. След-но, рез-ты двух предъявлений теста не б. независимыми, и корр-я между ними окажется обманчиво высокой. К тому же повтор. проведение м. изменить саму сущность теста. В первую очередь это относится к задачам, требующим логич. рассужд-й или сообразит-ти. Исп-й, однажды ухватив пр-п реш-я или построив всю цепь рассужд-й, в дальнейшем может воспроизводить правильный ответ, минуя промежуточные ступени. М-ка повторного тестир-я применима только к тем тестам, на которые их повтор. проведение на одних и тех же исп-х не оказ. заметного влияния. К этой категории относится ряд моторных тестов и тестов сенсорного различения. Однако для подавляющего бол-ва Ψ. тестов эта м-ка опр-я коэф-та надежности оказ. неприменимой.
Дата добавления: 2015-06-04; Просмотров: 2068; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |