Понятие согласованности при тестировании

⇐ Предыдущая 23 24 25 262728 29 30 31 32 Следующая ⇒

Четвертый м-д опр-я надежности, также использ. однократное предъявл-е единственной формы теста, основан на оценке согласов-ти ответов по всем заданиям теста. На эту внутр. согласов-ть (взаимосогласов-ть заданий) влияют 2 источника дисперсии ошибок:

1) выборочная представленность сод-я (как в случае надежности взаимозаменяемых форм и эквивалентных половин теста)

2) неоднородность выборочной области поведения. Чем однороднее эта область, тем выше внутр.согласова-ть. Напр., если один тест включает только задания на умножение, а др. — на сложение, вычитание, умножение и деление, то первый тест, вероятно, покажет более высокую внутр. согласов-ть, чем второй. Во втором, более разнородном тесте один исп-й может лучше справиться с вычитанием, чем с другими арифм. дей-ями, др. покажет отн-но высокий рез-т в делении, но хуже проявит себя в сложении, вычитании и умножении, и т. д.

Более контрастным примером однород-ти и разнород-ти м. бы служить тест, состоящ. из 40 словарных заданий, и тест, содерж. 10 словарных заданий, 10 заданий на пространств. отн-я, 10 — на арифм. рассужд-е и 10 — на скорость воспр-я. В последнем тесте связь между выполнением различных типов заданий одним чел-ком м.б. незначительной или полностью отсутствовать. Очевидно, что чем однороднее тест, тем однозначнее его рез-ты. Предположим, что в последнем из только что упомянутых тестов из 40 задании Смит и Джонс получили но 20 баллов. М. ли мы заключить, что с этим тестом они справились одинаково? Вовсе нет. Смит м. правильно ответить на 10 словарных вопросов, выполнить 10 заданий на скорость воспр-я и не справиться ни с одним заданием на арифм. рассужд-е и пространств. отн-я. Напротив, 20 баллов Джонса м. распределиться т.о.: 5 за скорость воспр-я, 5 за пространств. отн-я, 10 за арифм. рассужд-е и 0 за словарь.

Суммарный показатель в 20 баллов, разумеется, м.б. бы набрать путем мн-ва др. комбинаций, и тогда он имел бы совершенно иной смысл для каждой из таких различных комбинации. С др. ст., в более однородном словарном тесте показатель в 20 баллов, вероятно, означал бы, что исп-й правильно указал значение примерно 20 первых слов, если задания располагались в порядке возрастания трудности. Он м. ошибиться в отн-и двух-трех сравнительно легких слов, дать правильный ответ по более трудным словам, расположенным под номерами, большими 20, но такие индивидуал. колебания ничтожны по сравнению с теми, которые обнаруживаются в более разнородном тесте.

Весьма существ. в этой связи явл. вопрос об относит. дднородн-ти (или неоднородн-ти) самого критериального признака, на предсказание кот. направлен тест. Хотя однородные тесты м. предпочитаться, потому что их показатели допускают довольно однозначную интерпретацию, но взятый в отдельности однородный тест, очевидно, непригоден для предсказания кранце неоднородного критериального признака. Более того, при предсказании неоднородного признака-критерия разнородность заданий теста не обязательно означала бы дисперсию ошибок. Традиц. тесты инт-та дают хороший пример неоднородных тестов, предназначенных для предсказания неоднородного критериального признака. В подобных случаях, однако, иногда желательно составить несколько отн-но однородных тестов, каждый из которых измерял бы различные аспекты неоднородного критериального признака. Тем самым однозначная интерпретация показателей теста могла бы сочетаться с адекватным охватом признака-критерия.

Самая распространенная мет-ка оценки внутренней согласов-ти б. разработана Кьюдером и Ричардсоном (1937). Как и в м-дах расщепления, внутр. согласов-ть нах. по данным однократного про ведения единств. формы теста, но вместо использ-я показателей по двум эквивалентным половинам теста эта м-ка опирается на рез-ты выполн-я каждого задания. Из различных формул шире др. применяется т. наз. ф-ла KR–20.

М. математически доказать, что коэф-т надежности Кьюдера—Ричардсона представляет собой среднее значение коэф-тов надежности частей теста, вычисляемых для всех возможных разбиений теста надвое. Обычный же коэф-т надежности частей теста основан на разбиении, построенном в расчете на получение эквивалентных половин. Поэтому в случае неоднородности задании теста коэф-т Кьюдера—Ричардсона б. ниже коэф-та надежности эквивалентных половин. След. контрастный пример поясняет, в чем причина такого расхождения. Допустим, мы составляем тест из 50 заданий 25 различных видов (напр., задания 1 и 2 — на понимание слов, 3 и 4 — на арифм. рассужд-е, 5 и 6—на пространств. ориентацию и т. д.). Показатели по четным и нечетным заданиям этого теста теоретически м. бы весьма тесно коррелировать др. с др., что дало бы высокий коэф-т надежности эквивалентных половин. Но однородность этого теста б. бы очень низкой в силу почти полного отсут-я согласов-ти рез-тов выполн-я всех 50 заданий. В данном примере есть все основания ожидать, что коэф-т Кьюдера—Ричардсона окажется намного ниже коэф-та надежности эквивалентных половин теста. Фактически, разность между этими двумя коэф-тами м. служить приблизительной числовой оценкой однородности теста.

Формула Кьюдера—Ричардсона применима лишь к тем тестам, в которых выполн-е заданий оценивается как правильное либо ошибочное, или, в общем, по принципу «все или ничего». В нек. тестах, однако, практикуется более дифференцир. форма представления рез-тов отдельных заданий. Напр., в личностном опроснике респондент м. получить различные числовые показатели по любому конкретному пункту опросника в завис-ти от того, на какой из готовых категорий ответов он остановил свой выбор: «обычное, «иногда», «редко», «никогда». Для таких тестов была выведена обобщенная формула, известная как коэф-т альфа. Процедура вычислений сост. в нахождении дисперсии всех индивидуал. балльных оценок по каж. заданию с послед. суммированием этих дисперсий по всем заданиям.

⇐ Предыдущая 23 24 25 262728 29 30 31 32 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2015-06-04; Просмотров: 478; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.007 сек.