Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Понятие согласованности при тестировании




Четвертый м-д оп­р-я надежности, также использ. однократное предъявл-е единствен­ной формы теста, основан на оценке согласов-ти ответов по всем заданиям теста. На эту внутр. согласов-ть (взаимосогласо­в-ть заданий) влияют 2 источника дисперсии ошибок:

1) выборочная представленность сод-я (как в случае надежности взаимозаменяемых форм и экви­валентных половин теста)

2) неоднородность выборочной области поведения. Чем однороднее эта область, тем выше внутр.согласова-ть. Напр., если один тест включает только задания на умножение, а др. — на сложение, вычитание, умножение и деление, то первый тест, вероятно, покажет более высокую внутр. согласов-ть, чем второй. Во втором, более разнородном тесте один исп-й может лучше справиться с вычитанием, чем с другими арифм. дей-я­ми, др. покажет отн-но высокий рез-т в делении, но хуже проявит себя в сложении, вычитании и умножении, и т. д.

Более контрастным примером однород­-ти и разнород-ти м. бы служить тест, состоящ. из 40 словарных заданий, и тест, содерж. 10 словарных заданий, 10 заданий на пространств. отн-я, 10 — на арифм. рассужд-е и 10 — на скорость воспр-я. В последнем тесте связь между выполнением различных типов заданий одним чел-ком м.б. незначительной или полностью отсутствовать. Очевидно, что чем однороднее тест, тем однозначнее его рез-ты. Предполо­жим, что в последнем из только что упомянутых тестов из 40 задании Смит и Джонс получили но 20 баллов. М. ли мы заключить, что с этим тестом они справились одинаково? Вовсе нет. Смит м. правильно ответить на 10 словарных вопросов, вы­полнить 10 заданий на скорость воспр-я и не справиться ни с одним заданием на арифм. рассужд-е и пространств. отн-я. Напротив, 20 баллов Джонса м. распределиться т.о.: 5 за скорость воспр-я, 5 за про­странств. отн-я, 10 за арифм. рассужд-е и 0 за словарь.

Суммарный показатель в 20 баллов, разумеется, м.б. бы набрать путем мн-ва др. комбинаций, и тогда он имел бы совершенно иной смысл для каж­дой из таких различных комбинации. С др. ст., в более однородном словарном тесте показатель в 20 баллов, вероятно, означал бы, что исп-й правильно указал значение примерно 20 первых слов, если задания располагались в порядке воз­растания трудности. Он м. ошибиться в отн-и двух-трех сравнительно легких слов, дать правильный ответ по более трудным словам, расположенным под номерами, большими 20, но такие индивидуал. колебания ничтожны по сравнению с теми, которые обнаруживаются в более разнородном тесте.

Весьма существ. в этой связи явл. вопрос об относит. дднородн-ти (или неоднородн-ти) самого критериального признака, на предсказание кот. направлен тест. Хотя однородные тесты м. предпочитаться, потому что их пока­затели допускают довольно однозначную интерпретацию, но взятый в отдельности однородный тест, очевидно, непригоден для предсказания кранце неоднородного кри­териального признака. Более того, при предсказании неоднородного признака-крите­рия разнородность заданий теста не обязательно означала бы дисперсию ошибок. Традиц. тесты инт-та дают хороший пример неоднородных тестов, предназна­ченных для предсказания неоднородного критериального признака. В подобных случаях, однако, иногда желательно составить несколько отн-но однородных тестов, каждый из которых измерял бы различные аспекты неоднородного критери­ального признака. Тем самым однозначная интерпретация показателей теста могла бы сочетаться с адекватным охватом признака-критерия.

Самая распространенная мет-ка оценки внутренней согласов-ти б. раз­работана Кьюдером и Ричардсоном (1937). Как и в м-дах расщепления, внутр. согласов-ть нах. по данным однократного про веде­ния единств. формы теста, но вместо использ-я показателей по двум экви­валентным половинам теста эта м-ка опирается на рез-ты выполн-я каж­дого задания. Из различных формул шире др. применяется т. наз. ф-ла KR–20.

 

М. математически доказать, что коэф-т надежности Кьюдера—Ричардсона представляет собой среднее значение коэф-тов надежности частей теста, вычисляемых для всех возможных разбиений теста надвое. Обыч­ный же коэф-т надежности частей теста основан на разбиении, построенном в расчете на получение эквивалентных половин. Поэтому в случае неоднородности за­дании теста коэф-т Кьюдера—Ричардсона б. ниже коэф-та надеж­ности эквивалентных половин. След. контрастный пример поясняет, в чем при­чина такого расхождения. Допустим, мы составляем тест из 50 заданий 25 различных видов (напр., задания 1 и 2 — на понимание слов, 3 и 4 — на арифм. рассужд-е, 5 и 6—на пространств. ориентацию и т. д.). Показатели по четным и нечетным заданиям этого теста теоретически м. бы весьма тесно коррелировать др. с др., что дало бы высокий коэф-т надежности эквивалентных половин. Но однородность этого теста б. бы очень низкой в силу почти полного отсут-я согласов-ти рез-тов выполн-я всех 50 заданий. В данном примере есть все основания ожидать, что коэф-т Кьюдера—Ричардсона окажется на­много ниже коэф-та надежности эквивалентных половин теста. Фактически, разность между этими двумя коэф-тами м. служить приблизительной числовой оценкой однородности теста.

Формула Кьюдера—Ричардсона применима лишь к тем тестам, в которых выпол­н-е заданий оценивается как правильное либо ошибочное, или, в общем, по принци­пу «все или ничего». В нек. тестах, однако, практикуется более дифференцир. форма представления рез-тов отдельных заданий. Напр., в личност­ном опроснике респондент м. получить различные числовые показатели по любому конкретному пункту опросника в завис-ти от того, на какой из готовых категорий ответов он остановил свой выбор: «обычное, «иногда», «редко», «никогда». Для таких тестов была выведена обобщенная формула, известная как коэф-т альфа. Про­цедура вычислений сост. в нахождении дисперсии всех индивидуал. балльных оценок по каж. заданию с послед. суммированием этих дисперсий по всем заданиям.

 




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.