Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Валидность

Оценка надежности теста

Надежность

Показатели качества теста

Анализ правдоподобности дистракторов

в заданиях закрытой формы с четырьмя ответами

№ задания Всего Распределение ответов испытуемых
1-й ответ 2-й ответ 3-й ответ 4-й ответ
кол. % Кол. % кол. % кол. %
      8,3   1,0   67,7*   22,9
      4,2   20,8   2,1   72,9*
      19,6   29,9   24,7*   25,8
      19,4   10,8   63,4*   6,5
      49,0   34,4*   9,4   7,3
      0,0   6,2   93,8*   0,0
      21,1   26,7   44,4*   7,8
      3,2   11,8   2,2   82,8*
      36,0   1,2   25,6   37,2*
      36,1   23,7   40,2*   0,0

Звездочками помечены верные ответы.

В результате дистракторного анализа выявляются задания с неработающими дистракторами (вариантами ответов в закрытом задании, которые испытуемые выбирают мало или вообще не выбирают). Если в задании есть неработающие дистракторы, то вероятность угадывания правильного ответа повышается, а следовательно снижается его трудность. Такие задания требуют переработки (замены неработающих дистракторов) или удаления их из теста. Задание №6 можно переделать в открытую форму.

Основными показателями качества теста являются надежность и валидность теста. А так как тест является инструментом педагогического измерения, то эти показатели имеют численное значение и определяются с помощью различных методов, как в классической теории тестов, так и в современной теории тестов.

Надежность – это характеристика теста, отражающая точность педагогического измерения, а также устойчивость результатов тестирования к воздействию посторонних (случайных) факторов.

Для оценки надежности нормативно-ориентированного теста: хорошим коэффициент надежности теста считается, когда показатель колеблется в пределах

0,8 < К < 1.

Нижним пределом принято считать показатель 0,7. Если значение коэффициента надежности ниже, то надежность теста считается неудовлетворительной.

Для оценки надежности нормативно-ориентированного теста используются две группы методов.

1) Двукратное тестирование:

1.1. ретестовый метод;

1.2. метод параллельных форм.

2) Однократное тестирование:

2.1. метод расщепления теста;

2.2. метод Кьюдера-Ричардсона.

Оценка надежности чаще всего строится на подсчете корреляции между двумя наборами результатов выполнения одного и того же теста или двух его параллельных форм. Чем выше корреляция, тем надежнее тест.

Оценка надежности критериально- ориентированного теста.

Если создается тест для аттестации по итогам определенной ступени обучения, то рекомендуется вычислять фи- и каппа-коэффициенты. Их величины должны быть больше 0,8 (0,85) и приблизительно равны между собой, что свидетельствует о хорошей надежности теста.

Валидность еще одна важная характеристика теста, определяющая его качество. Валидность (от англ. Validity - значимость, обоснованность, пригодность) – «это характеристика способности теста служить поставленной цели измерения», т.е. способность теста измерять то, для чего он предназначен.

Выделяют несколько видов валидности, которые отражают различные аспекты этого критерия качества теста (Анастази А.; Майоров А.Н.).

1) Содержательная валидность (content validity).

Валидность по содержанию закладывается в тест уже на этапе работы со спецификацией теста и отбора его содержания. Для педагогических тестов содержательная валидность очень важна и оценивается она экспертным путем. Независимые эксперты определяют, насколько тест охватывает область содержания проверяемого предмета.

2) Критериальная валидность.

Критериальная валидность - это характеристика теста, отражающая обоснованность, значимость его результатов по сравнению с некоторой внешней переменной (степень соответствия между результатами тестирования и внешним критерием). Для оценки критериальной валидности необходимо составить таблицу с результатами тестирования и список тех же студентов с экспертной оценкой преподавателя (-ей). В качестве критерия берем оценки преподавателей при традиционной проверке знаний без использования тестов. Критериальная валидность измеряется от –1 до 1, валидность более 0,3 считается удовлетворительной.

3) Конструктная (концептуальная) валидность.

Об этом виде валидности говорится в том случае, если представление об измеряемом феномене существует только в проекте и требует доказательства.

 

<== предыдущая лекция | следующая лекция ==>
Трудность тестовых заданий | Составление матрицы. Понятие верных и неверных профилей ответов
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 696; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.