Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Вопросы 4 страница. где т — число альтернатив




где т — число альтернатив.

Сложность тестового задания


где п — число испытуемых, способных решить задание, N — общее количество ис­пытуемых в выборке валидизации.

При W < Р невозможно определить, решена задача случайно или закономерно. Предполагается, что биноминальное распределение вероятности успешного выпол­нения тестового задания при больших N аппроксимируется нормальным.

Должны выполняться следующие условия:

1. Правильный ответ выбирается неслучайно, если:

— его экспериментально полученная частота больше 1 /т;

это превышение статистически значимо;

— оценивать его можно с помощью t -критерия Стьюдента.

2. Все ложные варианты ответов должны выбираться не чаще, чем случайные:

q = nj/N £ 1/m,

где пj частота выбора неверного ответа.

Тем самым тестовое задание стимулирует испытуемого к выбору правильного от­вета.

3. В тестах «уровня» диапазон изменения показателя сложности 0 £ W £ 1 должен быть уменьшен «слева» на величину W', значимо отличающуюся от W, в которой t = t кр. (t — критерий Стьюдента). Чем больше вариантов ответов в тесте, тем меньше Wu шире область допустимых значений показателя сложности тестово­го задания. Например, для N = 100, a = 0,05 (t кр = 1,90) и 10 > т > 3 расчет по­казывает, что уже при т > 6 скорость расширения области значений показателя сложности значимо замедляется. Поэтому рекомендуется выбирать 6–10 вари­антов ответа.

В тесте «уровня» число градаций сложности и число заданий связано. Чем точ­нее оценка свойства, тем больше число градаций. Но это влечет снижение достовер­ности измерения, так как длина теста (число заданий) ограничена. Уменьшение чис­ла градаций приведет к нивелированию различий между испытуемыми.

Предельно возможное число заданий в тесте выбирается при условии, что разли­чие в уровне их сложности гарантируется с выбранной вероятностью.


Поскольку дисперсия биноминального распределения максимальная в центре ин­тервала 0—1 и уменьшается к периферии до 0, шаг градаций сложности на разных участках этого интервала будет различным: на периферии он должен стремиться к нулю.

Удобно принять в качестве шага градации сложности 1/10 интервала. Для a = 0,05, N = 100 получается 7 значений показателя сложности, что при шаге, рав­ном 0,1, гарантирует различение между уровнями с вероятностью 0,9.

Если учесть условие минимизации случайного выбора правильного ответа, то число градаций сложности должно быть еще меньше. Например, при 6 вариантах ответа число заданий разного уровня сложности не может быть больше 6.

Эти выводы верны в том случае, если биноминальное распределение аппрокси­мируется нормальным распределением. При большом числе испытуемых такая ап­проксимация возможна.

Расчеты показывают, что минимально необходимый объем выборки для апроба­ции тестовых заданий не так уж и велик — 56 человек при достоверности 0,9.

Следовательно, исходя из вероятностной модели теста и не прибегая к допуще­ниям о моделях тестирования, можно рассчитать параметры теста как предельные характеристики, обеспечивающие достоверность измерения.




Поделиться с друзьями:


Дата добавления: 2014-11-07; Просмотров: 240; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.