Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Надежность теста




 

После предварительного тестирования вычисляется коэффициент надежности по следующей формуле [7, с. 172]:

a= , (2.10)

где к – количество тестовых заданий; – квадрат стандартного отклонения для каждого тестового задания; – квадрат стандартного отклонения для «сырых» баллов всего теста.

Квадрат стандартного отклонения определяют по формуле

, (2.11)

 

где yj– «сырой» тестовый балл j-го тестируемого; My – среднее значение «сырого балла» по всему тесту; n – количество тестируемых.

Квадрат стандартного отклонения для каждого тестового задания определяют по формуле

 

= , (2.12)

где Xij – значение «сырого балла» по j-му тестовому заданию i-го тестируемого; Xicp – среднее значение «сырых баллов» по j-му тестовому заданию; n – количество тестируемых.

При необходимости быстрой оценки надежности теста применяют метод расщепления теста пополам. В этом случае все тестовые задания делятся на четные и нечетные и для каждого испытуемого вычисляют коэффициент надежности отдельно по тестовым заданиям с нечетными R1 и четными R2 номерами. Затем определяют корреляцию между R1 и R2 по формуле Пирсона (3.6) и оценивается надежность теста по коэффициенту Спирмена – Брауна, рассчитываемого по формуле

Ri= (2.13)

где - коэффициент корреляции Пирсона, характеризующий связь между двумя половинками теста – четными и нечетными заданиями.

Для вычисления коэффициента Спирмена – Брауна сформируем гипотетическую матрицу четных и нечетных тестовых заданий в табл. 2.24.

Коэффициент Спирмена – Брауна (вычисление будем выполнять с помощью приложения MS Excel) определяют в такой последовательности:

1) присваивают ячейкам, содержащим значение результатов тестирования четных заданий, «чет», а ячейкам, содержащим значение результатов тестирования нечетных заданий, «нечет» (в нашем случае эти значения находятся соответственно в столбцах с именами: Чет, R2 и Нечет., R1);

2) определяют коэффициент корреляции R12 между результатами четных и нечетных заданий с помощью функции КОРРЕЛ(чет; нечет) (значение функции для матрицы четных и нечетных заданий равно 0,9546, см. табл. 2.14);

3) определяют коэффициент Спирмена – Брауна по формуле (3.12) (значение коэффициента равно 0,9767).

По мнению многих авторов тест считается надежным, если значение коэффициента Спирмена – Брауна превышает значение 0,8. В нашем случае для гипотетической матрицы четных и нечетных заданий он равен 0,9767. Таким образом, тест является надежным.

Для подтверждения достоверности показателя надежности необходимо измерить ретестовую надежность [7, c. 177]. П. Клайн выделяет два метода измерения ретестовой надежности. В первом случае одним и тем же испытуемым предлагают две взаимозаменяемые формы данного теста. Недостатком данного метода является то, что трудно подобрать два набора заданий, которые были бы эквивалентны.

 

Таблица 2.24

Матрица четных и нечетных заданий

№ п/п Сумма баллов
  Чет R2 Нечет R1
     
     
     
     
     
     
     
     
     
     

Во втором случае испытуемым предъявляется один и то же тест при двух тестированиях. Недостатком данного метода является то, что испытуемые могут помнить свои ответы, но, если между повторными тестированиями прошло много времени, то этот недостаток, по мнению П. Клайна, незначителен. Рекомендуемый интервал времени между тестированиями – не менее шести месяцев.

Определение точности коэффициента надежности. Точность коэффициента надежности можно оценить c помощью вычисления стандартной погрешности оценивания средней взаимной корреляции заданий во всей генеральной совокупности заданий, определяемой по формуле

,
(2.14)

где - стандартная погрешность оценивания в генеральной совокупности; - стандартное отклонение корреляции заданий внутри теста; К – количество заданий в тесте.

Из формулы (2.14) видно, что по мере возрастания стандартной погрешности этой оценки возрастают различия между корреляциями, а по мере возрастания К стандартная погрешность уменьшается. Таким образом, чем больше заданий, тем больше точность оценки коэффициента надежности. Для нормального распределения 68% всех средних корреляций выборки попадают в интервал между арифметическим средним плюс-минус одна величина стандартной погрешности, 95% попадают в интервал между арифметическим средним плюс-минус две величины стандартной погрешности. Тогда, например, для стандартного отклонения, равного 0,15, по формуле (2.14) для тестов, состоящих из 10, 20, 30 заданий, получаем следующие стандартные погрешности: для теста из 10 заданий − 0,02, для теста из 20 заданий − 0,01, для теста из 30 заданий − 0,007 [7, с. 37].

 




Поделиться с друзьями:


Дата добавления: 2015-05-24; Просмотров: 1193; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.