Другие подходы к измерению надежности

⇐ Предыдущая 17 18 19 202122 23 24 25 26 Следующая ⇒

До широкого применения компьютеров вычислять коэффициент альфа вручную было долго, поэтому использовалась аппроксимация [10]. Вместо сложения всех заданий теста для получения общей оценки вычислялись две оценки: одна основывалась на всех нечетных заданиях теста, а другая - на всех четных. Полученные две оценки затем коррелировали между собой. Далее применяя формулу Спирмена-Брауна (поскольку набор четных или нечетных заданий - только половина объема полного теста) рассчитывали надежность, полученную методом расщепления. В настоящее время, по-видимому, нет весомых оснований для ее использования.

Ретестовая надежность - временная стабильность, имеет совершенно другой смысл. Как следует из названия, она проверяет, в какой степени оценки (!) черты остаются более или менее постоянными в течение времени. Большинство тестов разработано для измерения именно стабильных черт таких, как экстраверсия, способности к вычислениям или нейротизм, а в определении черты подчеркивается, что это относительно устойчивая диспозиция. Последнее предполагает, что индивидуумы должны иметь похожие оценки, когда они тестируются в двух ситуациях (например, с интервалом в несколько недель) при условии, что:

- с ними не случилось ничего значительного в интервале между двумя тестированиями (например, не было эмоционального кризиса, изменений, обусловленных развитием, или значительного образовательного опыта, который мог бы повлиять на черту);

- тест хорошо измеряет черту.

Если при первом тестировании тест показывает, что ребенок гениален, а через месяц его интеллект оказывается на среднем уровне, то либо концепция интеллекта характеризует в большей степени состояние, а не черту, либо тест несостоятелен.

Проблема, однако, заключается в том, что ретестовая надежность основывается на общей оценке, она ничего не говорит о том, как люди выполняют отдельные задания. В то время как коэффициент альфа показывает, измеряет ли набор заданий некоторую конкретную скрытую черту, прекрасную ретестовую надежность может иметь набор заданий, которые не имеют ничего общего между собой (!).

Например, если вы попросили кого-то суммировать номер своего дома, размер обуви и год рождения в двух разных ситуациях, полученная статистическая характеристика будет обнаруживать впечатляющую ретестовую надежность, хотя эти три пункта не имеют между собой ничего общего.

В связи с обсуждением понятия "ретестовая надежность" целесообразно остановиться на возможности дифференцирования таких психологических понятий как "состояние" и "черта личности" на основе статистической оценки.

Имея показатели ретестовой надежности и внутренней согласованности теста, представляется возможным математически проверить, является ли тестируемое психическое образование устойчивой личностной характеристикой или текущим состоянием. Говард Е. в своей работе [23] приводит формулу для вычисления индекса μ, по величине которого можно судить, что диагностируется данным тестом (черта личности или состояние субъекта в момент тестирования; например, тревожность как стабильная черта личности и как ситуативная характеристика).

Остер Т.Р. [24], приводит количественные данные для индекса μ, по которым можно отличить устойчивые характеристики личности от ситуативных. Если μ находится в пределах от 0,4 до 0,7, то данный тест определяет ситуативную характеристику индивида; при μ, равном 0,1-0,2, тест определяет стабильную личностную характеристику. Индекс μ вычисляется по формуле:

;

где: к - показатель ретестовой надежности теста; α - коэффициент внутренней однородности теста.

Надежность параллельных форм. Ради полноты картины следует упомянуть надежность параллельных форм. Конструкторы тестов иногда создают из набора заданий несколько тестов. Чтобы создать две параллельные формы теста, задания предъявляются большой выборке испытуемых и подбираются пары заданий со сходным содержанием и уровнем трудности.

Например, обе формы теста могут включать задание решить анаграмму из семи букв, и в обоих случаях ответом будут слова, одинаково часто встречающиеся в языке, и только около 25% выборки будут способны решить каждую из них. Одно задание будет, затем включено в форму "А" теста, а другое - в форму "Б". Эти два теста продаются отдельно, и (теоретически) несущественно, какой из них будет использоваться в определенных целях, поскольку обычно прилагаются специальные усилия, гарантирующие, что эти две версии дают одинаковое распределение оценок (и благодаря этому позволяют использовать одни и те же таблицы норм для обеих форм теста). Если оба теста измеряют одну и ту же черту, следует ожидать высокой положительной корреляции между оценками индивидуумов по двум формам теста. Эта корреляция известна как надежность параллельных форм. Однако, поскольку из-за трудностей создания, параллельные формы имеют относительно немногие тесты, она используется редко [10].

Надежность отдельных пунктов. Очевидно, что надежность теста обеспечивается надежностью пунктов, из которых он состоит. Чтобы повысить ретестовую (диахронную) надежность всего теста, надо отобрать из исходного набора пунктов (проверенных в пилотажных психометрических экспериментах) такие пункты, на которые испытуемые дают устойчивые ответы.

Для дихотомических пунктов с ответами типа "верно" или "неверно", устойчивость удобно измерять с использованием четырехклеточной матрицы сопряженности:

⇐ Предыдущая 17 18 19 202122 23 24 25 26 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2015-06-04; Просмотров: 432; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.012 сек.