Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Ретестирование




Внутренняя согласованность.

В.2. В руководстве должны быть пред­ставлены данные о внутренней согласо­ванности (гомогенности, консистентности тест). (Очень желательно.)

Комментарий. Внутренняя со­гласованность важна, если задания рас­сматриваются как выборка из относи­тельно однородного общего множества (например, тест сложения целых чисел, словарный тест для средней школы, тест, предположительно измеряющий интро-версию и т. п.). Меры внутренней согла­сованности не заменяют иных мер.

B.2.1. Оценки внутренней согласован­ности определяются соответствующими методами расщепления пополам, при по­мощи коэффициента альфа или других процедур, которые должны быть адекват­ны анализируемым данным. Любая другая мера внутренней согласованности, кото­рую автор дополнительно сообщает, в ру­ководстве к тесту должна быть подробно объяснена. (Очень желательно.)

Комментарий. Коэффициенты парного расщепления отражают суждения экспертов и обнаруживают тенденцию быть выше, чем коэффициенты случайно­го расщепления. Дисперсионный анализ обычно дает более низкие оценки по срав­нению с приемами парного расщепления. Могут быть полезными специальные ко­эффициенты: они должны быть описаны так, чтобы читатель мог понять их соотно­шение с общепризнанными оценками.

B.2.2. Оценки внутренней согласован­ности не следует вычислять для скорост­ных тестов. (Существенно.)

B.2.3. Если тест состоит из отдельно оцениваемых частей или разделов, в ру­ководстве к тесту следует сообщить кор­реляцию между частями или разделами вместе с соответствующими оценками надежности, а также с соответствующими средними и стандартными отклонениями. (Очень желательно.)

В.2.3.1. Если в руководстве сообщает­ся корреляция между баллом по отдельно­му субтесту и общим тестовым баллом, необходимо подчеркнуть, что коэффици­ент неоправданно высок, так как он ос­нован на совпадении ошибок измерения субтестом и общим тестовым баллом. (Существенно.)

В.2.4. Если несколько вопросов внут­ри теста экспериментально связаны так, что ответ на один вопрос влияет на другой вопрос, предпочтительно относить целую группу вопросов к одной из двух половин теста, когда применяются методы случай­ного или парного распределения пополам. Тот факт, что число заданий в этих поло­винах не равно, не вызывает затруднений при соответствующей процедуре анализа. (Очень желательно.)

В.З. В руководстве к тесту должны быть представлены результаты ретестирования, т. е. пользователь должен знать, насколько оценки стабильны. (Сущест­венно.)

Комментарий. Ретестовая на­дежность показывает, в какой степени ре­зультаты теста можно распространить на различные случаи его применения. Приво­дя в руководстве ретестовую надежность, всегда необходимо указывать, в каком ин­тервале времени она измерялась и какие влияния на испытуемых имели место в этот период. На практике ретестовая на­дежность в ряде случаев бывает важнее, чем надежность по однородности. Если нет ретестовой надежности, тест не может быть валидным. Исключение составляют тесты, для которых ретестирование не применяется (тесты оценки состояний, эмоций).

Считается обоснованным требовать оценивания стабильности для проектив­ных техник и других средств оценки лич­ности, даже если в некоторых случаях известно, что низкая стабильность ретестирования за существенный период отражает только истинное изменение свойства. Клиническая практика редко до­пускает, что выводы из проективных тес­тов приложимы к дню исследования. Ре­ально считается, что на основе тестовых данных принимаются прагматические ре­шения, имеющие смысл в течение как минимум нескольких дней, а обычно — недель или месяцев терапии. Если обнару­живается, что результаты некоторого те­ста очень нестабильны при интервале в не­сколько дней, это свидетельство вызывает сомнения в пригодности теста для боль­шинства целей, даже если эта изменчи­вость может быть объяснена гипотезой об изменчивости свойства. Исследователь может столкнуться с психологической ха­рактеристикой или результатом обучения, который за короткое время изменяется. В этом случае важно не смешивать неус­тойчивость свойства с нестабильностью измерения.

B.2.1. При определении стабильности баллов повторным тестированием целесо­образно использовать параллельные фор­мы теста, чтобы свести к минимуму при­поминание отдельных ответов, особенно при небольшом интервале между тестиро­ваниями. (Очень желательно.)

B.3.2. При описании исследования согласованности баллов во времени в ру­ководстве к тесту необходимо указать, ка­кой промежуток времени прошел между тестированиями, и привести средние стан­дартные отклонения баллов для каждого тестирования, а также коэффициент кор­реляции. (Существенно.)

B.3.3. Если есть основание ожидать, что тестовые баллы за некоторый период существенно изменяются в соответствии с образовательными или развивающими воздействиями, в руководстве следует предупредить пользователей об этой воз­можности. (Очень желательно.)

В.3.4. При сообщении о стабильности тестовых баллов в руководстве к тесту необходимо описать накопление соответ­ствующего опыта, обучение или лечение испытуемого за период между тестированиями. (Существенно.)




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 2470; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.