Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Технология создания и адаптации методик




N.

Поскольку инструкция на преднамеренную фальсификацию создает условия, в которых социальная желательность суждений акцентируется, то значимыми следует считать такие высокие по модулю значения, при которых расчетное χ2 превышает теоретическое (табличное) значение χ2. Такие пункты должны быть либо полностью исключены из опросника (что редко удается), либо число "положительных" и "отрицательных" должно быть уравновешено.

Подобным образом, могут быть отобраны и пункты для шкалы лжи. Суммарный балл по шкале лжи распределяется так, как показано на графике 10.

В качестве критерия разделения испытуемых на шкале лжи выбирается такая точка, которая позволяет минимизировать ошибки типа "пропуск" (зачисление "лживых" испытуемых в число "правдивых") и ошибки типа "ложная тревога" (зачисление "правдивых" в число "лживых"). Положение критической точки на шкале можно менять в зависимости от баланса цены двух типов ошибок: в некоторых случаях "пропуск" гораздо опаснее, чем "ложная тревога" [15].

Фальсифицирующая инструкция используется также и для исследования степени "скрытности-открытости" формулировок вопросов. Например, испытуемым дается инструкция на симуляцию высокой тревожности по опроснику Тейлор. В этом случае, ответы на многие пункты значимо изменяются.

Такие пункты являются слишком открытыми - информируют испытуемого об измеряемом свойстве и позволяют ему вносить тенденциозные искажения в результаты в своих интересах.

3. Стратегия "сбалансирования социальной желательности" стала применяться с распространением факторного анализа. Ставиться цель обеспечить дискриминативную валидность теста относительно шкалы "социальной желательности". Это достигается с помощью факторного анализа корреляций между пунктами. Факторный анализ, в применении к одномерному тест-опроснику, как правило, выделяет два фактора: относящийся к самому измеряемому свойству и относящийся к социальной желательности.

Из перечисленных выше трех методов первый относится к отсеву испытуемых и требует введения в перечень вопросов для шкалы "лжи". Методы 2 и 3 позволяют отобрать только такие пункты, которые обеспечивают устранение социальной желательности. Но они, как правило, трансформируют сам конструкт, который обязательно становится ортогональным (независимым) к социальной желательности.

При необходимости диагностики свойств, обязательно коррелированных с желательностью, единственный метод состоит в применении шкал коррекции и корректирующих поправок, но и этот метод нельзя считать вполне надежным. Так что диагностика свойств, сопряженных с социальной желательностью, в ситуациях экспертизы всегда рискованна.

Однако, в ситуациях, когда сам испытуемый заинтересован в точных результатах ("ситуация клиента"), психодиагност может пользоваться опросниками, не опасаясь артефакта социальной желательности.

При подготовке особенно значимого психодиагностического обследования, в котором надо принципиально исключить всякую возможность преднамеренной фальсификации результатов, следует дополнить критерий оценки достоверности с помощью особой шкалы "лжи" еще одним критерием, основанным на использовании "фальсифицирующей" инструкции" [15]. Для этого после обычной инструкции той же самой пилотажной выборке психолог дает инструкцию: "А теперь снова выполните задание, но старайтесь описать себя так, чтобы выглядеть максимально благоприятно в глазах большинства других людей". В результате применения такой инструкции психолог получает дополнительную таблицу, содержащую фальсифицированные данные.

В таком случае кроме подсчета очень грубого индекса "желательности" () у психолога возникает возможность поэлементного сравнения ответов испытуемых на один и тот же вопрос в обычной и "фальсифицированной" диагностической ситуации. Очевидно, что недостоверным следует считать вопрос, ответы на который будут изменены в "фальсифицированной" ситуации в определенном систематическом направлении.

Здесь может пригодится простейший критерий значимости изменений основанный на распределении "хи-квадрат". Для каждого пункта строится четырех клеточная матрица сопряженности:

"ПОСЛЕ"

+ -

+ A=40 B=36

"ДО" - C=22 Д=48

 

Здесь в клеточке А указана частота сохранения ответа "верно" на некоторый i-тый вопрос (например, из 76 ответивших "верно" таких оказалось только 40 испытуемых), в клетке В - частота изменения ответа "верно" на ответ "неверно" и т.п. Как видим, в этом примере показано, что смена инструкции привела к значительным изменениям.

Для оценки значимого направления этих изменений используется критерий Макнимара, который предложил сравнивать между собой по критерию хи -квадрат только элементы В и С этой таблички:

 

где - вычисленное эмпирическое значение статистики хи-квадрат с одной степенью свободы. Для нашего примера = 2,91, что ниже, чем граничное значение χ2 = 3,84, и, следовательно, нулевая гипотеза об отсутствии значимых направленных изменений не может быть отвергнута - пункт не является значимо нагруженным артефактным фактором социальной желательности и может быть включен в диагностический вариант тест-опросника без изменений.

По результатам такого исследования удобно составить таблицу К х 2: в первом столбце - показатели корреляции пунктов со шкалой лжи, во втором - показатели значимости изменений при переходе к фальсификации. Безусловно достоверными можно считать только те пункты, которые не получили значимых коэффициентов ни в первом ни во втором столбце.

Если таких пунктов оказывается слишком мало для составления надежной шкалы и если среди недостоверных пунктов достаточно много таких, которые обладают существенной внутренней (корреляция с суммарным баллом по основной шкале) или внешней (корреляция с критерием) валидностью, то следует прибегнуть к тактике балансирования: ввести в основную шкалу поровну "прямых" и "обратных" пунктов по шкале "социальной желательности" так, чтобы все четыре квадранта были заполнены пунктами равномерно (среди "прямых" по основной шкале было бы поровну "прямых" и "обратных" по "желательности", и среди "обратных" по основной - также поровну) [15].

Без указанных предосторожностей тест-опросник неизбежно будет давать систематические искажения результатов всякий раз, когда испытуемый будет квалифицировать диагностическую ситуацию как ситуацию экспертизы.

Другой путь - управление процессами категоризации в ходе самой диагностики. В так называемой "репертуарной модификации" теста-опросника испытуемому специально предлагают выполнять тест не только от своего имени, но и от имени определенного репертуара ролей - "большинство людей", "моральный человек", "преуспевающий человек" и т.п.

Однако применение таких методов требует сложной компьютерной обработки, а, следовательно, не всегда доступны.

Контрольные вопросы для самопроверки: §9. Достоверность теста.

1. Что понимается под достоверностью методики?

2. Какие основные факторы влияют на достоверность данных самоотчета?

3. Какие методы необходимо применить, для того чтобы существенно повысить достоверность методики?

4. Как определить ту критическую точку на "шкале лжи", при которой суммарный балл, набранный испытуемым по этой шкале, позволяет не браковать протокол по всему тесту?

5. В чем суть стратегии "сбалансирования социальной желательности"?

 

Литература к теме.

1. Анастази А. Психологическое тестирование. В 2-х кн. М., 1982.

2. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Изд-во "Питер", 1999. - 528 с.

3. Общая психодиагностика / Под ред. А. А. Бодалева, В. В. Столина.- М., 1987.

4. Основы психодиагностики / Под ред. А. Г. Шмелева. Ростов-на-Дону., 1996.

 

 

Рассмотрим некоторые аспекты целостной стратегии конструирования, эмпирической апробации и внедрения методики в практику [15]. В реальном случае создание оригинальной методики или адаптация зарубежной методики не могут сводиться только к проверке (или перепроверке) отдельных психометрических свойств - репрезентативности, надежности, валидности, достоверности - в произвольной последовательности. В одних случаях целесообразно начинать с одного, в других - с другого этапа работы.

По существу любая реальная ситуация использования теста не является ситуацией только "конструирования" или "применения". Можно без преувеличения сказать, что существует континуум между крайними полюсами:

"создание"------------ "применение"

и каждая ситуация до определенной ступени удалена от обоих полюсов. Трудно назвать такой случай, когда бы конструирование совершенно нового теста начиналось "с нуля", "на пустом месте". Также трудно найти и такие случаи, когда все аспекты тестирования были бы полностью неизменными и воспроизводили бы уже совершенно исследованную нормативную ситуацию применения готового теста.

Однако на практике, все многообразие ситуаций, всю комбинаторику независимых параметров психологи, как правило, пытаются свести к двум-трем типовым ситуациям [15].

1. Ситуация применения. Тест кем-то разработан (возможно, в других социокультурных условиях), известны тестовые нормы, полученные на представителях данной языковой культуры (несоответствие выборки стандартизации и выборки применения по половозрастной структуре и профессионально-культурным признакам признается несущественным).

2. Ситуация адаптации. Тест кем-то разработан - проверены надежность и валидность, но отсутствуют тестовые нормы (как правило, отсутствуют вообще для любых представителей данной языковой культуры). Задача адаптации сводится, таким образом, к построению тестовых норм.

3. Ситуация создания. Есть концепция психического свойства, но нет "подходящей" процедуры его измерения, удовлетворяющей требованиям места, времени, возможностям количественного анализа и ограничениям прочих ресурсов. Необходимо разработать измерительную процедуру, проверить ее надежность, валидность, построить тестовые нормы.

Но уже к середине 80-х годов стала совершенно очевидна несостоятельность такой упрощенной системы представлений.

Прежде всего остановимся на вопросах адаптации "переводных" тестов. Данный путь быстрого пополнения репертуара методик кажется многим психологам наиболее экономичным, кратчайшим к надежной и валидной психодиагностике.

Однако, если при этом адаптация сводится только к построению нормативного распределения тестовых баллов, то это означает, что валидность и надежность адаптированной методики в новых условиях принимаются на веру, а теоретическая концепция автора теста и содержание использованных им критериев валидности просто переносятся в наши условия без изменений (ведь для любой, в том числе и для невалидной и ненадежной методики, можно получить распределение).

Подобный перенос дает пренебрежимые погрешности только для тестирования относительно элементарных психических свойств (таких, как свойства нервной системы, функциональные состояния, сенсомоторные параметры, элементарные когнитивные функции, т. е. структурно-динамические характеристики психической деятельности), причем с использованием объективных процедур (психофизиологическая регистрация, тесты с "физическими" критериями успеха и т. п.).

При тестировании интегральных психических свойств личности и индивидуального сознания (черты, мотивы, установки, самооценка, общие способности, стиль общения, ценностные ориентации, интересы и т. п.), а также употреблении любых лингвистических средств в самой процедуре тестирования, - во всех этих случаях ограничиваться только сбором тестовых норм при адаптации недопустимо!

Требуется серьезная эмпирическая работа по проверке надежности и валидности в новых социокультурных условиях, работа, фактически соответствующая по своему объему созданию оригинальной методики.

С этой точки зрения заимствование зарубежных диагностических тестов способностей, черт характера, интересов и т. п. вовсе не оказывается кратчайшим путем к психодиагностике. Рассмотрим в качестве примера необходимые этапы эмпирико-статистической работы при адаптации многомерного переводного тест-опросника [15].

1. Анализ внутренней валидности, внутренней согласованности пунктов, из которых состоит тест-опросник. Этот анализ совершенно необходим, если в зарубежной методике он применялся в качестве средства самого конструирования методики. Этот анализ призван показать, что некое (еще неясно какое именно) общее диагностическое свойство, "лежащее на пересечении всех эмпирических индикаторов", действительно существует.

Такой анализ обязателен по отношению ко всем тестовым шкалам, полученным с помощью факторного анализа, например к тест-опросникам Айзенка EPI и 16РF Кеттелла. В то время, как к опроснику "локус контроля" или ко многим основным клиническим шкалам MМPI требование внутренней согласованности применять необязательно, поскольку пункты в эти шкалы подбирались по внешнему критерию и не связаны в один фактор. Анализ внутренней согласованности может быть применен и к одномерным, и к многомерным тестам.

2. Проверка устойчивости к перетестированию. Совершенно необходима при диагностике свойств, по отношению к которым теоретически ожидается инвариантность во времени.

Анализ ретестовой надежности может быть (так же как анализ надежности - согласованности) совмещен с исследованием информативности отдельных пунктов теста, а также, возможно, и устойчивости отдельных пунктов. Без сведений о ретестовой надежности психолог не имеет права использовать тест для построения любого элементарного статического экстраполирующего прогноза.

3. Анализ корреляций с релевантным внешним критерием. Этот этап адаптации совершенно необходим, если тест разрабатывался изначально как критериально-ориентированный, т. е. отбор пунктов производился на основании их корреляций с каким-то критерием валидности. Например, подобная работа проделана для сокращенной модифицированной версии MMPI коллективом Ф. Б. Березина.

4. Рестандартизация тестовых норм. До недавнего времени только этот этап работы по адаптации тестов признавался всеми психологами как необходимый. Но и в этом случае далеко не всегда воспроизводилась необходимая статистическая работа по проверке устойчивости полученного распределения тестовых баллов к расщеплению выборки.

5. Проверка воспроизводимости структуры отношений между шкалами является специфичным этапом для многомерных тестов. Например, для теста Айзенка принципиальна ортогональность, статистическая независимость факторов "экстраверсия - интроверсия" и "нейротизм - эмоциональная стабильность". На воспроизводимости структуры связей шкал между факторами 16PF основывается корректность подсчета вторичных факторов [13].

Пять указанных этапов адаптации позволяет убедиться в том, что адаптация зарубежных тестов мало чем уступает по объему эмпирико-статистической работы конструированию оригинальных методик.

Несколько другие задачи ставит перед психологом ситуация "внутрикультурного переноса" теста на новую популяцию, отличающуюся от выборки стандартизации половозрастными или профессионально-культурными особенностями. В этом случае необходимо [15]:

1. Проверить валидность методики, если методика чувствительна по своему содержанию к профессиональной или региональной специфике (могут ли отвечать пенсионеры, или школьники, или жители отдаленных регионов на вопросы, подразумевающие типичные ситуации из жизни студента, обучающегося в крупном городе европейской части?). Для того надо выбрать по возможности максимально экономичную процедуру проверки валидности. Размеры выборки в эксперименте по проверке валидности должны быть таковы, чтобы можно было бы надеяться на получение статистических значимых связей между тестовым показателем и критерием валидности (это, как правило, не менее 30 испытуемых).

Если результаты проверки валидности оказываются неудовлетворительными (коэффициент корреляции явно ниже 0,5 и дальнейшее наращивание выборки все равно не оправдает применение теста со столь низким показателем валидности), то по собранным результатам следует произвести простейший "анализ пунктов" - посмотреть, не оказались вторые пункты явно неинформативными (все испытуемые отвечают одинаково), не оказались ли некоторые вопросы явно бессмысленными и слишком "прямыми", социально значимыми в данной ситуации. Не исключено, что при удалении неудачных пунктов из подсчета тестового балла необходимая валидность будет обнаружена.

В отсутствие доступного внешнего критерия необходимо прибегнуть к проверке внутренней валидности методики.

2. Проверить соответствие тестовых норм. Только после позитивного результата в проверке валидности целесообразно расширять тестовых баллов.

Квантили этого распределения необходимо сравнить с квантилями нормативного распределения: если расхождения оказываются пренебрежимыми (например, не превышают ошибки измерения), то можно принять вывод о приложимости к данной популяции универсальных тестовых норм. Однако на практике чаще возникают значимые отличия.

В этом случае психолог должен построить так называемые "частные" тестовые нормы.

Подчеркнем, что абсолютное большинство ситуаций, которые обычно расцениваются как ситуации "применения", на самом деле являются ситуациями более или менее серьезного "внутрикультурного переноса". Именно эти обстоятельства предопределяют высокий уровень требований к психометрической подготовке психологов-психометристов [15].

При создании новых диагностических методик решающее значение имеют методологическая ориентация и статус психолога.

Под статусом в данном случае понимаются существенные различия в нормативных (закрепленных в должностных инструкциях) требованиях к продукту деятельности психолога, работающего в исследовательском учреждении; и психолога, работающего в практическом учреждении.

Если в первом случае психолог имеет право считать своим "конечным продуктом" внутрипсихологическую валидизацию сконструированной методики, то во втором случае он, как правило, обязан обеспечить практическую эффективность своей психодиагностической программе - указать на статистически значимую связь результатов диагностики с величиной какого-то социально ценного показателя - критерия, а затем построить на основе этой связи психологическую концепцию "вмешательства" в ситуацию с целью ее изменения в желаемом направлении.

Эти изначальные различия в статусе психолога-исследователя и психолога-практика предопределяют оправданные различия в стратегии конструирования тестов и тестовых батарей.

Для психолога-исследователя ведущая ценность - это теоретическая обоснованность и эмпирическая однозначность диагностического конструкта, которую он достигает с помощью оправданной ориентации на конструктную валидизацию.

У исследователя хватает ресурсов для того, чтобы обеспечить множественность разнообразных по своему статусу критериев валидности - от субъективных оценок валидности включенных наблюдателей (L -данные по Кеттеллу) до экспериментального моделировании реальных ситуаций проявления измеряемого свойства (Т-данные по Кеттеллу).

Для психолога-практика ведущая ценность - это эффективность, пусть даже она будет достигнута с помощью теоретически "эклектичного" инструмента - эмпирического средства, не имеющего соответствующего научно-строгого конструкта [15].

Появление подобных прагматических тестов, очевидно, обусловлено действием объективного социально-исторического механизма, который можно было бы кратко назвать "опережающим запросом практики". Этого феномена не было бы, если бы все запросы практики можно было бы заранее предвидеть и рационально планировать, подготавливая релевантные научно обоснованные диагностические процедуры.

Но такие предвидение всегда удается осуществить лишь в какой-то мере - реальная практика тем и отличается от дедуктивного движения в плоскости абстракций, что всегда приводит к столкновению с новыми и неожиданными явлениями, что обусловливает и появление новых методик.

Большинство ценных прагматических тестов становятся в дальнейшем предметом для изучения со стороны психологов-исследователей, апостериорно реконструирующих научную концепцию валидности этих тестов, что значительно улучшает их характеристики и активизирует сферу применения. Психодиагностика как специфический институт, реализованный в форме управляющего кольца "наука - практика - наука - практика...", достигнет оптимальных режимов в своем функционировании, если любые попытки конструирования и применения любых тестов, будут тщательно документироваться, будут доступны для повторения в любом звене (исследовательском или практическом) психологической службы.

При обеспечении эффективной информационной базы, оперативных форм информационной связи между звеньями этой системы (как методическими, так и практическими) всякое практическое применение тестов станет одновременно и работой по конструированию - по подготовке новых, пересмотренных версий методик - как со стороны психометрики, так и со стороны теории.

Итак, при создании нового теста психолог должен придер­живаться определенного алгоритма действий [13]. Рассмотрим коротко его суть. Алгоритм создания нового теста сводится к следующим основным этапам:

— формирование информационной базы исследования;

— конструирование интегральных показателей;

— классификация испытуемых на однородные группы.

Формирование информационной базы исследования. Сфор­мировать информационную базу для создания теста - это зна­чит выделить систему признаков (характеризующих измеряемый психический феномен), построить на их основе «пробный» вариант теста и с его помощью провести пилотажное исследо­вание.

При этом наиболее сложной и трудно формализуемой час­тью этого этапа является выявление системы исходных призна­ков, т. к. предмет измерения изначально определяется, как пра­вило, в довольно общем виде. Как отмечает Л. Т. Ямпольский [13], наилучшим основанием для содержательной разработки предмета тестирования является наличие хорошо развитой пси­хологической теории (что в психологии бывает довольно ред­ко). В связи с этим, конечным результатом содержательного анализа должно быть четкое вербальное определение анализи­руемого конструкта и расчленение его на составные части.

После этого переходят к поиску системы признаков, реле­вантно отражающих основное содержание конструкта. Систе­ма признаков должна удовлетворять следующим общим требо­ваниям:

- полнота описания - система должна охватывать все ас­пекты измеряемого понятия;

- экономичность описания - требование, которое дик­туется временными ограничениями, трудностями сбора, обра­ботки и анализа больших по объему массивов данных;

- четкая структурированность системы признаков - при­знаки должны группироваться достаточно равномерно относи­тельно ранее выделенных аспектов измеряемого понятия;

- количественная определенность отбираемых призна­ков - признаки должны допускать последующую формали­зацию (математическую обработку).

На основе этих требований должен быть составлен список заданий (пунктов) и создан первоначальный вариант теста.

Поскольку качество отдельных заданий (вопросов, утверждений) является определяющим для всего опросника, рассмотрим трудности, возникающие при формулировании заданий, а также преимущества различных типов заданий.

При разработке заданий для личностных опросников необходимо учитывать следующие проблемы, которые, если их не обойти, неизбежно приведут к низкой валидности тестов [8].

1. Установка на согласие. Это тенденция испытуемого соглашаться с утверждениями или отвечать на вопросы "да" независимо от их содержания. Чаще всего проявляется, когда утверждения (вопросы) неоднозначны и неопределенны.

2. Установка на социально одобряемые ответы. Это тенденция испытуемых отвечать на вопросы теста так, чтобы выглядеть "социально положительным": если возможен "социально желательный" ответ, то весьма вероятно, что испытуемые будут его давать. Эта установка оказывает, в частности, влияние на результаты теста ММРI.

3. Установка на неопределенные или средние ответы. Если в опроснике представлена средняя категория ответов, отражающая нерешительность или неуверенность в ответе (например, "не уверен", "не знаю", или "затрудняюсь ответить"), то многие испытуемые склонны к ней прибегать, как к безопасному компромиссу. Это приводит к снижению валидности заданий, поскольку большинство методов анализа вопросов основывается на крайних значениях показателей.

4. Установка на "крайние" (расположенные по краям шкалы) ответы. Эта установка может проявляться при использовании многоэлементной рейтинговой шкалы. Некоторые испытуемые, независимо от содержания вопросов, предпочитают выбирать крайние ответы.

5. Выборка из генеральной совокупности вопросов. В тестах интеллекта и специальных способностей относительно легко убедиться в том, что задания принадлежат или с высокой степенью вероятности выглядят принадлежащими к подразумеваемой для них генеральной совокупности. Лингвистические задания нелегко перепутать с математическими или какими-либо другими. Однако, в области особенностей диагностики личности и темперамента все гораздо сложнее.

В самом деле, иногда даже опытные разработчики вопросов обнаруживают, что вопросы нагружены не теми факторами, для выявления которых они были созданы или, что вопросы вообще не нагружены ни одним из факторов. Эта проблема с точки зрения классической теории тестов состоит в трудности определения конкретной выборочной совокупности вопросов. В результате возникает проблема подбора адекватной выборки из выборочной совокупности вопросов или утверждений для теста, а без этого тест не может быть валидным.

6. Выборка из генеральной совокупности испытуемых. Известно [8], что в личностных тестах труднее обеспечить адекватность выборки из выборочной совокупности, чем в тестах способностей. При использовании тестов способностей обычно известна вполне определенная категория лиц (популяция), для которой данный тест предназначен, и таким образом, по крайней мере, в принципе, можно эффективно подбирать выборки.

В личностных тестах, в отличие от тестов, разрабатывающихся для испытуемых с той или иной патологией, в идеале нужны выборки из общей популяции (т.е. всего населения страны), в которой встречаются все возможные показатели. Такие выборки, как показано, должны быть большими, и их обычно трудно получить.

7. Проблемы в установлении адекватного критерия валидности. Существует, как отмечалось выше в разделе о валидности, значительная трудность в нахождении адекватного критерия. Например, если мы пытаемся измерить авторитаризм, то будем вынуждены полагаться на рейтинги, поскольку нет никаких других внешних мерил (в отличие от, например, школьных экзаменов в случае диагностики способностей). Рейтинги - это неадекватный инструмент, а если бы они подходили, тест был бы не нужен. Аналогично, если существуют высокоэффективные тесты авторитаризма, которые могут быть использованы в качестве критерия валидности, вероятно, в новом тесте нет необходимости.

Таковы основные сложности, возникающие при конструировании личностных опросников, и следует отчетливо их себе представлять, прежде чем приступать к формулированию вопросов или утверждений. Две последние проблемы, хотя они и являются определяющими, выходят на первый план уже после того, как подобраны задания теста.

Рассмотрим далее основные принципы формулирования вопросов (утверждений) для личностных опросников.Как отмечается [8], для тестов личности имеет большое значение то, чтобы ответы на вопросы могли быть объективно и с высокой надежностью оценены. Прежде всего, этого необходимо добиваться путем разработки формы вопросов. Ниже приведены формы вопросов, используемых опросниках, которые оказались наиболее эффективными на практике.

1. Вопросы с ответом типа "да-нет". Такие вопросы легко формулировать, они понятны испытуемым и ответы на них даются быстро. Такова, например, форма вопросов личностных тестов Айзенка. Типичный дихотомический вопрос: "Вам нравятся шумные компании?"

2. Вопросы с ответами типа "да - не знаю - нет", "да-затрудняюсь ответить - нет". Это вариант вопросов типа "да-нет", описанных выше, с добавлением категории неопределенности, потому что некоторые испытуемые становятся раздражительными и несговорчивыми, если их заставляют отвечать либо "да", либо "нет" на вопросы, в ответах на которые они не очень уверены.

Трудность с такими вопросами состоит в том, что эта "средняя" категория очень привлекательна для испытуемых, однако редко бывает информативной. Практика показала, что дихотомические вопросы более предпочтительны, поскольку они заставляют преодолевать нежелание делать выбор.

3. Альтернативные задания (с ответами типа "правда-ложь"). Эти задания состоят из утверждений (часто от первого лица), которые испытуемые должны отметить как верные или неверные для них. Примером альтернативного задания является: "Я ненавижу втискиваться в переполненный автобус". Это форма утверждений, используемая в ММРI. По существу, она ненамного отличается от дихотомических вопросов, хотя формулирование их как альтернативных утверждений, а не как дихотомических вопросов, может до некоторой степени повлиять на языковую представленность задания.

4. Задания с ответами типа "нравится - не нравится" (одно слово или фраза). Испытуемые должны указать, нравится им предложенное или не нравится. Такой тип заданий чаще всего применяется в проективных методиках, однако, он может оказаться чрезвычайно полезным, хотя и необычным, и в обычных тестах-опросниках.

5. Задания с рейтинговыми шкалами. Эти задания состоят из предложений, к которым прилагаются рейтинговые шкалы. В них преодолеваются трудности, связанные с коррелирующими дихотомическими заданиями и испытуемым они кажутся более разумными, чем дихотомические задания, хотя и в этом случае, может проявиться установка на крайние ответы. Чаще всего используются две семибалльные шкалы, крайними значениями которых являются: "всегда-никогда" и "определенно да - определенно нет", в зависимости от формулировки задания. Типичным примером может быть: "Мне нравится смотреть мелодраматические фильмы: всегда, очень часто, часто, от случая к случаю, редко, очень редко, никогда". Очевидной проблемой для этой шкалы является различная интерпретация индивидуумами терминов частоты.

6. Разнообразные трихотомические задания. В действительности это варианты трихотомической формы вопроса типа "да-нет" (тип 1 в данном списке). Их использует тогда, когда они более подходят по смыслу в отношении некоторых утверждений, чем "да - затрудняюсь ответить - нет". Примерами трихотомий являются: "обычно - иногда - никогда", "верно - не знаю - неверно", "согласен - не уверен - не согласен ". Эти варианты предоставляют большую гибкость при формулировании заданий, чем жесткие формы типа "да-нет" (дихотомическая) или альтернативные.

7. Трихотомические задания с выбором. Это варианты типа (6), позволяющие вложить в лаконичную форму задания почти любую мысль. В них используются три завершающих предложение фразы, одну из которых испытуемый должен выбрать. Вот типичный пример: "Когда мне нечего делать, я могу: (а) позвонить другу, чтобы поболтать; (б) заняться разгадыванием трудного кроссворда; (в) пойти на джазовый концерт".

8. Другие формы. Основные типы заданий, описанные в пунктах (1) - (7), - это те, которые в основном используются в наиболее известных личностных опросниках. Все они, с точки зрения формы (в отличие от содержания), довольно легко формулируются, лаконичны, просты в работе, а также для подсчетов.

Удовлетворение этим требованиям обеспечивает содержа­тельную валидность теста. По другому говоря, содержательная валидность должна рассматриваться лишь как начальный этап в конструировании теста.

Конструирование интегральных показателей (шкал). На этом этапе решаются две основных подзадачи:

- оценка того, насколько удачно исходная система при­знаков описывает содержание измеряемого свойства;

- на базе отобранных признаков строится обобщающий показатель.

Обобщающий (интегральный) показатель представляет из себя, по сути, «шкалу», «ось» или «фактор», который содержит в себе весь континуум многообразных оценок по всем пунктам теста.

Эти две подзадачи решаются по-разному, в зависимости от того, имеется ли в наличии какой-либо внешний критерий или нет. При наличии такого внешнего критерия, интеграль­ный показатель может быть построен с помощью регрессион­ного анализа, причем уравнение регрессии связывает внешний критерий с исходными признаками.

Если внешний критерий отсутствует (что бывает наиболее часто), то используют метод факторного анализа. Именно с его помощью можно все множество первоначальных показателей свести к минимальному количеству основных факторов.

Классификация испытуемых на однородные группы. Эта задача возникает в связи с необходимостью сравнения испыту­емых по уровню выраженности психических свойств. Прежде всего встает вопрос о том, какие различия можно считать суще­ственным, а какими можно пренебречь. Здесь же решается и вопрос об уровнях развития исследуемого свойства у испы­туемых.

Группировка испытуемых может быть осуществлена с по­мощью алгоритма автоматической классификации [подробнее см. 13, стр. 201], который предназначен для выделения фиксиро­ванного числа классов, задаваемого психологом, исходя из со­держательных соображений и вида распределения значений интегральных показателей.

После классификации каждому испытуемому может быть приписано число в соответствии с номером класса, к которому он был отнесен по индивидуально набранному баллу.

От одномерных классификаций довольно просто перейти к многомерной классификации испытуемых. Для этого все вы­деленные интегральные показатели объединяются на одном графике в «профиле». Подобный способ представления данных позволяет легче воспринять и интерпретировать полученные данные [13].

Контрольные вопросы для самопроверки: §10. Технология создания и адаптации методик.

1. Какие основные ситуации встречаются при работе с тестами? Охарактеризуйте кратко суть каждой из них.

2. Назовите основные этапы эмпирико-статистической работы, которые необходимы при адаптации многомерного переводного тест-опросника.

3. Какие главные факторы необходимо учитывать при создании новых психодиагностических методик?

4. Какие основные проблемы возникают при разработке личностных опросников?

5. Дайте краткую характеристику основным видам ответных шкал, которые используются при разработке личностных опросников?

 

Литература к теме.

1. Анастази А. Психологическое тестирование. В 2-х кн. М., 1982.

2. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Изд-во "Питер", 1999. - 528 с.

3. Гусев А. Н., Измайлов Ч. А., Михалевская М. Б. Измерение в психологии: общий психологический практикум. М.: Смысл, 1997. -287 с.

4. Дружинин В.Н. Экспериментальная психология: Учебное пособие - М.: ИНФРА-М, 1997. - 256 с.

5. Мельников В.М., Ямпольский Л.Т. Введение в экспериментальную психологию личности: Учеб. Пособие для слушателей ИПК преподавателей пед. дисциплин и пед. ин-тов. - М.: Просвещение, 1985. - 319 с.

6. Общая психодиагностика / Под ред. А. А. Бодалева, В. В. Столина.- М., 1987.

7. Практикум по экспериментальной и прикладной психологии / Под ред. А.А. Крылова. - Л.: Изд-во ЛГУ, 1990, 272 с.

8. Практическая диагностика. Методики и тесты. Учебное пособие. - Самара: Изд-во "Бахрах", 1998 - 672 с.

9. Психологический журнал. Т. 14, № 5, 1993. С. 90-98 ("Чужие рисунки").

10. Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. - М.: "ВЛАДОС", 1998. - 512 с.

 

 

Список литературы, использованной при подготовке книги по психодиагностике

1. Анастази А. Психологическое тестирование. В 2-х кн. М., 1982.

2. Анастази А. Дифференциальная психология. Индивидуальные и групповые различия в поведении / Пер. с англ. – М.: Апрель Пресс, Изд-во ЭКСМО-Пресс, 2001. – 752 с.

3. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Изд-во "Питер", 1999. - 528 с.

4. Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. - М.: Прогресс, 1979. - 500 с.

5. Гусев А. Н., Измайлов Ч. А., Михалевская М. Б. Измерение в психологии: общий психологический практикум. М.: Смысл, 1997. -287 с.

6. Диагностика психического развития. Под ред. Й. Шварцара. Прага, Авиценум, 1978. - 387 с.

7. Дружинин В.Н. Экспериментальная психология: Учебное пособие - М.: ИНФРА-М, 1997. - 256 с.

8. Клайн П. Справочное руководство по конструированию тестов. - Киев: ПАН Лтд, 1994.

9. Кулагин Б. В. Основы профессиональной психодиагностики.- Л., 1984.

10. Купер К. Индивидуальные различия / Пер. с англ. Т.М. Марютиной под ред. И.В. Равич-Щербо – М.: Апрель Пресс, 2000. – с.527

11. Лакин Г.Ф. Биометрия. М.: Высшая школа, 1968. - 284 с.

12. Либин А.В. Дифференциальная психология: На пересечении европейских, российских и американских традиций. 2 изд., переработанное. – М.: Смысл; Per Se, 2000. –549 с.

13. Мельников В.М., Ямпольский Л.Т. Введение в экспериментальную психологию личности: Учеб. Пособие для слушателей ИПК преподавателей пед. дисциплин и пед. ин-тов. - М.: Просвещение, 1985. - 319 с.

14. Нормы профессиональной этики для разработчиков и пользователей психодиагностических методик. Стандартные требования к психологическим тестам. 2-е издание. Ярославль; НПЦ "Психодиагностика", 1998.

15. Общая психодиагностика / Под ред. А. А. Бодалева, В. В. Столина.- М., 1987.

16. Основы психодиагностики / Под ред. А. Г. Шмелева. Ростов-на-Дону., 1996.

17. Психологическая диагностика: Проблемы и исследования / Под ред. К. М. Гуревича М., 1981.

18. Психологическая диагностика: Учебное пособие / Под ред. К.М. Гуревича и Е.М. Борисовой. - М.: Изд-во УРАО, 1997. - 304 с.

19. Психологический словарь / Под ред. В. П. Зинченко, Б. Г. Мещерякова. - М., 1996.

20. Хотинец В.Ю. Четыре метода анализа документов в социально-психологических исследованиях: Учеб. пособие / УдГУ. Ижевск, 2001. 62 с.

21. Шмелев А. Г. Психодиагностика личностных черт. – СПб.: Речь, 2002. – 480 с.

22. Ян тер Лаак. Психодиагностика: проблемы содержания и методов. - М.: Изд-во "Институт практической психологии", Воронеж, 1996. - 384с.

23. Howarth E. The index for differentiation of state and trait scales. – Psychol. Rep., 1978, Vol. 43, No. 2, p.474.

24. Oaster T.R.F. μ index differentiation of state and trait scales with new stressor scales. – Psychol. Rep., 1982, Vol. 51, No. 1, p.272.

 

 

Дополнительная литература по курсу психодиагностики.

 

1. Аванесов В.С. Тесты в социологическом исследовании. - М.: Наука, 1982.

2. Атлас для экспериментального исследования отклонений в психичес­кой деятельности человека/Под ред. И. А. Полищука, А. Е. Видренко. Изд. 2. Киев, 1979. 124 с.

3. Бажин Е.Ф. и др. Метод исследования субъективного контроля / Психологический журнал, - 1984, T. 5, № 3. C. 152-162.

4. Березин Ф.Б. и др. Методики многостороннего исследования личности. - М.: Медицина, 1976.

5. Блейхер В.М., Бурлачук Л.Ф. Психологическая диагностика интеллекта личности. - Киев: Выща школа, 1978.

6. Бызова В.М. Основы психодиагностики, учебное пособие, Сыктывкар, Гос. университет, 1992, 59 с.

7. Гайда В.К., Захаров В.П. Психологическое тестирование: учебное пособие. - Л.: Изд-во ЛГУ, 1982. С. 13-18.

8. Ганзен В.А., Балин В.Д. Теория и методология психологи­ческого исследования. - СПб РИО, СПб ГУ, 1991, 75 с.

9. Гарбер Е.И., Казча В.В. Методика профессиографии - Саратов: Изд-во Саратовского ун-та, 1992, 196 с.

10. Гильбух Ю.З. Актуальные проблемы валидизации психологических тестов. / Вопросы психологии, 1978, N 5.

11. Гилъбух Ю. 3. Психодиагностика в школе. М., 1989.

12. Гуревич К.М., Акимова А.К., Козлова В.Т. Статистическая норма или социально-психологический норматив? / Психологический журнал, 1986, N 3.

13. Забрамная С. Д. Наглядный материал для психолого-педагогического обследования детей в медико-педагогических комиссиях. М., 1985.

14. Изучение школьника и составление его психологической характерис­тики: Методические указания к практике по психологии. Л.: ЛГПИ, 1986. 27 с.

15. Корнилова Т. В. Введение в психологический эксперимент: Учебник. М.: Изд-во Моск. ун-та, Че-Ро, 1997. 256 с.

16. Кроз М.В. Аннотированный указатель методов социально-психо­ло­гической диагностики: учебное пособие. - М.: Изд-во МГУ, 1991, 55 с.

17. Кэмпбелл Д. Модели экспериментов в социальной психологии и приклад­ных исследованиях. М.: Прогресс, 1980. 392 с.

18. Левитан К.М. Знаете ли Вы себя? Сборник психологических тестов и рекомендаций. - Екатеринбург: Профтех, 1991.

19. Лучшие психологические тесты для профотбора и профориентации: описание и руководство к использованию / Отв. ред. А.Ф. Кудря­шев. - Петрозаводск: Петроком, 1992, 318 с.

20. Методики изучения интеллекта. 4.1 / И.Н. Агафонова и др. - СПб: Гор. институт усовершенствования учителей, Кафедра педагогики и психологии, 1991, 221 с.

21. Методы социальной психологии / Под ред. Е. С. Кузьмина, В. Е. Семенова. Л.: ЛГУ, 1977. 175 с.

22. Платонов К. К. Психологический практикум. М.: Высшая школа, 1980. 165с.

23. Практикум по психодиагностике. Прикладная психодиагности­ка / И.Ю. Беляева и др. - М., Изд-во МГУ, 1992, 116 с.

24. Практикум по психодиагностике: дифференциальная психометрика / Под ред. В.В. Столина, А.Г. Шмелева. - М.: Изд-во МГУ, 1984. С. 16-17.

25. Практикум по общей, экспериментальной и прикладной психологии: Учебн. пособие / Ред. А. А. Крылов, С. А. Маничев. СПб.: Питер, 2000.

26. Психологические методы исследования в клинике. Л., 1967. 324 с.

27. Психодиагностические методы (в комплексном лонгитюдном исследо­вании студентов) / Под ред. А. А. Бодалева, М. Д. Дворяшиной, И. М. Па­лея. Л.: ЛГУ, 1976.248 с.

28. Психологический словарь / Под ред. В. П. Зинченко, Б. Г. Мещерякова. - М., 1996.

29. Проблема цвета в психологии / Отв. ред. А.А. Митькин, Н.Н. Корж. - М.: Наука, 1993, 204 с.

30. Психологический статус личности в различных социальных услови­ях: диагностика и коррекция / Межвузовский сборник / Под ред. В.С. Мухиной. - М.: Прометей, 1992, 198 с.

31. Развитие и диагностика способностей / Л.Г. Алексеева и др. / Отв. ред. В.Н. Дружинин, В.Д. Шадриков. - М.: Наука,1992, 179 с.

32. Реан А. А. Психология изучения личности: Учебн. пособие. СПб.: Изд-во Михайлова В. А., 1999. 288 с.

33. Рейнвальд Н.И. Личность и характер: учебное пособие. - М.: Изд-во РУДН, 1992, 88 с.

34. Романова Е. С. Графические методы в психодиагностике. СПб.: Речь, 2001.

35. Рыбалко Е. Ф. Возрастная и дифференциальная психология: Учебн. посо­бие. Л.: ЛГУ, 1990. 256 с.

36. Рубинштейн С.Я. Экспериментальные методики патопсихологии. - СПб.: Ленато, 1998. - 166 с.

37. Русалов В.М. Новый вариант адаптации личностного теста ЕРУ / Психологический журнал, 1987. № 1.

38. Русалов В.М., Гусева О.В. Сокращенный вариант личностного опросника Кеттелла (8PI) / Психологический журнал, 1990. Т. 11, №11. C. 34-48.

39. Семенов В. Е. Метод изучения документов в социально-психологических исследованиях: Учебн. пособие. Л.: ЛГУ, 1983. 104 с.

40. Сластенин В. А., Мажор Н. Е. Диагностика профпригодности. М., 1992.

41. Соколова Е.Т. Проективные методы исследования личности. - М.: Изд-во МГУ, 1987.

42. Способности и склонности: комплексные исследования / Под ред. Э.А. Голубевой. - М.: Педагогика, 1989, 199 с.

43. Суслов В.И., Чумакова Н.П. Психодиагностика. Учебное пособие СПб РИО, СПб ГУ, 1992, 59 с.

44. Черепанова Н.С., Дорожкин Ю.П. Графологическая диагнос­тика. Методическое пособие. - М.: НМПИО "МАГ", 1992, 32 с.

45. Экспериментальная психология / Под ред. П. Фреса, Ж. Пиаже. - М.: Прогресс, 1975. Гл. 17.

 

 

Оглавление

 

Тема 1: "Психодиагностика: синтез науки и практики "

§1. Введение………………….. 3

§2. Содержание и предмет психодиагностики….. 8

§3. Системы классификации диагностических процедур.. 16

§4. Условия тестирования и психодиагностические задачи.. 39

§5. Профессиональные и этические принципы психологического тестирования…. 42

 

Тема 2: "История развития психодиагностики как науки".

§1. Предыстория психодиагностики…. 54

§2. Развитие тестов интеллекта…. 57

§3. Развитие тестов специальных способностей и достижений... 65

§4. Развитие методов психодиагностики личности… 72

§5. Психологическая диагностика в России... 78

 

Тема 3: "Основы конструирования психодиагностических методик".

§1. Статистическая природа тестовых шкал… 88

§2. Взаимосвязь свойств пунктов теста и видов распределений тестовых баллов… 96

§3. Понятие нормы. Проблемы стандартизации показателей… 104

§4. Устойчивость распределения… 127

§5. Репрезентативность критериальных тестов… 130

§6. Надежность теста. Теория надежности… 136

§7. Дискриминативность теста… 165

§8. Валидность тестов… 169

§9. Достоверность самоотчета… 186

§10. Технология создания и адаптации методик… 195

Список литературы… 212

Приложение… 216

Приложение 1.




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 2673; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.264 сек.