Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Стандартизация теста




 

Одним из важных отличий психометрических тестов является то, что они стан- дартизированы, а это позволяет сравнить показатели, полученные одним испы- туемым, с таковыми в генеральной совокупности или соответствующих группах.


168 Глава 3. Психометрические основы психодиагностики: основные этапы...

 

 

Тем самым достигается адекватная интерпретация показателя отдельного испы- туемого. Таким образом, стандартизация теста наиболее важна в тех случаях, ког- да осуществляется сравнение показателей обследуемых. При этом вводится поня- тие нормы, или нормативных показателей. Для получения стандартных норм нужно тщательно отобрать большее количество испытуемых в соответствии с ясно обозначенным критерием. При формировании выборки стандартизации следует учитывать ее объём и репрезентативность. В руководствах по тестам чаще всего указывается на то, что для простого уменьшения стандартной погрешности до- статочной будет выборка из 500 испытуемых. Однако репрезентативность выбор- ки не зависит от ее объема. Например, для того чтобы получить нормативные по- казатели для всей популяции детей, обучающихся в начальной школе, потребует- ся выборка объемом более 10 тысяч, тогда как выборка из такой ограниченной популяции, как шеф-пилоты авиакомпаний, не может быть столь значительной. Репрезентативность выборки, таким образом, параметр более важный, нежели ее объем. В некоторых случаях приходится формировать несколько групп стандар- тизации или стратифицировать группу стандартизации относительно таких пара- метров, как возраст, пол, социальный статус. Устанавливать нормы не всегда обя- зательно. При использовании психологических тестов в научном исследовании нормы не столь важны и достаточно «сырых» показателей теста.

Нормы для каждой группы должны быть представлены в средних величинах и показателе стандартного отклонения. Расчет средней величины элементарен и хорошо известен, а стандартное отклонение определяется с помощью формулы, имеющей вид:

 

 
где SD — стандартное отклонение; X2 — результат всего опросника всех испытуе- мых; п — количество испытуемых; — сумма.

Сегодня на практике все больше используется такой тип производной оценки, как стандартные показатели, удовлетворяющий большинству требований, предъ- являемых к психологическому измерению. Такие показатели выражают отличие индивидуального результата испытуемого от среднего в единицах стандартного отклонения соответствующего распределения. Стандартные показатели получа- ют двумя путями: линейным и нелинейным преобразованием первичных («сы- рых») оценок. В случае линейного преобразования сохраняются все свойства ис- ходного распределения «сырых» оценок, и такие показатели называются стандарт- ными или z -показателями. Для вычисления г-показателя находят разность между первичной оценкой и средним для нормативной группы и делят ее на стандарт- ное отклонение нормативной группы. Формула имеет вид:

Здесь необходимо сказать о том, что основной причиной преобразования пер- вичных оценок в некоторую производную шкалу является желание получить по- казатели, которые сопоставимы между собой вне зависимости от того, по какому


3.9. Стандартизация теста 169

 

 

тесту они получены. Линейное преобразование позволяет получить показатели сопоставимые лишь в том случае, когда распределения «сырых» оценок, по кото- рым они рассчитываются, имеют примерно одинаковую форму. Для того чтобы сопоставлять показатели, полученные на основе распределений разной формы, прибегают к нелинейному преобразованию, или к нормализованным стандарт- ным показателям. Процедура нелинейного преобразования достаточно проста и описана в многочисленных руководствах по математической статистике. Такие показатели обычно рассчитывают с помощью таблиц. В этих таблицах приводит- ся процент случаев, приходящихся на участки, которые отстоят от среднего нор- мальной кривой на некоторое число единиц стандартного отклонения. Сначала определяют процент лиц, чьи показатели превышают каждую «сырую» оценку, а затем по этому проценту в таблице отыскивают соответствующее значение нор- мализованного стандартного показателя. Эти показатели, как и линейно преоб- разованные, будут иметь среднее (X), равное 0, и стандартное отклонение (SD), равное 1. Нулевое значение показывает, что испытуемый попадает в точку, соот- ветствующую среднему нормальной кривой, превосходя 50 % группы. В случае, если показатель равен —1, испытуемый превосходит примерно 16 % группы, а ес- ли + 1 — превосходит 84 % группы. Нормализованным стандартным показателям можно придать любую удобную форму, например, умножив его на 10 и прибавив произведение к 50, получаем так называемый «T-показатель» и в этом случае Т, равное 50, соответствует среднему, равному 60 — превышает среднее на одно стан- дартное отклонение и т. д. С другими, не менее популярными нелинейными пре- образованиями «сырых» показателей теста, можно ознакомиться в соответствую- щей литературе1.

Созданием стандартизованного теста и его публикацией обычно завершается работа психолога, однако следует помнить и о том, что с течением времени не- обходим пересмотр (ревизия) теста. Достаточно вспомнить о тестах интеллекта (см. гл. 4), нормы по которым устаревают через каждые 5 лет, и можно предполо- жить, что процесс их старения будет ускоряться. Для наглядности этапы конст- руирования теста представлены на рис. 3.1.

Пример из практики: определение надежности опросника 16 PF Кеттелла. Личностный опросник Раймонда Кеттелла 16 PF(16 личностных факторов) от- носится к наиболее распространенным психодиагностическим инструментам и не нуждается в специальном представлении. Уже без малого 50 лет психологи всего мира используют его для решения разнообразных прикладных и научных задач. Однако как в бывшем СССР, так и ныне во вновь образованных странах этот опросник, несмотря на достаточно большую популярность, используется непро- фессионально, с нарушением всех норм и правил, предъявляемых к психологиче- ским тестам.

Кроме различных переводов опросника, которые существенно отличаются один от другого, в русскоязычной литературе часто встречаются и различные

 

 

 
См., напр., БурлачукЛ. Ф., Морозов С. М. Словарь-справочник по психодиагностике. — СПб.: Питер,

1999, а также Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии / Пер. с англ. — М.: Прогресс, 1976.


170 Глава 3. Психометрические основы психодиагностики: основные этапы.

 

 

Рис. 3.1. Этапы конструирования теста

 

«ключи» к его факторам. Опубликованные в многочисленных сборниках и бро- шюрах варианты опросника не защищены (!) от ошибок и произвольного вмеша- тельства в его текст. Если добавить к этому отсутствие нормативных данных, а также то, что не проводилась проверка гомогенности шкал опросника на отече- ственных зыборках, то непонятно, какого рода результаты получали его многочи- сленные пользователи, какими диагностическими заключениями они оперировали. За последние пятнадцать лет у нас появились только три (!) работы, в которых ста- вилась задача проверки факторной структуры 1 6PF на. национальных выборках:


3.9. Стандартизация теста 171

 

 

это статьи В. М. Русалова и О. В. Гусевой (1990), Ю. М. Забродина, В. И. Похиль- ко и А. Г. Шмелева (1987), наконец, украинского психолога А. Г. Виноградова (1997). Читателю нетрудно сравнить это количество публикаций с тем множе- ством работ, в которых опросник использовался для получения «диагностически значимых результатов». Сказанное позволяет сделать вывод о том, что с помощью опросника 16PF измеряется нечто, имеющее неясное отношение к факторам лич- ности, выделенным и описанным Кеттеллом.

Занимаясь работой по психометрической адаптации личностных опросников1, мы не могли обойти вниманием и столь широко распространенный, как 16PF. За основу была взята форма «А» опросника 16PF. Были обследованы 227 человек (135 женщин и 92 мужчины) в возрасте от 16 до 51 года. Средний возраст иссле- дуемых составлял 28 лет. Это были люди, которые проходили отбор на различные должности в коммерческие организации Киева, все они имели высшее или сред- нее специальное образование (бухгалтеры, коммерческие директоры, менеджеры разного уровня).

Как известно, точность измерения с помощью психодиагностического инстру- мента определяется его надежностью. С целью выяснить, насколько точен прогноз, даваемый психологом на основании результатов 16PF, данные, первоначально по- лученные нами, были оценены по авторским ключам на внутреннюю согласован- ность с помощью коэффициента Кронбаха, вычисляемого по следующей формуле:

 
где a — коэффициент Кронбаха; r количество заданий теста; S — дисперсия по

 
j-му пункту теста; — дисперсия суммарных баллов по всему тесту.

В табл. 3.6 содержатся данные о внутренней согласованности факторов лично- сти, полученные по авторским «ключам» (приведено буквенное обозначение фак- тора). Как видно из таблицы, значение коэффициента Кронбаха неудовлетвори- тельно для большинства факторов. А фактор N вообще измеряет нечто, не имею- щее никакого отношения к проницательности, расчетливости и наивности (если употреблять обыденное название этого фактора). Лишь некоторые из факторов, например фактор F (сургенция—десургенция) и фактор H пармия—тректия (сме- лость—робость), надежно измеряют то, что должны измерять. Таким образом, в результате проверки надежности—согласованности оригинальных ключей было показано, что ряд шкал опросника негомогенны. Можно предположить, что это следствия искажения смысла заданий при переводе на русский язык и/или суще- ствования известных культурных различий.

Для того чтобы выявить, что же именно стоит за данными, получаемыми с по- мощью 16PF, мы использовали факторный анализ. Факторы извлекались методом

 

 

 
Автор выражает свою признательность за участие в этой работе своему бывшему аспиранту Виталию

Духневичу.


172 Глава 3. Психометрические основы психодиагностики: основные этапы...

 

Таблица3.6




Поделиться с друзьями:


Дата добавления: 2014-12-29; Просмотров: 441; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.021 сек.