Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Протокол методики MMPI 2 страница




Авторы теста полагают, что испытуе­мые не имеют представления о тех психо­логических показателях, которые иссле­дуются тестом (на этом основании мето­дика относится к объективным тестам).

Показатели надежности М., а. т. недо­статочно удовлетворительны. Так, коэф­фициент альфа варьирует от 0,33 до 0,71. Валидность являлась предметом иссле­дований Р. Кэттелла и соавт. (1970), кото­рые приводят данные о ее высоких показателях (на основании сопоставления с ре­зультатами «Шестнадцати личностных факторов» опросника). Однако эти ре­зультаты ставятся под сомнение (К. Бурдселл, 1975). В исследовании П. Клайна и Дж. Гриндлей (1974) валидность подтвер­ждается соответствием между результата­ми этого теста и анализом дневниковых материалов испытуемых.

Исследования К. Купер и П. Клайна (1982) заставляют усомниться в валидно­сти М. а. т. (в психометрическом аспек­те). Факторный анализ М. а. т. и шкал 16 PF был осуществлен на выборке из 109 мужчин. Исследование выявило восемь факторов, ни один из которых не соответ­ствовал постулированной структуре тес­та. В качестве дальнейшей проверки был проведен анализ, в котором было про­демонстрировано, что шкалы не являют­ся однородными (задания не соответство­вали шкалам, которым они приписыва­лись). Руководство к тесту сопровождает­ся нормами, рассчитанными для амери­канской выборки (объем выборки незна­чительный).

По мнению П. Клайна, тест представ­ляет интерес, поскольку относится к весь­ма немногочисленной группе объектив­ных тестов и к тому же является стандартизированным. Тем не менее тест недостаточно доработан и в настоящем виде не может быть рекомендован к при­менению в психодиагностических иссле­дованиях.

Сведений об использовании в СНГ нет.

МЫШЛЕНИЯ ПРОСТРАНСТВЕН­НОГО ТЕСТтест специальных спо­собностей. Предложен И. С. Якиманской, В. Г. Зархиным и X. М. Кадаяс в 1991 г. Предназначен для диагностики уровня развития пространственного мышления.

М. п. т. включает пять субтестов, зада­ния которых требуют от испытуемых в процессе создания образа работы с вели­чиной объектов (1), их формой (2), а так­же оперирования образами, приводящего к мысленному видоизменению положения объекта (3), его структуры (4), к одновре­менному изменению пространственного положения и структуры образа (5). Два вида заданий направлены на выявление процесса создания образа и три — на фик­сацию типов оперирования образом. Внут­ри субтестов задания различаются по ма­териалу (черчение, геометрия, рисова­ние). Тест имеет две формы (А и Б), каж­дая из которых состоит из 5 видов зада­ний. Каждый вид заданий представлен двумя вариантами, различающимися уров­нем сложности.

Надежность ретестовая (3,5 мес) — 0,841 прир < 0,01. Валидность определя­лась: сравнением успешности выполне­ния заданий со школьной оценкой по гео­метрии (r = 0,683, р < 0,01); сопоставлением результатов выполнения заданий М. п. т. и субтеста № 8 Амтхауэра ин­теллекта структуры теста (r = 0,623, р < 0,01); путем сравнения результатов тестирования с успешностью выполнения стандартизированной контрольной рабо­ты по геометрии (r = 0,697, р<0,01). Доказана эквивалентность форм А и Б (r = 0,959, р < 0,01). Разработана схема качественного анализа результатов тести­рования.

Авторы считают, что с помощью теста можно выявить не только индивидуаль­ные различия в содержании и структуре пространственного мышления, но и конст­руировать обучающие коррекционные программы с учетом всех структурных компонентов этого вида мышления, их взаимосвязи и компенсируемости.

 

-Н-

 

НАДЕЖДЫ ИНДЕКС (Hope Index) - опросник личностный, предназначен для диагностики мотивационной сферы лич­ности, ее отношения к будущему. Разра­ботан С. Стаатс и М. Стассен в 1986 г.

Стимульный материал представляет собой бланк с перечнем 16 наиболее рас­пространенных желаний, которые были выявлены в ходе предварительных опро­сов. Испытуемый должен оценить в 6-бал­льной Лайкерта шкале и указать в бал­лах от 0 до 5: 1) насколько он хочет осу­ществления каждого желания (от 0 — «совсем не хочу» до 5 — «хочу очень силь­но»); 2) какова вероятность осуществле­ния каждого желания (от 0 — «очень низкая» до 5 — «очень высокая»). Испы­туемый может добавить к списку 1-2 же­лания.

Общий показатель надежды представ­ляет собой сумму баллов «желания», ум­ноженных на количество баллов «ожида­ния» по каждому пункту. Шкала надежды имеет субшкалы «надежды-для-себя» (напр., иметь хорошее здоровье), «надежды-для-других» (напр., «иметь больше друзей», «понимание в семье»), «надежды-для-всех» (напр., «мир во всем мире»); по другому основанию деления — субшкалы «желание» и «ожидание».

Надежда, диагностируемая по Н. и., определяется как результат взаимодействия желаемого и ожидаемого, (С.Стаатс, М. Стассен, 1986). При отом с помощью Н. и. диагностируются в первую очередь когнитивные аспекты надежды (см. Ожидаемого баланса шкала). Тео­ретической основой методики является концепция триады «я—другие—мир» А. Бека (1967), описывающая взаимодействие человека с окружающим миром.

Надежность ретестовая Н. и. при обследовании 112 испытуемых-студентов с интервалом 9 недель составила rt = 0,62-0,74; внутренняя согласованость (при обследования 130 испытуемых студентов) —0,72-0,85. Н. и. обла­дает достаточновысокой валидностью.

Сведений об использовании в СНГ не имеется.

НАДЕЖНОСТИ КОЭФФИЦИЕН­ТЫ — статистические показатели на­дежности психологического теста.

При оценке надежности наиболее часто применяются различные виды корре­ляционного анализа. В качестве Н. к при характеристике надежности ретестовой используются коэффициент кор­реляции результатов первичного и повторного обследования, при оценке на­дежности параллельных форм — коэф­фициент корреляции результатов, полу­ченных с помощью разных форм теста (см. Параллельные формы теста).

При оценке надежности частей те­ста находят применение специальные ко­эффициенты, полученные на основе урав­нений Кьюдера—Ричардсона, Спирмена—Брауна. Распространенным методом анализа надежности является расчет ко­эффициента «альфа». При характерис­тике надежности факторно-дисперси­онной используются специальные методы дисперсионного анализа.

Н. к., определенные на основе разных подходов, нередко существенно отлича­ются по своим эмпирическим значениям. Между разными моделями определения надежности могут отмечаться противо­речия (см. Надежность по внутренней согласованности). Имеется ряд слож­ностей количественной характеристики надежности, аналогично проблемам, воз­никающим при анализе содержания валидности коэффициентов.

Несмотря на то что количественные характеристики надежности в виде тради­ционного Н. к. более распространены в практике психодиагностики, нежели ко­личественные коэффициенты при оценке валидности, о надежности теста следует (как и в случае валидности) судить на ос­новании изучения разных аспектов. При интерпретации Н. к. обязателен учет за­кономерностей разных подходов к определению надежности и психологический анализ показателей проверяемого на на­дежность теста.

НАДЕЖНОСТЬ — характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. Н. и валидность являются важнейшими характеристиками методики как инструмен­та психодиагностического исследования.

Результат психологического исследо­вания обычно подвержен влиянию боль­шого количества неучитываемых факто­ров (напр., эмоциональное состояние или утомление, если они не входят в круг ис­следуемых характеристик, освещенность, температура и другие особенности поме­щения, в котором проводится исследова­ние, уровень мотивированности испы­туемых на обследование и др.). Любое изменение ситуации исследования усили­вает влияние одних и ослабляет воздей­ствие других факторов на результат теста.

Общий разброс (дисперсию) результа­тов тестового обследования можно, таким образом, представить как результат влия­ния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измеритель­ной процедуры.

В самом широком смысле Н. теста — это характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отраже­нием действительных различий в измеря­емых свойствах и в какой мере они могут быть приписаны случайным ошибкам.

В более узком, методическом, смысле под Н. понимают степень согласованнос­ти результатов теста, получаемых при первичном и вторичном его применении, у одних и тех же испытуемых в различные моменты времени, с использованием раз­ных (но сопоставимых по характеру) на­боров тестовых заданий или при других изменениях условий обследования.

Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в идеальном случае совпадает с нормальным распределением, и диспер­сия при этом будет «истинной» (т. е. отражающей вариативность только измеря­емого признака). Каждый испытуемый занимает определенное место по оценкам теста, и теоретически это место для каж­дого члена выборки постоянно. В рассмат­риваемом случае повторное выполнение теста теми же лицами должно давать рас­пределение мест на шкале оценок, иден­тичное первому. Тогда методика точна и максимально надежна. Реальные оценки и ранговые места испытуемых при повтор­ном обследовании изменяются, и их рас­пределение в той или иной степени отли­чается от исходного. При этом дисперсия нового распределения выше исходного на величину дисперсии ошибки измерения. Сказанное можно выразить формулой, описывающей Н. теста как отношение «истинной» и реальной (эмпирической) дисперсии:

 

или

 

где α — надежность теста, — «истин­ная» дисперсия, — дисперсия ошибки; — эмпирическая дисперсия оценок те­ста. Как видно, Н. теста тесно связана с ошибкой измерения, которая указывает на вероятные пределы колебаний измеря­емой величины под воздействием случайных посторонних факторов. Величина — служит основным показателем точности и устойчивости измерений и называется ко­эффициентом Н. теста (rt):

 

Величина ошибки измерения обратно пропорциональна показателям точности измерения (чем шире доверительный ин­тервал, внутри которого возможно появ­ление истинного результата у данного испытуемого, тем меньше точность измере­ния). Относительную долю дисперсии ошибки ()легко установить, исходя из уравнения

 

На практике в большинстве применя­емых методик редко удается получить значения коэффициентов Н., превыша­ющие 0,7-0,8. При rt порядка 0,8 отно­сительная доля стандартной ошибки (см. Ошибка измерения) составляет , а эмпирическое значение отклонения тестового балла от среднего оказывается завышенным. Для коррекции эмпирического значения в практических исследованиях применяется формула:

 

где xt — истинное значение тестового балла, хi — эмпирический балл испытуе­мого, rt — коэффициент надежности, — среднее значение оценок по тесту.

Напр., у испытуемого при обследова­нии по шкале Векслера (см. Векслера ин­теллекта измерения шкалы) оценка вер­бального интеллектуального показателя составила 107 баллов. Среднее значение х для шкалы составляет 100, а надеж­ность rt — 0,89. При этом истинное зна­чение xt = 0,89 • 107 + 0,1 1 • 100 = 106,2.

Разновидностей характеристик Н. тес­та так же много, как условий, влияющих на его результаты. Наиболее широкое прак­тическое применение находят несколько типов характеристик Н.: надежность ретестовая, надежность параллельных форм, надежность частей теста.

Подчеркивается, что ни одна из суще­ствующих процедур не является идеаль­ной с т. з. Н. Свойства Н. могут суще­ственно изменяться при незначительных, на первый взгляд, изменениях условий проведения обследования, изменении характера заданий, они значительно варьи­руют в зависимости от степени сложнос­ти или трудности конкретных заданий для испытуемого. Стандартный набор сведе­ний о психодиагностических методах обычно включает характеристики Н., от­носящиеся к комплексу приведенных вы­ше типов и процедур определения.

На характеристики Н., определяемые эмпирическим путем, существенно влия­ет характер исследуемой выборки. Осо­бое значение здесь имеет диапазон разли­чий в оценках и соответственно в ранго­вых местах отдельных испытуемых и их групп в выборке определения Н. Так, если оценки обследуемых концентрируются в узком диапазоне значений и близки друг другу, следует ожидать, что при повтор­ном обследовании оценки также располо­жатся в тесной гомогенной группе. Воз­можные изменения ранговых мест будут внешне незначительны, и в таком случае коэффициент Н. будет завышен. Такое же неоправданное завышение коэффициента может возникнуть при анализе Н. на материале выборки, включающей контраст­ные группы лиц, напр, имеющих самые высокие и самые низкие оценки по тесту. Тогда эти далеко отстоящие оценки заве­домо не будут перекрываться под воздей­ствием случайных причин.

В практике психодиагностики при раз­работке руководств и методик обычно указывается характер групп, на которых проводилось определение Н. Коэффици­енты Н. нередко рассчитываются для конкретных контингентов испытуемых, раз­личающихся по полу, возрасту, уровню образования, профессиональной подго­товке. Нередко производят расчет Н. раз­дельно для групп испытуемых, получив­ших по тесту высокий или низкий результат (см. Станфорд—Бине ум­ственного развития шкала).

Важнейшим средством повышения Н. психодиагностических методик является стандартизация процедуры обследова­ния. При строгой регламентации процеду­ры обследования (обстановка и условия работы испытуемого, характер инструк­ции, временные ограничения, способы и особенности контакта с испытуемым, по­рядок предъявления элементов методики, получения оценок первичных и т. д.) существенно уменьшается дисперсия ошиб­ки и повышается Н. теста.

Если исходить из широкого понимания Н. как отражения в результате исследова­ния удельного веса измеряемого парамет­ра и совокупности посторонних факторов, то можно усмотреть определенную связь Н. с другой важнейшей комплексной ха­рактеристикой психодиагностической ме­тодики — валидностью.

Н. — устойчивость процедуры относи­тельно объектов исследования. Валидность — однозначность, устойчивость от­носительно измеряемых свойств объекта (т. е. предмета измерения). Устойчивость теста относительно объектов (испытуе­мых) является необходимым, но не доста­точным условием его устойчивости отно­сительно измеряемых свойств объектов. Следовательно, Н. является необходи­мым, но не достаточным условием валидности. Это означает, что валидность тес­та не может качественно и количествен­но превышать Н. Данное соотношение нельзя, однако, трактовать как указание на прямую пропорциональную связь ха­рактеристик валидности и Н. Повышение Н. отнюдь не сопровождается обязатель­ным повышением валидности. Напр., у те­ста-опросника из одного вопроса внут­ренняя согласованность предельна, од­нако валидность у него минимальна.

НАДЕЖНОСТЬ ПАРАЛЛЕЛЬНЫХ ФОРМ — характеристика надежности психодиагностической методики с помо­щью взаимозаменяемых форм теста (см. Параллельная форма теста). При этом одни и те же испытуемые в выборке опре­деления надежности обследуются внача­ле с использованием основного набора заданий, а затем — с применением анало­гичных дополнительных наборов. Коэф­фициент надежности по типу Н. п. ф. мо­жет быть определен и другим способом, а именно: испытуемые делятся примерно на равные группы, затем одной из них пред­лагается форма А теста, а другой — фор­ма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке.

Такая процедура обследования лише­на значительной части недостатков спосо­ба определения надежности ретестовой. Так как в параллельной форме ис­пользуется другой по содержанию материал, возможность тренировки и запоми­нания отдельных решений уменьшается. Важнейшим преимуществом данного ме­тода является сокращение временного ин­тервала перед повторным обследованием. Основным показателем Н. п. ф. является коэффициент корреляции между резуль­татами первичного и повторного обследо­ваний, который позволяет оценить как временную стабильность теста (собствен­но надежность), так и степень соответ­ствия результатов обеих форм теста. Если формы применяются непосредственно одна за другой, то корреляция отражает их взаимозаменяемость.

Отношение между параллельными формами теста имеет сложный характер. Оба набора заданий должны не только от­вечать одним и тем же требованиям, изме­ряя идентичные показатели и давая сходные результаты, но вместе с тем быть от­носительно независимыми друг от друга. На практике эта задача осуществима да­леко не для всех тестовых заданий (в осо­бенности это касается личностных методик, опросников), что существенно огра­ничивает сферу применения Н. п. ф. Другим недостатком характеристики надеж­ности по типу Н. п. ф. является возмож­ность усвоения испытуемым принципа решения, общего для основной и параллель­ной форм. Таким образом, в случае оцен­ки Н. п. ф. влияние тренировки и навыка, приобретаемого при повторном обследо­вании, если и снижается по сравнению с характеристикой надежности ретестовой, однако не устраняется полностью.

НАДЕЖНОСТЬ ПО ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ — способ опре­деления надежности, опирающийся на оценку степени выраженности интеркор­реляционных связей между заданиями, составляющими тест.

В данном случае истинный показатель по тесту понимается как результат, кото­рый получил бы испытуемый, если бы ему были предъявлены все возможные зада­ния, относящиеся к черте или свойству, являющемуся объектом тестирования. Каждый конкретный тест является выбор­кой из генеральной совокупности зада­ний. Погрешность измерения отражает степень, в которой реальная выборка за­даний охватывает теста заданий сово­купность генеральную. Генеральная со­вокупность заданий порождает бесконеч­но большую корреляционную матрицу парных связей между заданиями. Среднее значение корреляции между заданиями для этой матрицы (rij)указывает на сте­пень общности, внутренней согласован­ности заданий. Так, если, например, в те­сте было бы одно задание из множества независящих друг от друга, то = 0,00. Предполагается, что все задания имеют одинаковые значения взаимной корре­ляции.

Исходя из основных положений оцен­ки Н. п. в. с., можно сказать, что корреля­ция некоторого задания с истинным пока­зателем (rit) равна квадратному корню от его средней корреляции с другими задани­ями (Дж. Наннелли, 1978):

 

Строго говоря, этот вывод справедлив тог­да, когда количество заданий приближа­ется к бесконечности.

С точки зрения разработчика теста, соотношение rit и rij имеет важное значе­ние, поскольку при разработке значитель­ного количества заданий и выборе из них тех, для которых значение будет наи­большим, созданный тест будет надеж­ным и свободным от погрешностей изме­рения. Аналогичные рассуждения, касаю­щиеся взаимосвязи заданий, могут быть применены к надежности параллельных, форм тестов. В данном случае каждый из параллельных тестов рассматривается как случайная выборка из генеральной со­вокупности заданий. Средние значения и дисперсии тестов отличаются от истинно­го показателя только случайным образом. Следовательно, в приведенном выше уравнении значения для заданий могут быть заменены показателями для тестов (т. е. наборов заданий).

Так как корреляции между заданиями или параллельными тестами на практике не являются идентичными, должно быть некоторое распределение их вокруг ис­тинного значения. Если предположить, что такое распределение является нор­мальным (см. Нормальное распределе­ние), можно оценить точность коэффици­ента надежности rij путем вычисления стандартной ошибки (см. Ошибка изме­рения) средней взаимной корреляции за­даний или тестов в генеральной совокуп­ности (Дж. Наннелли, 1978):

 

где — стандартная ошибка измерения, — стандартное отклонение корреляций заданий внутри теста и n — количе­ство заданий в тесте.

Из уравнения видно, что по мере воз­растания возрастают различия между корреляциями и по мере возрастания п стандартная погрешность уменьшается, то есть чем больше заданий, тем выше точность оценки коэффициента надежно­сти. Действительно, если предположить, что для некоторого теста равна 0,15, а количество заданий варьирует от 10 до 30, то, подставив соответствующие значения в уравнение, получим следующие по­грешности: для теста из 10 заданий — 0,02; для теста из 20 заданий — 0,01; для теста из 30 заданий — 0,007.

Вслед за Дж. Наннелли (1978), П. Клайн (1986) распространяет сужде­ние о возрастании точности коэффициен­та надежности при увеличении состава теста и на саму величину надежности. В самом деле, поскольку истинные пока­затели теста определяются через меру представленности заданий генеральной совокупности, должно выполняться пред­положение о том, что чем больше тест, тем выше корреляция с истинным показа­телем. Предельным случаем будет гипоте­тическая ситуация, когда тест состоит из всех заданий генеральной совокупно­сти за исключением одного. Для доказа­тельства надежности теста, задания кото­рого, как заранее известно, принадлежат одной генеральной совокупности, можно воспользоваться формулой Спирмена— Брауна:

 

где rt — надежность теста, п — количе­ство заданий, — средняя взаимная кор­реляция заданий. В формуле Спирмена— Брауна показатель (см. Надежность частей теста) заменен на , что вытекает из вывода модели коэффициента на­дежности.

Предположим, имеются три набора за­даний (п = 10, 20, 30), средняя корреля­ция между которыми равна 0,20, тогда:

для10 задании:=

для 20 заданий: =

для 30 заданий: = .

Причем эти показатели получены для заданий, взаимная корреляция которых была низкой. Для более однородного тес­та из 30 заданий при - 40 получаем:

Таким образом, при наличии набора однородных заданий тест будет заведомо надежным. Даже если разделить совокуп­ность заданий на две параллельные фор­мы по 15 пунктов, они обе также будут иметь удовлетворительную надежность.

Теоретические значения коэффициен­та надежности при данном способе опре­деления существенно превышают эмпи­рические значения надежности ретесто-вой и надежности параллельных форм. Это происходит из-за ряда допущений. Прежде всего следует указать на то, что при определении Н. п. в. с. не учитывают­ся другие источники погрешности измере­ний, связанные с неконтролируемыми факторами среды, состояния и мотивации испытуемого (см. Надежность). В этой связи между Н. п. в. с. и ретестовой на­дежностью имеется противоречие. Ретестовая надежность может уменьшаться при увеличении состава заданий (чем больше заданий, тем выше вероятность случайного или закономерного изменения ответа при ретесте). Противоречие может быть снято за счет признания некоррект­ности допущения о равенстве интеркорреляций между заданиями, зависимости по­грешности лишь от представленности в тесте генеральной совокупности заданий. В противном случае необходимо было бы согласиться с тем, что в двух тестах, свя­занных общим фактором и имеющих оди­наковое количество заданий, но совер­шенно разных по характеру выполнения и трудности, надежность будет одинаковой, что невозможно.

Следует обратить внимание на невоз­можность определения таким способом надежности тестов скорости, так как связь каждого из заданий исследуемой ге­неральной совокупности не определена из-за большого количества заданий, ин­теркорреляции заданий могут терять смысл (см., напр., Корректурная проба).

Важным аспектом оценки примени­мости Н. п. в. с. является парадокс, возни­кающий в этом случае при сочетании по­казателей надежности и валидности теста. Кажется, что высокая внутренняя согласованность должна быть основной целью разработчиков теста (Л. Кронбах, 1920). Такая точка зрения является до­вольно распространенной. Однако Р. Кэттелл (1977) обоснованно утверждает, что высокая внутренняя согласованность (особенно при изучении сложных психо­логических конструктов, личностных по­казателей) в известном смысле противо­стоит высокой валидности.

Возникающее противоречие можно иллюстрировать следующим примером. Тест вербальных способностей может включать задания (и соответственно, суб­тесты) на подбор антонимов, синонимов, понимание слов, словарный запас. Пред­положим, что каждый из субтестов имеет высокие показатели Н. п. в. с. Однако если бы мы воспользовались только одним субтестом (например, подбором антонимов), то показатель Н. п. в. с. теста несом­ненно возрос бы по сравнению с полным набором субтестов, так как используется только один тип высокосогласованных за­даний. Высокая надежность субтеста антонимов будет отражать тот факт, что эта выборка заданий в высокой степени кор­релирует с гипотетической генеральной совокупностью заданий на антонимы. Од­нако этот истинный показатель отражает не вербальные способности, а только спо­собность подбирать антонимы (т. е. валидность теста станет низкой по отношению к измерению вербальных способностей). Приведенные данные свидетельству­ют о специфичности применения каждо­го из имеющихся подходов к характерис­тике надежности теста. Н. п. в. с. имеет, очевидно, в основном теоретическое зна­чение. Как и надежность частей теста в предельном случае разбивания материа­ла на отдельные задания, рассматривае­мый способ имеет практическое значе­ние для оценки точности коэффициента надежности, а также при характеристи­ке некоторых тестов, состоящих из спе­циально подобранных факторизованных заданий (см. Факторно-аналитический принцип).

 

НАДЕЖНОСТЬ РЕТЕСТОВАЯ — характеристика надежности психодиагно­стической методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста. Надежность в этом случае вычисляется по соот­ветствию результатов первого и второго обследований или по сохранению ранго­вых мест испытуемых в выборке при рете­сте. Коэффициент надежности (rt) соот­ветствует коэффициенту корреляции между результатами таких обследований. При использовании интервальных шкал (см. Шкалы измерительные) применяет­ся коэффициент корреляции произведе­ния моментов Пирсона (см. Корреляци­онный анализ). Для шкал порядка в качестве меры устойчивости к перетестиро­ванию может быть использован коэффициент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).

При характеристике Н. р. особое зна­чение имеет временной интервал между первым и вторым обследованиями. С его увеличением показатели корреляции име­ют тенденцию к снижению, существенно повышается вероятность воздействия по­сторонних факторов — могут наступить закономерные возрастные изменения из­меряемых тестом свойств, произойти раз­личные события, влияющие на состояние и особенности развития исследуемых ка­честв. По этой причине при определении Н. р. стараются выбирать непродолжи­тельные временные интервалы (до не­скольких месяцев), а при обследовании детей младшего возраста эти интервалы должны быть еще меньше, поскольку воз­растные изменения и развитие в этом слу­чае происходят еще быстрее.




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 670; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.063 сек.