Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Нэо личностный опросник 1 страница




Н

НАДЕЖДЫ ИНДЕКС (Hope Index) —

опросник личностный, предназначен для диагностики мотивационной сферы лич­ности, ее отношения к будущему. Разра­ботан С. Стаатс и М. Стассен в 1986 г.

Стимульный материал представляет собой бланк с перечнем 16 наиболее рас­пространенных желаний, которые были выявлены в ходе предварительных опро­сов. Испытуемый должен оценить в 6-бал­льной Лайкерта шкале и указать в бал­лах от 0 до 5: 1) насколько он хочет осу­ществления каждого желания (от 0 — «совсем не хочу» до 5 — «хочу очень силь­но*»); 2) какова вероятность осуществле­ния каждого желания (от 0—«очень низкая» до 5 — «очень высокая*). Испы­туемый может добавить к списку 1 -2 же­лания.

Общий показатель надежды представ­ляет собой сумму баллов «желания», ум­ноженных на количество баллов «ожида­ния» по каждому пункту. Шкала надежды имеет субшкалы «надежды-для-себя» (напр., иметьхорошее здоровье), «надеж­ды -для-других» (напр., «иметь больше друзей», «понимание в семье»), «надежды-для-всех» (напр., «мир во всем мире»); по другому основанию деления — субшкалы «желание» и «ожидание».

Надежда, диагностируемая по Н. и.,

определяется как результат взаимодей­ствия желаемого и ожидаемого (С. Ста­атс, М. Стассен, 1986). При этом с помо­щью Н. и. диагностируются в первую очередь когнитивные аспекты надежды (см. Ожидаемого баланса шкала). Тео­ретической основой методики является концепция триады «я—другие—мир» А. Бека (1967), описывающая взаимодей­ствие человека с окружающим миром.

Надежность ретестовая Н. и. при обследовании 112 испытуемых-студентов с интервалом 9 недель составила rt = 0,62-0,74; внутренняя согласован­ность (при обследовании 130 испытуе­мых студентов) — 0,72-0,85. Н. и. обла­дает достаточно высокой валидностью.

Сведений об использовании в СНГ не имеется.

НАДЕЖНОСТИ КОЭФФИЦИЕН­ТЫ — статистические показатели на­дежности психологического теста.

При оценке надёжности наиболее час­то применяются различные виды корре­ляционного анализа. В качестве Н. к. при характеристике надежности ретес-товой используются коэффициенты кор­реляции результатов первичного и по-

вторного обследования, при оценке на­дежности параллельных форм. — коэф­фициент корреляции результатов, полу­ченных с помощью разных форм теста (см. Параллельные формы теста).

При оценке надежности частей те­ста находят применение специальные ко­эффициенты, полученные на основе урав-нений Кьюдера—Ричардсона, Спирме-на—Брауна. Распространенным методом анализа надежности является расчет ко­эффициента «альфа». При характерис­тике надежности факторно-дисперси­онной используются специальные методы дисперсионного анализа.

Н. к., определенные на основе разных подходов, нередко существенно отлича­ются по своим эмпирическим значениям. Между разными моделями определения надежности могут отмечаться противо­речия (см. Надежность по внутренней согласованности). Имеется ряд слож­ностей количественной характеристики надежности, аналогично проблемам, воз­никающим при анализе содержания ва-лидности коэффициентов.

Несмотря на то что количественные характеристики надежности в виде тради­ционного Н. к. более распространены в практике психодиагностики, нежели ко­личественные коэффициенты при оценке валидности, о надежности теста следует (как и в случае валидности) судить на ос­новании изучения разных аспектов. При интерпретации Н. к. обязателен учет за­кономерностей разных подходов к опреде­лению надежности н психологический анализ показателей проверяемого на на­дежность теста.

НАДЕЖНОСТЬ — характеристика ме­тодики, отражающая точность психодиаг­ностических измерений, а также устой­чивость результатов теста к действию посторонних случайных факторов. Н. и валидность являются важнейшими ха-

рактеристиками методики как инструмен­та психодиагностического исследования.

Результат психологического исследо­вания обычно подвержен влиянию боль­шого количества неучитываемых факто­ров (напр., эмоциональное состояние или утомление, если они не входят в круг ис­следуемых характеристик, освещенность, температура и другие особенности поме­щения, в котором проводится исследова­ние, уровень мотивированности испы­туемых на обследование и др.). Любое изменение ситуации исследования усили­вает влияние одних и ослабляет воздей­ствие других факторов на результат теста.

Общий разброс (дисперсию) результа­тов тестового обследования можно, таким образом, представить как результат влия­ния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измеритель­ной процедуры.

В самом широком смысле Н. теста — это характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отраже­нием действительных различий в измеря­емых свойствах и в какой мере они могут быть приписаны случайным ошибкам.

В более узком, методическом, смысле под Н. понимают степень согласованнос­ти результатов теста, получаемых при первичном и вторичном его применении, у одних и тех же испытуемых в различные моменты времени, с использованием раз­ных (но сопоставимых по характеру) на­боров тестовых заданий или при других изменениях условий обследования.

Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в идеальном случае совпадает с нормальным распределением, и диспер­сия при этом будет «истинной» (т. е. от­ражающей вариативность только измеря­емого признака). Каждый испытуемый занимает определенное место по оценкам

теста, и теоретически это место для каж­дого члена выборки постоянно. В рассмат­риваемом случае повторное выполнение теста теми же лицами должно давать рас­пределение мест на шкале оценок, иден­тичное первому. Тогда методика точна и максимально надежна. Реальные оценки и ранговые места испытуемых при повтор­ном обследовании изменяются, и их рас­пределение в той или иной степени отли­чается от исходного. При этом дисперсия нового распределения выше исходного на величину дисперсии ошибки измерения. Сказанное можно выразить формулой, описывающей Н. теста как отношение «истинной» и реальной (эмпирической) дисперсии:

5? а = |г.

или

Величина ошибки измерения обратно пропорциональна показателям точности измерения (чем шире доверительный ин­тервал, внутри которого возможно появ­ление истинного результата у данного ис-

На практике в большинстве применя­емых методик редко удается получить значения коэффициентов Н., превыша­ющие 0,7-0,8. При rt порядка 0,8 отно­сительная доля стандартной ошибки (см. О шибка измерения) составляет ^1 - 0,8 = 0,45, а эмпирическое значение отклонения тестового балла от среднего оказывается завышенным. Для коррекции эмпирического значения в практических исследованиях применяется формула:

xt = rlxi+x(\~rt),

где xt — истинное значение тестового балла, xi — эмпирический балл испытуе­мого, г( — коэффициент ■ надежности, х — среднее значение оценок по тесту.

Напр., у испытуемого при обследова­нии по шкале Векслера (см. Векслера ин­теллекта измерения шкалы) оценка вер­бального интеллектуального показателя составила 107 баллов. Среднее значение" х для шкалы составляет 100, а надеж­ность г{ — 0,89. При этом истинное зна­чение х, = 0,89 ■ 107 + 0,11 ■ 100 - 106,2.

Разновидностей характеристик Н. тес­та так же много, как условий, влияющих на его результаты. Наиболее широкое прак­тическое применение находят несколько типов характеристик Н.: надежность ре-тестовая, надежность параллельных форм, надежность частей теста.

Подчеркивается, Что ни одна из суще­ствующих процедур не является идеаль­ной с т. з. Н. Свойства Н. могут суще­ственно изменяться при незначительных, на первый взгляд, изменениях условий проведения обследования, изменении ха-

рактера заданий, они значительно варьи* руют в зависимости от степени сложнос­ти или трудности конкретных заданий для испытуемого. Стандартный набор сведе­ний о психодиагностических методах обычно включает характеристики Н., от­носящиеся к комплексу приведенных вы­ше типов и процедур определения.

На характеристики Н., определяемые эмпирическим путем, существенно влия­ет характер исследуемой выборки. Осо­бое значение здесь имеет диапазон разли­чий в оценках и соответственно в ранго­вых местах отдельных испытуемых и их групп в выборке определения Н. Так, если оценки обследуемых концентрируются в узком диапазоне значений и близки друг другу, следует ожидать, что при повтор­ном обследовании оценки также располо­жатся в тесной гомогенной группе. Воз­можные изменения ранговых мест будут внешне незначительны, и в таком случае коэффициент Н. будет завышен. Такое же неоправданное завышение коэффициента может возникнуть при анализе Н. на ма­териале выборки, включающей контраст­ные группы лиц, напр, имеющих самые высокие н самые низкие оценки по тесту. Тогда эти далеко отстоящие оценки заве­домо не будут перекрываться под воздей­ствием случайных причин.

В практике психодиагностики при раз­работке руководств и методик обычно указывается характер групп, на которых проводилось определение Н. Коэффици­енты Н. нередко рассчитываются для кон­кретных контингентов испытуемых, раз­личающихся по полу, возрасту, уровню образования, профессиональной подго­товке. Нередко производят расчет Н. раз­дельно для групп испытуемых, получив­ших по тесту высокий или низкий результат (см. Станфорд—Бине ум­ственного развития шкала).

Важнейшим средством повышения Н. психодиагностических методик является

стандартизация процедуры обследова­ния. При строгой регламентации процеду­ры обследования (обстановка и условия работы испытуемого, характер инструк­ции, временные ограничения, способы и особенности контакта с испытуемым, по­рядок предъявления элементов методики, получения оценок первичных и т. д.) су­щественно уменьшается дисперсия ошиб­ки и повышается Н. теста.

Если исходить из широкого понимания Н. как отражения в результате исследова­ния удельного веса измеряемого парамет­ра и совокупности посторонних факторов, то можно усмотреть определенную связь Н. с другой важнейшей комплексной ха­рактеристикой психодиагностической ме­тодики — валидностью.

Н. — устойчивость процедуры относи­тельно объектов исследования. Валид-ность — однозначность, устойчивость от­носительно измеряемых свойств объекта (т. е. предмета измерения). Устойчивость теста относительно объектов (испытуе­мых) является необходимым, но не доста­точным условием его устойчивости отно­сительно измеряемых свойств объектов. Следовательно, Н. является необходи­мым, но не достаточным условием валид-ности. Это означает, что валидность тес­та не может качественно и количествен­но превышать Н. Данное соотношение нельзя, однако, трактовать как указание на прямую пропорциональную связь ха­рактеристик валидности и Н. Повышение Н. отнюдь не сопровождается обязатель­ным повышением валидности. Напр., у те­ста-опросника из одного вопроса внут­ренняя согласованность предельна, од­нако валидность у него минимальна.

НАДЕЖНОСТЬ ПАРАЛЛЕЛЬНЫХ ФОРМ — характеристика надежности психодиагностической методики с помо­щью взаимозаменяемых форм теста (см. Параллельная форма теста). При этом

одни и те же испытуемые в выборке опре­деления надежности обследуются внача­ле с использованием основного набора заданий, а затем — с применением анало­гичных дополнительных наборов. Коэф­фициент надежности по типу Н. п. ф. мо­жет быть определен и другим способом, а именно: испытуемые делятся примерно на равные группы, затем одной из них пред­лагается форма А теста, а другой — фор­ма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке.

Такая процедура обследования лише­на значительной части недостатков спосо­ба определения надежности ретесто-вой. Так как в параллельной форме ис­пользуется другой по содержанию мате­риал, возможность тренировки и запоми­нания отдельных решений уменьшается. Важнейшим преимуществом данного ме­тода является сокращение временного ин­тервала перед повторным обследованием. Основным показателем Н. п. ф. является коэффициент корреляции между резуль­татами первичного и повторного обследо­ваний, который позволяет оценить как временную стабильность теста (собствен­но надежность), так и степень соответ­ствия результатов обеих форм теста. Если формы применяются непосредственно одна за другой, то корреляция отражает их взаимозаменяемость.

Отношение между параллельными формами теста имеет сложный характер. Оба набора заданий должны не только от­вечать одним и тем же требованиям, изме­ряя идентичные показатели и давая сход­ные результаты, но вместе с тем быть от­носительно независимыми друг от друга. На практике эта задача осуществима да­леко не для всех тестовых заданий (в осо­бенности это касается личностных мето­дик, опросников), что существенно огра­ничивает сферу применения Н. п. ф. Дру-

гим недостатком характеристики надеж­ности по типу Н. п. ф. является возмож­ность усвоения испытуемым принципа ре­шения, общего для основной и параллель­ной форм. Таким образом, в случае оцен­ки Н. п. ф. влияние тренировки и навыка, приобретаемого при повторном обследо­вании, если и снижается по сравнению с характеристикой надежности ретестовой, однако не устраняется полностью.

НАДЕЖНОСТЬ ПО ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ — способ опре­деления надежности, опирающийся на оценку степени выраженности интеркор­реляционных связей между заданиями, составляющими тест.

В данном случае истинный показатель по тесту понимается как результат, кото­рый получил бы испытуемый, если бы ему были предъявлены все возможные зада­ния, относящиеся к черте или свойству, являющемуся объектом тестирования. Каждый конкретный тест является выбор­кой из генеральной совокупности зада­ний. Погрешность измерения отражает степень, в которой реальная выборка за­даний охватывает теста заданий сово­купность генеральную. Генеральная со­вокупность заданий порождает бесконеч­но большую корреляционную матрицу парных связей между заданиями. Среднее значение корреляции между заданиями для этой матрицы (Тц) указывает на сте­пень общности, внутренней согласован­ности, заданий. Так, если, например, в те­сте было бы одно задание из множества независящих друг от друга, то ?ц ~ 0,00. Предполагается, что все задания имеют одинаковые значения взаимной корре­ляции.

Исходя из основных положений оцен­ки Н. п. в. с, можно сказать, что корреля­ция некоторого задания с истинным пока­зателем (г.() равна квадратному корню от

его средней корреляции с другими задани­ями (Дж. Наннелли, 1978):

строго говоря, этот вывод справедлив тог­да, когда количество заданий приближа­ется к бесконечности.

С точки зрения разработчика теста, соотношение r.t и г.. имеет важное значе­ние, поскольку при разработке значитель­ного количества заданий и выборе из них тех, для которых значение лГц будет наи­большим, созданный тест будет надеж­ным и свободным от погрешностей изме­рения. Аналогичные рассуждения, касаю­щиеся взаимосвязи заданий, могут быть применены к надежности параллельных форм тестов. В данном случае каждый из параллельных тестов рассматривается как случайная выборка из генеральной со­вокупности заданий. Средние значения и дисперсии тестов отличаются от истинно­го показателя только случайным образом. Следовательно, в приведенном выше уравнении значения для заданий могут быть заменены показателями для тестов (т. е. наборов заданий).

Так как корреляции между заданиями или параллельными тестами на практике не являются идентичными, должно быть некоторое распределение их вокруг ис­тинного значения. Если предположить, что такое распределение является нор­мальным (см. Нормальное распределе­ние), можно оценить точность коэффици­ента надежности Тц путем вычисления стандартной ошибки (см. Ошибка изме­рения) средней взаимной корреляции за­даний или тестов в генеральной совокуп­ности (Дж. Наннелли, 1978):

ций задании внутри теста ил — количе­ство заданий в тесте.

Из уравнения видно, что по мере воз­растания стг. возрастают различия между корреляциями и по мере возрастания п стандартная погрешность уменьшается, то есть чем больше заданий, тем выше точность оценки коэффициента надежно­сти. Действительно, если предположить, что сгг для некоторого теста равна 0,15, а количество заданий варьирует от 10 до 30, то, подставив соответствующие значения в уравнение, получим следующие по­грешности: для теста из 10 заданий — 0,02; для теста из 20 заданий — 0,01; для теста из 30 заданий — 0,007.

Вслед за Дж. Наннелли (1978), П. Клайн (1986) распространяет сужде­ние о возрастании точности коэффициен­та надежности при увеличении состава теста и на саму величину надежности. В самом деле, поскольку истинные пока­затели теста определяются через меру представленности заданий генеральной совокупности, должно выполняться пред­положение о том, что чем больше тест, тем выше корреляция с истинным показа­телем. Предельным случаем будет гипоте­тическая ситуация, когда тест состоит из всех заданий генеральной совокупно­сти за исключением одного. Для доказа­тельства надежности теста, задания кото­рого, как заранее известно, принадлежат одной генеральной совокупности, можно воспользоваться формулой Спирмена— Брауна:

где rt — надежность теста, п —- количе­ство заданий, Ц, — средняя взаимная кор­реляция заданий. В формуле Спирмена Брауна показатель г,' (см. Надежность частей теста) заменен на Тц, что выте­кает из вывода модели коэффициента на­дежности.

Предположим, имеются три набора за­даний (п = 10, 20, 30), средняя корреля­ция между которыми равна 0,20, тогда:

10-0.20 nRfi7 О667

Причем эти показатели получены для заданий, взаимная корреляция которых была низкой. Для более однородного тес­та из 30 заданий при 7ц = 40 получаем:

Таким образом, при наличии набора однородных заданий тест будет заведомо надежным. Даже если разделить совокуп­ность заданий на две параллельные фор­мы по 15 пунктов, они обе также будут иметь удовлетворительную надежность.

Теоретические значения коэффициен­та надежности при данном способе опре­деления существенно превышают эмпи­рические значения надежности ретесто-вой и надежности параллельных форм. Это происходит из-за ряда допущений. Прежде всего следует указать на то, что при определении Н. п. в. с. не учитывают­ся другие источники погрешности измере­ний, связанные с неконтролируемыми факторами среды, состояния и мотивации испытуемого (см. Надежность). В этой связи между Н. п. в. с. и ретестовой на­дежностью имеется противоречие. Ретес-товая надежность может уменьшаться при увеличении состава заданий (чем больше заданий, тем выше вероятность случайного или закономерного изменения ответа при ретесте). Противоречие может быть снято за счет признания некоррект­ности допущения о равенстве интеркорре-

ляций между заданиями, зависимости по­грешности лишь от представленности в тесте генеральной совокупности заданий. В противном случае необходимо было бы согласиться с тем, что в двух тестах, свя­занных общим фактором и имеющих оди­наковое количество заданий, но совер­шенно разных по характеру выполнения и трудности, надежность будет одинаковой, что невозможно.

Следует обратить внимание на невоз­можность определения таким способом надежности тестов скорости, так как связь каждого из заданий исследуемой ге­неральной совокупности не определена из-за большого количества заданий, ин­теркорреляции заданий могут терять смысл (см., напр., Корректурная проба).

Важным аспектом оценки примени­мости Н. п. в. с. является парадокс, возни­кающий в этом случае при сочетании по­казателей надежности и валидности теста. Кажется, что высокая внутренняя согласованность должна быть основной целью разработчиков теста (Л. Кронбах, 1920). Такая точка зрения является до­вольно распространенной. Однако Р. Кэт-телл (1977) обоснованно утверждает, что высокая внутренняя согласованность (особенно при изучении сложных психо­логических конструктов, личностных по­казателей) в известном смысле противо­стоит высокой валидности.

Возникающее противоречие можно иллюстрировать следующим примером. Тест вербальных способностей может включать задания (и соответственно, суб­тесты) на подбор антонимов, синонимов, понимание слов, словарный запас. Пред­положим, что каждый из субтестов имеет высокие показатели Н. п. в. с. Однако если бы мы воспользовались только одним субтестом (например, подбором антони­мов), то показатель Н. п. в. с. теста несом­ненно возрос бы по сравнению с полным набором субтестов, так как используется

только один тип высокосогласованных за­даний. Высокая надежность субтеста ан­тонимов будет отражать тот факт, что эта выборка заданий в высокой степени кор­релирует с гипотетической генеральной совокупностью заданий на антонимы. Од­нако этот истинный показатель отражает не вербальные способности, а только спо­собность подбирать антонимы (т. е. валид-ность теста станет низкой по отношению к измерению вербальных способностей). Приведенные данные свидетельству­ют о специфичности применения каждо­го из имеющихся подходов к характерис­тике надежности теста. Н. п. в. с. имеет, очевидно, в основном теоретическое зна­чение. Как и надежность частей теста в предельном случае разбивания материа­ла на отдельные задания, рассматривае­мый способ имеет практическое значе­ние для оценки точности коэффициента надежности, а также при характеристи­ке некоторых тестов, состоящих из спе­циально подобранных факторизованных заданий (см. Факторно-аналитический принцип).

НАДЕЖНОСТЬ РЕТЕСТОВАЯ — ха­рактеристика надежности психодиагно­стической методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста. Надеж­ность в этом случае вычисляется по соот­ветствию результатов первого и второго обследований или по сохранению ранго­вых мест испытуемых в выборке при рете­сте. Коэффициент надежности (г) соот­ветствует коэффициенту корреляции между результатами таких обследований. При использовании интервальных шкал (см. Шкалы измерительные) применяет­ся коэффициент корреляции произведе­ния моментов Пирсона (см. Корреляци­онный анализ). Для шкал порядка в ка­честве меры устойчивости к перетестиро­ванию может быть использован коэффи-

циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).

При характеристике Н. р. особое зна­чение имеет временнбй интервал между первым и вторым обследованиями. С его увеличением показатели корреляции име­ют тенденцию к снижению, существенно повышается вероятность воздействия по­сторонних факторов — могут наступить закономерные возрастные изменения из­меряемых тестом свойств, произойти раз­личные события, влияющие на состояние и особенности развития исследуемых ка­честв. По этой причине при определении Н. р. стараются выбирать непродолжи­тельные временные интервалы (до не­скольких месяцев), а при обследовании детей младшего возраста эти интервалы должны быть еще меньше, поскольку воз­растные изменения и развитие в этом слу­чае происходят еще быстрее.

Несмотря на указанную тенденцию, при получении характеристик теста про­водятся повторные испытания и с дли­тельным временным промежутком. Иног­да они осуществляются в целях оценки валидности прогностической, элемен­тов валидности конструктной, связан­ных с дифференциацией по возрастному критерию и др. Определение же Н. р. главным образом ограничивается анали­зом краткосрочных случайных измене­ний, характеризующих тест как измери­тельную процедуру, а не его отношение к исследуемой области поведения.

Наряду с очевидной простотой Н. р. как метод определения надежности обла­дает существенными недостатками. Так, при повторном применении одних и тех же заданий, особенно при относительно непродолжительном временном интерва­ле между обследованиями, у испытуемых может сформироваться навык работы с данной психодиагностической методикой, что приводит к улучшению индивидуаль­ных результатов, хотя и не одинаково вы-

раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест отдельных испытуемых в данной вы­борке и, соответственно, ухудшению ко­эффициента надежности. Еще более за­метное воздействие на результаты анали­за надежности оказывает запоминание ис­пытуемыми отдельных решений, воспро­изведение в повторном обследовании пре­дыдущей картины правильных и непра­вильных решений. В этом случае резуль­таты двух предъявлений теста не будут независимыми и корреляция между ними окажется завышенной.

Один из путей устранения влияния тренировки на результаты оценки Н. р. — формирование устойчивого навыка в ра­боте с соответствующей методикой перед проведением тест-ретеста. Однако коли­чество повторений теста при этом неиз­бежно возрастает, что приводит к увели­чению числа запомнившихся решений. Такой прием может быть рекомендован для методик типа тестов скорости, со­держащих большое количество элементов тестового материала.

Для других методик, очевидно, един­ственным приемлемым путем снижения влияния тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше, вступает в противоре­чие с определением надежности как ха­рактеристики теста.

Для большинства тестов общих спо­собностей характерно улучшение показа­телей Н. р. с возрастом испытуемых за счет лучшего контроля условий их выпол­нения. Другим фактором увеличения рас­четных показателей Н. р. является отно­сительное замедление с возрастом темпа психического развития в области тех ха­рактеристик, которые могут стать объек­том измерения или влиять на результат теста. Благодаря этому, спустя время, со­ставляющее интервал ретеста, случайные колебания результатов обследования ста-

новятся менее выраженными. Это искус­ственно завышает показатели Н. р. Эта закономерность требует отдельных изме­рений Н. р. в разных возрастных контин-гентах испытуемых, что особенно суще­ственно для методик, предназначенных для обследования в широком возрастном диапазоне (см. Станфорд—Бине ум­ственного развития шкала, Векслера интеллекта измерения шкалы).

Указанные особенности и недостатки метода определения надежности путем ретеста делают его пригодным лишь для ограниченного числа методик, допускаю­щих многократное повторное обследова­ние. К их числу относятся сенсомоторные пробы, тесты скорости и ряд других мето­дик, отличающихся большим количеством пунктов (см. Миннесотский многоас­пектный личностный опросник).

НАДЕЖНОСТЬ ФАКТОРНО-ДИС­ПЕРСИОННАЯ — способ определения

надежности, основанный'на дисперси­онном анализе результатов теста. На­дежность теста соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого фактора) к реально полученной эмпирической дисперсии. По-_ следняя складывается из истинной дис­персии и дисперсии погрешности изме­рения (см. Ошибка измерения). Фак­торно-аналитический подход к опреде­лению надежности дополнительно рас­членяет и дисперсию истинного показа­теля (Дж. Гилфорд, 1956).

Дисперсия истинного показателя, в свою очередь, может состоять из диспер­сии общего фактора для групп аналогич­ных тестов (см. Фактор G), особых фак­торов, обеспечивающих тесты специфи­ческой направленности (см. Факторы групповые) и дисперсии факторов, прису­щих конкретной тестовой методике. Сле­довательно, полная дисперсия теста рав­на сумме дисперсий для общих, специфи-

ческих и единичных факторов плюс дис­персия погрешности:

где ах — доля дисперсии, выраженная об­щим фактором а, и т. д.

Таким образом, коэффициент надеж­ности теста равен:

Факторно-дисперсионный способ оп­ределения надежности подходит для оцен­ки уже факторизованного теста (см. Фак­торно-аналитический принцип), но не для тестов, измеряющих широкий набор разнообразных параметров, так как неко­торые из них могут не входить в установ­ленную область валидности методики.

НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА

характеристика надежности психодиаг­ностической методики, получаемая путем анализа устойчивости результатов от­дельных совокупностей тестовых задач или единичных пунктов (заданий) теста. Наиболее простым и распространен­ным способом определения Н. ч. т. явля­ется метод расщепления, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста. Обоснованием метода является вывод о том, что при нормальном или близком к нормальному распределении оценок по полному тесту (см. Нормальное распре­деление) выполнение любого случайного




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 1100; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.058 сек.