КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Валидность консенсусная 1 страница
(consensual validity) — тип валидности, основывающейся на установлении связи (корреляции) тестовых данных с данными, полученными от внешних экспертов, хорошо знакомых с теми лицами, которые были подвергнуты тестированию. Понятие и процедура В. к. введены Р. Мак-Краэ в 1982 г. с целью обеспечения валидизации опросников личностных, которая нередко затруднена (а иногда и невозможна) в связи с отсутствием необходимых для установления валидности критериев. ВАЛИДНОСТЬ КОНСТРУКТНАЯ — один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Иначе говоря, В. к. определяет область теоретической структуры психологических явлений, измеряемых тестом. Поскольку проявления таких конструктов, как, напр., интеллект в деятельности человека многообразны и неоднозначны с т. з. их выделения, процедура установления В. к. по сравнению с валидностью критериальной или валидностью содержательной сложна. При объяснении связи полученных тестовых результатов с теоретическим конструктом необходимо постепенное накопление разнообразной информации о динамике развития измеряемого свойства, а также о его взаимодействии с другими психическими явлениями. Среди конкретных методов характеристики В. к. в первую очередь необходимо назвать сопоставление исследуемого на предмет В. к. теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика. Такая процедура валидизации напоминает определение критериальной валидности в том смысле, что эталонный тест, валидность которого определена, выступает в качестве независимого критерия. Следует, однако, заметить, что, в отличие от критериальной валидизации, при анализе В. к. не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию и результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с т. з. создания параллельной формы теста. Смысл процедуры В. к. состоит в установлении одновременно как сходства, так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным. При анализе В. к. методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широким кругом других тестов, направленных на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. При этом В. к. характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где, исходя из гипотезы, значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная (проверка степени близости прямой или обратной связи) и дискриминантная (установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений В. к. В англоязычной психодиагностике такое операциональное определение В. к. обозначается как «предполагаемая валидность» (assumed validity). Прямое отношение к характеристике В. к. имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленное™ в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид В. к. — факторную валидность. Важным аспектом В. к. является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста. Следует отметить, что критерий внутренней согласованности указывает лишь на меру связи всего содержания теста с измеряемым конструктом, давая лишь косвенную информацию о природе измеряемого свойства. При определении В. к. важное место принадлежит изучению динамики измеряемого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов является применение критерия возрастной дифференциации (см. Валидность по возрастной дифференциации), что предусматривает согласование результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство в возрастной динамике при переходе на новый этап развития. Этот метод В. к. особенно важен для валидизации тестов интеллекта, достижений в обучении. В комплекс сведений о В. к. методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, несут информацию, позволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики В. к. необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако В. к. является качественно более высоким и комплексным уровнем описания теста, характеризуя область измеряемого поведения в широких психологических понятиях. Благодаря данным В. к. мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность. В качестве примера, иллюстрирующего необходимость глубокого анализа теоретического конструкта, лежащего в основе конкретной методики, для правильного применения теста и интерпретации его результатов, можно привести сопоставление двух популярных опросников личностных «Проявления тревожности» шкалы (MAS) и варианта Айзенка личностных опросников ЕРI. Корреляционные исследования показывают, что шкала «тревожности» MAS положительно коррелирует со шкалой «нейротизма» и отрицательно — со шкалой «экстраверсии» EPI. С т. з. концепции Айзенка, эти данные можно рассматривать как свидетельство низкой валидности шкалы MAS: «тревожность» коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой т. з. MAS оказывается просто нечувствительным к особой разновидности «нейротизма» — нейротизму (тревожности) экстравертов: из перечня пунктов MAS исключены высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с теоретических позиций К. Спенса и Дж. Тейлор, эта ситуация вполне закономерна, желательна и никак не является артефактом — следствием дефекта данного диагностического средства. Согласно К. Спенсу, пытавшемуся переносить на человеческое поведение теорию научения Халла, MAS измеряет общий уровень драйва — неспециализированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфическая активация, по Айзенку) и интроверсии (неспецифическая активация) (Практикум по психодиагностике, 1984). Таким образом, названия тестов не всегда однозначно выражают понятия об измеряемом свойстве. В данном примере особенно подчеркивается роль психологической теории, лежащей в основе методики для раскрытия содержания показателей, получаемых с ее помощью.
ВАЛИДНОСТЬ КРИТЕРИАЛЬНАЯ — комплекс характеристик, включающий валидность текущую и прогностическую методики и отражающий соответствие диагноза и прогноза определенному кругу критериев измеряемого явления. В качестве валидизации критерия выступают независимые от результатов теста и непосредственные меры исследуемого качества, такие как уровень достижений в какой-либо деятельности, степень развития способности, выраженность определенного свойства личности и т. д. Так, В. к. опросника личностного для измерения социальной интроверсии может быть определена на основании сопоставления результатов теста с экспертными оценками хорошо знающих обследуемого лиц, с результатами наблюдения за проявлением этой особенности в его поведении, с объективными сведениями о круге общения. При валидизации тестов достижений результат измерений сравнивается с мнением педагогов о знаниях обследуемого в определенной области, с академическими оценками, контрольными проверками и т. д. В случае валидизации профориентационных тестов и методик тестовые оценки сравниваются как с экспертными оценками коллег и руководителей, так и с объективными показателями достижений в профессиональной сфере. В. к. включает как комплекс связей с текущим состоянием изучаемого явления, так и вероятность и обоснованность прогноза о его состоянии в будущем. Здесь в рамках В. к. различаются валидности текущая (диагностическая, конкурентная) и прогностическая. В случае характеристики текущей В. к. изучение корреляции результатов теста с независимыми критериями проводится параллельно с измерением. Таким образом, показатели текущей В. к. указывают на степень репрезентации характеристик изучаемого психического явления в результате теста. Предсказательная В. к. может отражать как соответствие прогноза, сделанного на основании данного теста, с реальным состоянием измеряемого качества спустя некоторое время, так и временной интервал, в котором результат теста является валидным. Валидизация по какому-либо критерию эффективно осуществляется методом контрастных групп. При этом, как правило, используют сложный критерий, в котором отражено комплексное влияние различных факторов. Напр., при характеристике В. к. теста интеллекта показатели умственно отсталых детей могут быть сопоставлены с показателями нормальных школьников того же возраста. Множество факторов, обусловивших помещение ребенка в специальное учреждение для детей с глубокой умственной отсталостью, составят критерий валидизации. Аналогично В. к. личностного опросника, предназначенного для выявления «уровня невротизации», определяется на основе сравнения его результатов у пациентов, страдающих неврозами, и практически здоровых людей. Такой критерий в силу его обобщенности и интегративности приближает В. к. к области валидности конструктной. Более эффективным с т. з. практической направленности теста (т.е. его адекватности как средства диагноза и прогноза реальной деятельности) является соотнесение результатов с критериальными мерами определенных существенных элементов изучаемой деятельности или способности. Так, напр., тест для определения профессиональных способностей конторского служащего может включать анализ грамотности письма, счетных способностей, комбинаторного мышления, навыков делового общения и т. д. Валидность такого сложного по составу теста, включающего разные группы заданий, может определяться, как показано выше, критерием «успешности трудовой деятельности», однако более точным и правильным будет соотнесение с ее элементами, перечисленными выше, по отдельности. Информация о текущей или прогностической валидности по такому элементному критерию носит название синтетической валидности. Процесс валидизации в данном случае складывается из детального анализа тестируемой деятельности для выявления ее существенных составных элементов, определения удельного веса элементов в составе сложной деятельности; определения связи с критериями по каждому из выделенных элементов деятельности; определения валидности теста путем «синтеза весов» отдельных элементов в реальной деятельности и в тесте (см. Валидности коэффициенты). Валидизация теста может осуществляться на основе критерия, отражающего событие или состояние качества в прошлом (ретроспективная валидизация). Сведения такого рода, как правило, являются дополнительными и применяются в случаях невозможности валидизировать тест по текущему или перспективному критерию. Одним из видов В. к. является валидность инкрементная. ВАЛИДНОСТЬ ОЧЕВИДНАЯ — представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. В. о. не является компонентом объективно устанавливаемой валидности. Вместе с тем высокая В. о. в большинстве случаев является весьма желательной. Она выступает в качестве фактора, побуждающего испытуемых к обследованию, способствует более серьезному и ответственному отношению к работе по выполнению заданий теста и к заключениям, формулируемым психологом. Достаточный уровень В. о. особенно значим для методик обследования взрослых. Если содержание тестовых заданий будет представляться несерьезным, чрезмерно легким, не соответствующим сути изучаемой дстттслытоспт. это может привести к ироническому, негативному или враждебному отношению испытуемых к ситуации обследования. Напротив, гипертрофированное отношение к возможностям методики, не вполне адекватное представление о ее направленности и прогностической значимости может вызвать избыточную мотивацию, нежелательную эмоциональную напряженность при обследовании, выраженное установочное поведение. Очевидно, что в приведенных случаях за счет неадекватной В. о. реальная валидность теста снизится. Представления испытуемых и пользователей психодиагностической информацией о В. о. в немалой степени определяются названием методики, поскольку эта часть сведений о тесте наиболее доступна неспециалистам. Для предупреждения неадекватных мнений о методике следует избегать помещения на бланках, опросных листах, тестовых тетрадях туманных, необоснованно общих названий, которые могут быть неправильно истолкованы (напр.: «Тест личности», «Тест умственных способностей», «Комплексная батарея оценки достижений» и т. д.). Адекватность В. о. повышается путем введения в инструкцию краткой характеристики целей исследования. В. о. существенно улучшает применение понятных формулировок и терминов, а также заданий, по содержанию являющихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Неадекватно завышенная В. о. способствует более выраженному проявлению эффекта контаминации критерия. В. о. иногда носит название внешней (face validity), или «доверительной» (faith validity), валидности. ВАЛИДНОСТЬ ПО ВОЗРАСТНОЙ ДИФФЕРЕНЦИАЦИИ -один из ком понентов валидности конструктной, связанный с возрастной динамикой изменений исследуемого качества. Характеристика валидности по конструкту здесь заключается в определении соответствия результатов теста теоретически ожидаемым и практически наблюдаемым возрастным изменениям данного конструкта или свойства. Наибольшее значение В. в. д. имеет для характеристики валидности тестов, направленных на измерение психологических свойств, функций, отличающихся относительно быстрым изменением под воздействием индивидуального опыта, выраженной иерархичностью ступеней развития (осведомленность, навыки, интеллектуальные операции и др.). По этой причине В. в. д. является главным оценочным критерием при валидизации тестов интеллекта, особенно предназначенных для детей. Здесь закономерное повышение результатов выполнения заданий теста в каждой последующей возрастной группе является основным психометрическим принципом диагностики уровня развития, базой для построения психометрической шкалы. Прослеживается связь В. в. д. с валидностью текущей за счет более точной дифференциации возрастных этапов развития исследуемых свойств. Большое значение В. в. д. имеет и для характеристики валидности тестов способностей, достижений, уровня образования, навыков, умений. Высокие показатели по этому критерию необходимы также для методик, применяемых в клинике в целях повышения точности дифференцированной диагностики изменений возрастного и патологического характера, психодиагностического обследования лиц пожилого и преклонного возраста. В ряде случаев В. в. д. обнаруживает связь с валидностью прогностической методик. Наличие высоких показателей по этому критерию означает стабильное изменение исследуемых свойств в большой статистической выборке при переходе от одной возрастной группы к другой, повышает точность индивидуального прогноза. Критерий В. в. д. обычно не находит широкого применения при валидизации методик, предназначенных для психологической диагностики функций, свойств, не обнаруживающих четкой и однозначной тенденции к возрастным изменениям. К их числу, в частности, относятся методики диагностики личности. Одной из конкретных форм выражения показателей В. в. д. является статистический анализ достоверности различий между результатами теста у испытуемых различного возраста. Более точным, однако и более трудоемким и продолжительным методом определения В. в. д. является лонгитюдное исследование.
ВАЛИДНОСТЬ ПРОГНОСТИЧЕСКАЯ — информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. В. п. отражает временной интервал, на который распространяется обоснование такого суждения. Сведения о В. п. имеют самое непосредственное отношение к раскрытию предсказательной силы методики, выяснению степени обоснованности сформулированного на ее основе ближайшего и более отдаленного прогноза, анализу значимости получаемых в тесте показателей с т. з. экстраполирования результатов на будущее. В стандартных требованиях к педагогическим и психологическим тестам (Standarts.... 1974) различают В. п. и валидность текущую в зависимости от временной связи между критерием и тестом. Эти два вида относятся к валидности критериальной теста. Иногда говорят о предсказательной валидности. Термин «предсказание», по мнению А. Анастази (1982), может использоваться как в широком смысле, означая прогноз на основе данных тестирования поведения испытуемого в реальной (критериальной) ситуации, так и в более узком смысле, указывая лишь на временной интервал. В последнем смысле он и используется в В. п. Характеристика В. п. определяет отрезок времени, для которого задается или проверяется связь с критерием исследуемых качеств. В качестве валидизации критерия могут выступать не только показатели актуального поведения, но и ожидаемые результаты деятельности, лечения, обучения и т. д. Процедура определения В. п. опирается на анализ корреляции между оценками по тесту и предсказанными результатами деятельности, формирующимися свойствами личности, исходом лечения и т. п. Вместе с тем различие двух видов критериальной валидности связано не только с временными пределами критериальных сопоставлений. Валидность текущая и В. п. отражают разные цели применения методики: текущий диагноз, оценка настоящего положения, с одной стороны, и прогнозирование развития качества или успеха в деятельности — с другой. Сравнивая В. п. и валидность текущую, следует отметить, что, несмотря на общий принцип критериального сопоставления, характерный для двух типов валидности, оценка В. п. является более сложной проблемой. Точность прогноза и, следовательно, суждения о В. п. находится в обратной зависимости от времени, заданного для такого прогнозирования. Обоснование отдаленной экстраполяции данных теста требует учета большего количества факторов, чем оценка диагностической значимости теста. С большими сложностями сопряжено определение В. п. для тестов, направленных на измерение комплексных свойств и видов деятельности, таких сложных психологических конструктов, как общие способности, особенности личности, уровни достижений в учебной и профессиональной деятельности и т. д. Развитие этих психологических свойств в большой степени зависит от приобретаемых знаний, навыков и может резко изменяться в зависимости от обстоятельств жизни и деятельности индивида. Особую проблему представляет прогноз качеств в случае изменения со временем наиболее важных для их реализации элементов. Так, при прогнозе достижений в овладении чтением на первых этапах обучения одним из ведущих показателей, на котором может базироваться прогноз, является беглость. Впоследствии ведущей характеристикой становится уровень понимания, развитие которого будет доминирующим при обучении чтению. С этого момента методика, опирающаяся лишь на показатели темпа, теряет прогностическую значимость, поскольку повторяет уже пройденные этапы развития навыка. При диагностике обучаемости младших школьников в комплексе показателей, на которые может опираться прогноз, на первый план выступает механическая память. В старших классах прогностическое значение этого показателя значительно снижается, уступая место смысловой организованной памяти, аналитическому усвоению знаний. Приведенные примеры указывают на необходимость глубокого анализа психологических конструктов, лежащих в основе тестов, понимания динамики их развития, четкого представления о значимости изучаемых показателей с т. з. будущей деятельности. Необходимость такого анализа при определении отдаленной В. п. сближает эти характеристики теста с валидностью конструктной. При отдаленном критериальном сопоставлении легко получить неправильное представление о В. п., если взять для сравнения независимый критерий, применявшийся раннее для текущей валидизации. Так, объективный показатель успешности профессиональной деятельности к моменту отдаленного сопоставления может оказаться слишком простым (напр., если тест достижении при анализе его диагностической валидности сопоставляется с успешностью выполнения самой простой сборочной операции, которая в момент отдаленного сравнения хорошо усваивается практически всеми испытуемыми из выборки валидизации). Более правильным будет сопоставление с новым уровнем независимого критерия, комплексом более сложных навыков и операций, требующихся для успешной профессиональной деятельности с учетом приобретенного работниками опыта. Определение нового, более сложного независимого критерия может базироваться на исследовании статистического распределения и разброса показателей критерия в выборке лиц, относительно которой проверяется В. п. методики. При использовании критериев деятельности, определяемых субъективными методами (напр., экспертной оценкой), необходимо избегать возникновения явления контаминации критерия. В ряде случаев текущая валидность заменяет В. п. Часто практически невыгодно слишком затягивать валидизацию, изучая отдаленные критериальные меры тестируемого свойства в обследуемой выборке валидизации. В качестве компромиссного решения для ускорения процедуры валидизации тест может быть проведен на группе, для которой уже имеются критериальные данные. Напр., результаты обследования студентов могут сравниваться с данными об их успеваемости, данные тестирования служащих — с их успешностью в деятельности. В отдельных случаях для быстрого получения сведений о предсказательных возможностях можно воспользоваться ретроспективной валидизацией (см. Валидность критериальная). Так, для проверки того, в какой мере хорошие результаты теста способностей соответствуют быстрому обучению в какой-либо области, можно сопоставить критериальные оценки (успеваемость, ретроспективные экспертные заключения и т. д.) за период обследования и в текущий момент у лиц с высокими и низкими оценками по тесту. Одним из наиболее надежных способов получения сведений о прогностических возможностях результата теста является метод «когорт». Предположим, следует проверить, насколько результат теста, предназначенного для изучения некоторых аспектов эмоциональных состояний у больных предсказателен в отношении вероятности возникновения психосоматических заболеваний, позволяет ли определенный результат по этому тесту судить о повышенном риске подвергнуться таким расстройствам. Учитывая вероятный объем экстремальных (контрастных) групп, выборка должна быть достаточно большой. На основании эпидемиологических данных, напр., можно предположить, что определенной болезнью в течение трех лет заболевает 57 человек из 1000. Тогда превентивной диагностикой должно быть охвачено около 2000 человек, чтобы получить численность группы заболевших порядка 100. Прогностические возможности в таком случае будут подтверждаться исходя из значимости количественных различий в результатах теста, проведенного в момент набора «когорт» из числа заболевших и здоровых (Практикум по психодиагностике, 1984). Определение В. п. обязательно для правильного использования и интерпретации результатов большинства тестов. Глубокое изучение этих характеристик необходимо для формулирования прогноза в диагностическом заключении на основании данных методики, выявления значения измеряемых тестом показателей в динамике развития изучаемых свойств и способностей. Естественно, наибольшее значение критерий В. п. имеет для методик, прямо или косвенно направленных на предсказание развития того или иного психологического свойства или вида деятельности. К их числу в первую очередь относятся тесты общих способностей, профориентационные методики, тесты отбора и т. д. Важность показателей В. п. при анализе тестовых процедур, направленных на отбор, подчеркивается введением специального понятия валидности инкрементной. Этот показатель В. п. дает информацию о том, насколько улучшается процедура отбора с применением данного теста по сравнению с традиционной (основывающейся лишь на формальных сведениях о предыдущей деятельности, анализе документов личного дела, беседах). ВАЛИДНОСТЬ СОДЕРЖАТЕЛЬНАЯ — один из основных типов валидности методики, характеризующий степень репрезентативности содержания заданий теста измеряемой области психических свойств. Комплекс сведений В. с. традиционно имеет наибольшее значение для тестов, исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной или профессиональной). Изучаемая деятельность носит, как правило, синтетический характер, складывается из многих, подчас разнородных факторов (проявления личностных особенностей, комплекс необходимых знаний и навыков, специфические способности и т. д.). Поэтому одной из важнейших задач создания адекватной модели тестируемой деятельности является подбор таких заданий, которые будут охватывать главные аспекты изучаемого феномена в правильной пропорции к реальной деятельности в целом. Валидность по содержанию закладывается в тест уже при подборе заданий будущей методики. Первым этапом валидизации является определение круга исследуемых свойств и видов деятельности, расчленение сложной способности или деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на последнем этапе проводят анализ степени соответствия разработанной модели реальной деятельности, проверку соответствия пропорций представленности элементов в заданиях теста и в реальной деятельности. Так, для тестов достижений по отдельным предметам разработке конкретного содержания тестовых задач предшествуют полная систематическая проверка соответствующих учебников и учебных программ, а также консультации со специалистами по данному предмету. На основе собранной таким путем информации составляют спецификацию теста, где указывают тестируемые области содержания (темы), задачи (процессы) обучения, а также относительное значение каждой темы и процесса для достижения целей обучения на данном этапе. Конкретные задания оцениваются экспертами по принципу их близости к реальным требованиям. Эксперты выносят суждения о том, охватывает ли тест репрезентативную выборку конкретных навыков и знаний исследуемой области обучения. Широкое использование экспертных оценок сближает В. с. с процедурой определения валидности критериальной. Однако существенным различием между этими типами валидности является то, что экспертные оценки при анализе содержания являются критерием самого теста, в то время как при критериальной валидизации они относятся к испытуемым из выборки стандартизации. Расчленение изучаемой деятельности или способности на элементы является необходимым этапом характеристики синтетической валидности (см. Валидность критериальная). В В. с. синтетический подход реализуется в анализе элементного состава содержания самого теста, а не совокупности внешних валидизации критериев. Экспертная оценка адекватности содержания заданий теста может быть дополнена при характеристике В. с. рядом эмпирических процедур. Так, можно проверить, насколько от класса к классу повышается суммарный показатель для группы и индивидуальное выполнение теста достижений. Эта процедура в значительной мере близка определению валидности конструктной с помощью критерия возрастной дифференциации (см. Валидность по возрастной дифференциации). Роль этого критерия при оценке В. с. заключается не в верификации конструкта, лежащего в основе теста, а лишь в анализе гипотез, приведших к выбору того или иного материала теста.
Дата добавления: 2015-06-04; Просмотров: 698; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |