КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Валидность
Пригодность, или валидность метода необходима для того, чтобы определить, действительно ли измеряется то, что требуется измерить или измеряется нечто другое. Иначе говоря, валидность – это соответствие предъявляемых заданий тому, что намечено проверить. Однако такое определение не разъясняет значения валидности. В этом случае возникает вопрос: «Как мы узнаем, что тест измеряет то, для чего он предназначен?» Существует много различных способов проверки валидности тестов, и каждый из них соответствует разным аспектам этого значения. О них и пойдет речь далее в этом разделе. Очевидная (внешняя) валидность (face validity) Говорят, что тест является валидным, если он измеряет именно то, что подразумевается, особенно с точки зрения испытуемых. Очевидная валидность не имеет никакого отношения к истинной валидности и важна постольку, поскольку взрослые испытуемые обычно не включаются в работу с тестами, которой недостает внешней валидности, полагая порой их глупыми и даже оскорбительными. Дети, привыкшие к школьным контрольным проверкам, не столь восприимчивы к внешним признакам теста. Очевидная валидность, таким образом, лишь помогает добиться сотрудничества с испытуемыми. Конкурентная валидность (concurrent validity) Эта валидность оценивается по корреляции результатов данного теста с результатами, полученными с помощью других измерителей. Так, если мы пытаемся установить конкурентную валидность некоторого теста, мы будем изучать его корреляцию с другими подобными тестами, валидность которых установлена. Если уже существует другой валидный тест, достаточно эффективный, чтобы он мог использоваться, то новый тест, который предстоит валидизировать, может быть в какой-то степени ненужным. Это будет так, если только тест не обладает некоторой значимой характеристикой, не присущей другим валидным тестам. Например, если он будет более коротким (по сравнению с другими), более простым в использовании, удобным для обработки или хотя бы будет явно больше нравиться испытуемым, то это вполне оправдывает разработку нового теста. С другой стороны, если нет эффективных тестов для измерения данного качества, когда новый тест затрагивает иные качества индивидуума, тогда ясно, что изучение конкретной валидности становится затруднительным. Конкурентная валидность используется чаще всего тогда, когда есть неудовлетворительно работающие тесты, а новые тесты создаются в попытке улучшить качество измерения. В случаях, подобных этому, при изучении конкурентной валидности можно ожидать значимых, но уверенных корреляций. Конкурентная валидность также полезна для установления факта, чего же не измеряет тест. Тест не должен иметь корреляции с другими тестами, имеющими совершенно иные переменные. Прогностическая валидность (predictive validity) Для установления прогностической валидности теста определяются корреляции между результатами тестирования и некоторым критерием, характеризующим измеряемое свойство, но в более позднее время (например, по результатам тестов достижений 5-го класса делать прогноз на успешность обучения математике в 10-11 классах). К сожалению, на практике этот показатель используется достаточно редко в связи с большой трудоемкостью вычисления корреляции для слишком большого числа параметров. Содержательная валидность (content validity) Термин «содержательная валидность» применятся в основном по отношению к тестам достижений, и может быть объяснен следующим образом. Если можно показать, что задания теста отражают все аспекты исследуемой области поведения, то тест является по существу валидным при условии, что инструкции изложены ясно. Содержательная валидность не сводится к простой очевидной валидности, которая связана с внешним видом заданий теста. В соответствии с требованиями содержательной валидности в заданиях должно быть отражено все основное содержание, включенное в учебный процесс, результаты которого планируется измерить. Это требование на практике реализовать трудно. Известно, что в экзаменационные билеты включается всего 2-3 вопроса, которые не могут охватить всего содержания предмета, поэтому экзамен часто не отражает истинных достижений учащегося (т.е. тест не валиден). Очевидно, содержательная валидность полезна только для тех тестов, для которых полностью ясен смысл измеряемого параметра. Один из путей повышения содержательной валидности – увеличение числа заданий, что, в свою очередь, затрудняет проведение контроля в форме непосредственной беседы ученика с преподавателем.
Функциональная валидность (function validity) Функциональная валидность может быть раскрыта как соответствие контрольного задания тому познавательному действию, которое подлежит контролю. Одни и те же предметные задания могут быть использованы в различных видах деятельности, поэтому при разработке контрольных заданий необходимо руководствоваться содержанием целей обучения – составлять такие задания, выполнение которых требует использования специфических и общедеятельностных приемов познавательной деятельности, предусмотренных целями обучения. Для того, чтобы одновременно выполнить требования содержательной и функциональной валидности, необходимо предварительно проанализировать как систему предметных заданий, так и систему специфических и логических приемов познавательной деятельности. В результате этой работы должны быть определены связи между указанными составляющими. Только после этого могут быть разработаны задания, требующие применения данных знаний в контролируемых видах деятельности. Если обратиться к практике контроля, то видно, что ни один из указанных аспектов валидности не реализуется в должной мере. Контролю подлежат предметные знания и те виды познавательной деятельности, в которой эти знания должны функционировать. Валидность и должна обеспечивать эти свойства теста как инструмента контроля. Реализуя требования содержательной и функциональной валидности, необходимо помнить, что одни и те же действия и знания можно усвоить с разными показателями. То есть выполнение любого задания может быть оценено не только как правильно или неправильно выполненное, но и по быстроте, по форме выполнения (в уме или с использованием внешних опор). Увеличение числа контрольных заданий – не единственный способ повышения степени валидности. В нашей стране разработан и другой путь. В.М. Полонский связывает повышение валидности контроля с использованием синтезированного метода контроля системы знаний. Он исходит из того, что в каждом учебном предмете существуют понятия исходные и понятия, которые строятся на их базе. Аналогично и с формируемой деятельностью: анализ запланированных видов деятельности позволяет выявить органические связи между отдельными видами деятельности, найти деятельность синтезирующую, включающую значительное число более частных видов. Например, решение любой арифметической задачи предполагает усвоение тех или иных арифметических действий, но задача требует от ученика и ряда дополнительных умений: анализа словесных условий, выражение их на языке арифметики и др. Аналогично понятие «угол» включает такие понятия, как «точка», «луч». В.М. Полонский показал, что открывается возможность замены контроля отдельных понятий и связанных с ними видов деятельности контролем через задания, требующие выполнения синтезированной деятельности. Между валидностью и надежностью измерений существуют определенные зависимости. Если измерение имеет достаточную степень содержательной и функциональной валидности, то оно будет надежным. Это легко понять: и в первом, и во втором случае контролю подвергаются не случайные элементы знаний и не случайные виды познавательной деятельности, а такая их выборка, которая с высокой степенью вероятности свидетельствует об усвоении всей системы знаний и соответствующих им видов деятельности, предусмотренных целями обучения. Однако из надежности контроля не следует его валидность. Измерение в первом и в последнем случае может касаться одних и тех же единичных знаний, одних и тех же видов деятельности. В силу этого оно может дать идентичные результаты, т.е. оказаться надежным. Но и в первом и во втором случае контроль мог не охватить всего объема знаний, поэтому полученные результаты не могут рассматриваться как показатели усвоения всего объема материала. Следовательно, измерение не удовлетворяет требованиям содержательной валидности. Аналогично контроль может быть проведен по тем видам познавательной деятельности, которые не предусмотрены целями обучения, следовательно, не обладает функциональной валидностью. Таким образом, центральными понятиями в процедуре измерения являются понятия «тест» и «тестирование». В современном понимании тест – совокупность, включающая средство, с помощью которого проводится тестовое испытание, т.е. тестовое задание, инструкцию по его применению, а также алгоритм интерпретации результатов. Исходя из данного понимания, всякий тест имеет 5 структурных элементов: - цель тестирования – какие конкретно знания и умения, учебные действия, качества личности выявляются в процессе тестирования; - инструкция испытуемым, в которой содержатся пояснения по выполнению заданий и правило (место) записи ответа; - совокупность тестовых заданий; - эталон (ключ) – список (шифр) правильных ответов; - критерии оценки (интерпретации результатов в количественном или качественном выражении). Тестирование – научно-обоснованный процесс измерения с помощью тестов интересующих качеств или свойств личности. Другими словами тест – средство, а тестирование – процесс проведения испытания (измерения). Тестирование проводится как индивидуальное, так и в группах.
Дата добавления: 2015-07-02; Просмотров: 975; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |