Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Валидность тестовых измерений




Надежность тестовых измерений

Надежность – характеристика, связанная с постоянством получаемых результатов

- Стабильность результатов тестовых испытаний и устойчивость теста к разнообразным помехам, их источникам

Виды надежности

1. тест-ретест надежность – повторное проведение + коэффициент корреляции между двумя показателями.

2. Надежность параллельных форм теста – коэффициент надежности равен корреляции параллельных форм теста

3. Высокое значение коэффициента корреляции указывает не только на высокую надежность результата сравниваемых тестов, но и на эквивалентность содержания этих тестов

 

Надежность лучше определяется на наиболее однородных выборках, т.е. на выборках, схожих по полу, возрасту, уровню образования, профессиональной подготовке и т.п. Для каждой такой выборки приводятся свои коэффициенты надежности. Приводимый показатель надежности применим только к группам, подобным тем, на которых он определялся. Если методика применяется к выборке, отличающейся от той, на которой проверялась ее надежность, то эта процедура должна быть проведена заново.
Для вычисления показателей надежности обычно применяют коэффициенты корреляции. Надежность тем выше, чем больше полученный коэффициент корреляции приближается к единице.
К.М. Гуревич предлагает определять надежность по трем показателям:
- показатель, характеризующий измерительный инструмент (коэффициентом надежности)
- показатель, характеризующий стабильность измеряемого свойства (коэффициентом стабильности)
- показатель оценки влияния личности экспериментатора (коэффициентом константности)

 

Определение надежности теста.

Тест является надежным, если с его помощью получаются одни и те же показатели для каждого обследуемого при повторном тестировании.

Ретестовая надежность – предполагает повторное предъявление того же самого теста те же испытуемым и примерно в тех же условиях, что и первоначальное, а затем установление корреляции между двумя рядами данных.

Наименьшим удовлетворительным значением для ретестовой надежности явл. коэффициент корреляции равный 0.7.

Надежность частей опросника – деление опросника на 2 части. Затем засчитывается корреляция между этими частями. Следует прибегать только, когда нужно быстро проверить. В таком случае выборка должна составлять около 200 человек (в идеале).

 

ВАЛИДНОСТЬ – это характеристика теста, отражающая его способность получать результаты, соответствующие поставленной цели и обосновывающая адекватность принимаемых решений.

ВАЛИДИЗАЦИЯ – процесс накопления подтверждений для доказательства валидности теста

 

Выделяют три вида валидности – содержательную, критериальную и конструктную

КОНСТРУКТНАЯ ВАЛИДНОСТЬ (концептуальная валидность) определяется в случаях, когда представление об измеряемом свойстве существует в форме абстрактного образа, модели. Для объяснения определенных качеств личности создается концептуальная модель, которая с помощью тестов подтверждается или опровергается.

КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ (эмпирическая валидность) предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста.

Имеется два вида критериальной валидности – текущая и прогностическая.

Текущая критериальная валидность характеризует способность теста измерять некоторые качества личности. Валидность теста подтверждается корреляцией с некоторым внешним критерием, существующим в данное время. Допустим, тест показал для некоторого испытуемого отличные знания по предмету, а школьные отметки, выставленные учителем – неудовлетворительные. Если мы в качестве внешнего, независимого и достоверного критерия выберем школьные отметки, то критериальная валидность теста – низкая, даже если он имеет высокую надежность.

Прогностическая критериальная валидность (predictive validity) характеризует способность теста предсказывать будущие качества, формирующихся в результате воздействия внешних обстоятельств или целенаправленной собственной деятельности. Этот тип валидности характеризует корреляцию результатов тестирования с внешним критерием, который появится в будущем.

СОДЕРЖАТЕЛЬНАЯ ВАЛИДНОСТЬ (content validity) характеризует тест по степени его соответствия предметной области.

Согласно А.Анастази, содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области поведения.

Для обеспечения содержательной валидности необходим детальный анализ учебных программ, на основании чего составляется спецификация теста. Спецификация содержит перечень учебных тем, их важность, количество и тип тестовых заданий. Оценка содержательной валидности выполняется экспертом в данной предметной области.

Согласно П.Клайну содержательная валидность определяется следующим образом:

1) указать категорию лиц, для которой предназначен тест;
2) составить список знаний, умений, навыков, подлежащих тестированию;
3) выполнить внешнюю экспертизу полученного списка на предмет его полноты и обоснованности;
4) на основе списка составить перечень заданий;
5) выполнить внешнюю экспертизу полученных заданий;
6) после проверки преобразовать их в задания в тестовой форме. В дальнейшем, на этой основе создать тестовые задания, образующие тест, который будет содержательно валидным.

 

Стандартизация теста.

Позволяет сравнить показатели, полученные одним испытуемым, с таковым в генеральной совокупности или соответствующих группах.

Стандартизация важна в тех случаях, когда осуществляется сравнение показателей обследуемых. При этом вводится понятие нормы \ нормативных показателей.

Репрезентативность выборки – более важный параметр, чем объем. В некоторых случаях приходится формировать насколько групп стандартизации или стратифировать группу стандартизации относительно таких параметров как возраст, пол, соц статус.

Нормы для каждой группы должны быть представлены в средниз велечиназ и показателей стандартного отклонения. Стандартные показатели 0 тип производной оценки, удовлетворяющий большинству предъявляемых требований к псих. измерению.

Стандартные показатели получают двумя способами:

1. Линейным

2. Нелинейным преобразованием первичных \ сырых оценок.

При линейном преобразовании сохраняются все св- ва исходного распределения сырых оценок такие показатели называются стандартными или z –показатели. Для их вычисления находится разность меду первичной оценкой и средней для нормативной группы и делят ее на стандартное отклонение нормативной группы. (формула)

Определение теста и выбор метода шкалирования – генерирование заданий – дотестовые задания – пересмотр – принятие - конструирование шкалы – пилотаж – стандартизация – сбор нормативных показателе – валидизация \ кросс - валидизация – публикация руководства – пересмотр.




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 922; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.