Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Психометричні властивості тестів




Надійність — одна із головних психомет ричних властивостей будь-якої психодіагнос тичної методики.

Надійність — це стійкість тесту, незалеж ність його результатів від впливу можливих випадкових факторів.

До таких факторів відносяться

1. Зовнішні умови тестування (час доби, освітленість, темпера тура в приміщенні, сторонні звуки).

2. Динамічні внутрішні фактори (так звана «впрацьованість вихід на стабільні результати темпу і швидкості дій після початк; тестування, швидкість розвитку стомлення і т.ін,

3. Інформаційно-соціальні обставини (різна динаміка встанов лення контакту з психологом, що проводить тестування; наявніст інших людей в приміщенні; наявність попереднього досвіду знайому ства з даним тестом) та ін.

Всі ці фактори зумовлюють появу у кожного обстежуваного не-прогнозованого відхилення тестового балу, який би можна було от­римати в ідеальних умовах. Величина цієї помилки виміру вказує на неточність чи ненадійність тестової шкали.

Для визначення помилки виміру на практиці використовують­ся кореляційні методи, що дозволяють визначити надійність через стійкість і узгодженість результатів. Для визначення надійності і помилки виміру використовують наступні формули:

(1) R = 1 -

де Sx - дисперсія тестових показників х, Se - помилка виміру.

На практиці для визначення надійності часто використовують кореляційні методи. Найбільш відомий із них метод перетестування (тест-ретест).

(2) Se =

де rху - коефіцієнт кореляції двох рядів значень; х - перше тесту­вання; у - повторне тестування не менше ніж через два тижні.

Використовуючи отримані дані і підставляючи їх у формулу (1), можна розрахувати коефіцієнт надійності R. Низька кореляція ре­зультатів тесту між першим і повторним тестуванням свідчить про те, що тест не володіє достатньою стійкістю і його не можна вико­ристовувати як вимірювальний інструмент. Показник надійності R прийнято вважати достатньо високим на рівні 0,95, але в особистісних тестах часто використовують менш надійні тести з показника­ми 0,8-0,9.

Метод ретестової надійності придатний тільки для психічних властивостей, стабільних у часі, а для психічних станів, установок таким способом не можна визначити надійність.

Коефіцієнт надійності — узагальнений термін. Різні методи оцінювання надійності виходять з різних джерел помилок. Так, на результати ретестової надійності (зумовленої шляхом повторного обстеження однієї і тієї ж вибірки обстежуваних) впливає не тільки випадкова варіативність відповідей чи зміна суб'єктів у часі, але та­кож розбіжності в поведінці (особливо якщо ретестує інша особа). Коефіцієнти надійності, засновані на одноразовому тестуванні (от­римані шляхом розщеплення тесту на дві частини або обчислюються за формулою, відомою як коефіцієнт альфа), виключають варіатив­ність відповідей у часі, тобто вплив відповідей на бали не виявля­ється як помилка виміру.

Коефіцієнти надійності мають обмежену практичну цінність для користувачів тесту. Стандартна помилка виміру звичайно більц корисна, тому що має відносну незалежність і може бути використа на для встановлення меж визначеної імовірності бала. Користувач тесту можуть використовувати коефіцієнт надійності для порівняй ня тестів, але для інтерпретації тестових балів використовуєтьа стандартна помилка виміру.

Для того щоб з'ясувати «справжнє» значення тестового бала індивіда, застосовується формула:

X= R Xi + (1 – R) X,

де Xі- — емпіричний бал і-го обстежуваного; R — надійність тесту X - середнє значення для тесту.

Так само як інші психометричні показники, надійність тесту ви значається на конкретних соціальних, професійних і вікових групах і не може довільно поширюватися на інші. Так, надійність тесту призначеного для добору працівників, перевіряється при тестуванн кандидатів на посаду, а не школярів чи вже працюючих. Якщо вка­зується, що тест придатний для різних вікових груп, варто врахо­вувати дані про надійність для кожного класу чи віку. Корисним € облік стандартних помилок виміру, отриманих у різних групах, У цьому випадку необхідно звертати увагу на середнє значення і дисперсію вибірки, інформацію про її склад (розподіл суб'єктів за віком, статтю, економічним й інтелектуальним рівнем, трудовим ста­тусом чи минулою трудовою діяльністю, місцем проживання).

Валідність - відповідність тесту психічній властивості, що вимі­рюється. Питання про валідність методики — це питання про те, які і наскільки обґрунтовані висновки можуть бути зроблені на основі тестових оцінок. Питання, що відносяться до валідності, можуть бу­ти зведені до двох запитань:!) які висновки можна зробити про те,. що вимірювалося тестом? 2) які висновки можуть бути зроблені про реальну поведінку людини на відміну від тієї, що спостерігається при тестуванні?

Відповідь на перше запитання дозволяє з'ясувати внутрішню природу виміру. Тест, як вимірювальний інструмент, є операціоналі-зацією психічної властивості чи специфічної області уміння (знання). У цьому плані істотною проблемою є одержання висновків про пов­ноту відображення тестовими показниками цієї області, і в цьому змісті варто говорити про внутрішню (конструктну) валідність.

Відповідаючи на друге запитання, ми дізнаємося про корисність тестового виміру як провісника поведінки. У цьому плані істотною; проблемою є отримання висновку про те, наскільки тестові показпики пов'язані з деякою іншою діяльністю, І в цьому сенсі варто го-Ьорити про зовнішню (критеріальну) валідність.

Види валідності залежать від видів висновків, що бажано отри­мати з тестових оцінок. Традиційно описують кілька взаємозалеж-frax типів інтерпретації висновків, що узагальнюють переважну оільшість можливостей застосування тестів: валідність за крите­рієм, змістовна і конструктна. Валідність за критерієм може бути прогнозуючою і конкурентною.

Ці аспекти можуть розглядатися незалежно один від одного, рднак незалежність ця умовна. Вони пов'язані операціонально і ло-•ічно, у конкретній ситуації рідко буває, щоб лише один з них був важливий. Повний опис процесу конструювання тесту часто вклю­чає інформацію про усі види валідності.

Важливо відзначити, що в залежності від виду валідності вона або обчислюється, або про неї тільки судять. У рекомендації до те­сту можуть бути наведені як коефіцієнти валідності, так і обґрун­товані висновки про валідність методики. Але в цілому про валід­ність тесту для конкретного його використання судять по всьому набору наданих рекомендацій до нього. Отже, валідність — це така психометрична властивість, що дозволяє виносити задовільне чи незадовільне судження стосовно отриманих результатів. Оскільки на валідність також впливають випадкові фактори, то в психометриці прийнято основну нерівність: валідність < надійність. На відміну від надійності, крім випадкових факторів, на валідність впли­вають систематичні фактори.

Варто пам'ятати, що не існує тестів, валідних для всіх цілей чи у всіх ситуаціях, а також для всіх груп індивідів. Будь-яке визна­чення валідності відноситься до окремих з можливих застосувань чи видів тестів. Як і для надійності, користувач тесту повинен вра­ховувати склад і розмір вибірки, на якій проводилася валідизація тесту: чим менший обсяг цієї вибірки, тим менш надійні статистичні дані.

Дискримінативність - це здатність тесту диференціювати обсте­жуваних за визначеними групами (на підставі розподілу показників). Дискримінативність вимірюється показником дельта Фергюсона, що приймає значення від 0 (усі обстежувані по тесту показують одна­кові результати) до 1 (кожен у відповідності до свого показника за тестом попадає у визначену групу). За допомогою ретельного конструювання тесту можна забезпечити відповідний рівень дискримі-нативності, а це саме те, у чому тести значно виграють у порівнянні з іншими формами іспитів. Користувач тесту несе відповідальність за вивчення даних, які підтверджують валідність, надійність і дискримінативність, розуміння й оцінювання можливості застосування тесту у своє дослідженні. У випадку, якщо умови стандартизації і перевірки валідність і надійність тесту відрізняються від тих умов, у як працює користувач, то на користувача лягає обов'язок провес. додаткові дослідження валідності тесту для власного використані або відмовитися від його застосування.




Поделиться с друзьями:


Дата добавления: 2015-05-26; Просмотров: 5794; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.