КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Психометричні властивості тестів
Надійність — одна із головних психомет ричних властивостей будь-якої психодіагнос тичної методики. Надійність — це стійкість тесту, незалеж ність його результатів від впливу можливих випадкових факторів. До таких факторів відносяться 1. Зовнішні умови тестування (час доби, освітленість, темпера тура в приміщенні, сторонні звуки). 2. Динамічні внутрішні фактори (так звана «впрацьованість вихід на стабільні результати темпу і швидкості дій після початк; тестування, швидкість розвитку стомлення і т.ін, 3. Інформаційно-соціальні обставини (різна динаміка встанов лення контакту з психологом, що проводить тестування; наявніст інших людей в приміщенні; наявність попереднього досвіду знайому ства з даним тестом) та ін. Всі ці фактори зумовлюють появу у кожного обстежуваного не-прогнозованого відхилення тестового балу, який би можна було отримати в ідеальних умовах. Величина цієї помилки виміру вказує на неточність чи ненадійність тестової шкали. Для визначення помилки виміру на практиці використовуються кореляційні методи, що дозволяють визначити надійність через стійкість і узгодженість результатів. Для визначення надійності і помилки виміру використовують наступні формули: (1) R = 1 - де Sx - дисперсія тестових показників х, Se - помилка виміру. На практиці для визначення надійності часто використовують кореляційні методи. Найбільш відомий із них метод перетестування (тест-ретест). (2) Se = де rху - коефіцієнт кореляції двох рядів значень; х - перше тестування; у - повторне тестування не менше ніж через два тижні. Використовуючи отримані дані і підставляючи їх у формулу (1), можна розрахувати коефіцієнт надійності R. Низька кореляція результатів тесту між першим і повторним тестуванням свідчить про те, що тест не володіє достатньою стійкістю і його не можна використовувати як вимірювальний інструмент. Показник надійності R прийнято вважати достатньо високим на рівні 0,95, але в особистісних тестах часто використовують менш надійні тести з показниками 0,8-0,9. Метод ретестової надійності придатний тільки для психічних властивостей, стабільних у часі, а для психічних станів, установок таким способом не можна визначити надійність. Коефіцієнт надійності — узагальнений термін. Різні методи оцінювання надійності виходять з різних джерел помилок. Так, на результати ретестової надійності (зумовленої шляхом повторного обстеження однієї і тієї ж вибірки обстежуваних) впливає не тільки випадкова варіативність відповідей чи зміна суб'єктів у часі, але також розбіжності в поведінці (особливо якщо ретестує інша особа). Коефіцієнти надійності, засновані на одноразовому тестуванні (отримані шляхом розщеплення тесту на дві частини або обчислюються за формулою, відомою як коефіцієнт альфа), виключають варіативність відповідей у часі, тобто вплив відповідей на бали не виявляється як помилка виміру. Коефіцієнти надійності мають обмежену практичну цінність для користувачів тесту. Стандартна помилка виміру звичайно більц корисна, тому що має відносну незалежність і може бути використа на для встановлення меж визначеної імовірності бала. Користувач тесту можуть використовувати коефіцієнт надійності для порівняй ня тестів, але для інтерпретації тестових балів використовуєтьа стандартна помилка виміру. Для того щоб з'ясувати «справжнє» значення тестового бала індивіда, застосовується формула: X∞ = R Xi + (1 – R) X, де Xі- — емпіричний бал і-го обстежуваного; R — надійність тесту X - середнє значення для тесту. Так само як інші психометричні показники, надійність тесту ви значається на конкретних соціальних, професійних і вікових групах і не може довільно поширюватися на інші. Так, надійність тесту призначеного для добору працівників, перевіряється при тестуванн кандидатів на посаду, а не школярів чи вже працюючих. Якщо вказується, що тест придатний для різних вікових груп, варто враховувати дані про надійність для кожного класу чи віку. Корисним € облік стандартних помилок виміру, отриманих у різних групах, У цьому випадку необхідно звертати увагу на середнє значення і дисперсію вибірки, інформацію про її склад (розподіл суб'єктів за віком, статтю, економічним й інтелектуальним рівнем, трудовим статусом чи минулою трудовою діяльністю, місцем проживання). Валідність - відповідність тесту психічній властивості, що вимірюється. Питання про валідність методики — це питання про те, які і наскільки обґрунтовані висновки можуть бути зроблені на основі тестових оцінок. Питання, що відносяться до валідності, можуть бути зведені до двох запитань:!) які висновки можна зробити про те,. що вимірювалося тестом? 2) які висновки можуть бути зроблені про реальну поведінку людини на відміну від тієї, що спостерігається при тестуванні? Відповідь на перше запитання дозволяє з'ясувати внутрішню природу виміру. Тест, як вимірювальний інструмент, є операціоналі-зацією психічної властивості чи специфічної області уміння (знання). У цьому плані істотною проблемою є одержання висновків про повноту відображення тестовими показниками цієї області, і в цьому змісті варто говорити про внутрішню (конструктну) валідність. Відповідаючи на друге запитання, ми дізнаємося про корисність тестового виміру як провісника поведінки. У цьому плані істотною; проблемою є отримання висновку про те, наскільки тестові показпики пов'язані з деякою іншою діяльністю, І в цьому сенсі варто го-Ьорити про зовнішню (критеріальну) валідність. Види валідності залежать від видів висновків, що бажано отримати з тестових оцінок. Традиційно описують кілька взаємозалеж-frax типів інтерпретації висновків, що узагальнюють переважну оільшість можливостей застосування тестів: валідність за критерієм, змістовна і конструктна. Валідність за критерієм може бути прогнозуючою і конкурентною. Ці аспекти можуть розглядатися незалежно один від одного, рднак незалежність ця умовна. Вони пов'язані операціонально і ло-•ічно, у конкретній ситуації рідко буває, щоб лише один з них був важливий. Повний опис процесу конструювання тесту часто включає інформацію про усі види валідності. Важливо відзначити, що в залежності від виду валідності вона або обчислюється, або про неї тільки судять. У рекомендації до тесту можуть бути наведені як коефіцієнти валідності, так і обґрунтовані висновки про валідність методики. Але в цілому про валідність тесту для конкретного його використання судять по всьому набору наданих рекомендацій до нього. Отже, валідність — це така психометрична властивість, що дозволяє виносити задовільне чи незадовільне судження стосовно отриманих результатів. Оскільки на валідність також впливають випадкові фактори, то в психометриці прийнято основну нерівність: валідність < надійність. На відміну від надійності, крім випадкових факторів, на валідність впливають систематичні фактори. Варто пам'ятати, що не існує тестів, валідних для всіх цілей чи у всіх ситуаціях, а також для всіх груп індивідів. Будь-яке визначення валідності відноситься до окремих з можливих застосувань чи видів тестів. Як і для надійності, користувач тесту повинен враховувати склад і розмір вибірки, на якій проводилася валідизація тесту: чим менший обсяг цієї вибірки, тим менш надійні статистичні дані. Дискримінативність - це здатність тесту диференціювати обстежуваних за визначеними групами (на підставі розподілу показників). Дискримінативність вимірюється показником дельта Фергюсона, що приймає значення від 0 (усі обстежувані по тесту показують однакові результати) до 1 (кожен у відповідності до свого показника за тестом попадає у визначену групу). За допомогою ретельного конструювання тесту можна забезпечити відповідний рівень дискримі-нативності, а це саме те, у чому тести значно виграють у порівнянні з іншими формами іспитів. Користувач тесту несе відповідальність за вивчення даних, які підтверджують валідність, надійність і дискримінативність, розуміння й оцінювання можливості застосування тесту у своє дослідженні. У випадку, якщо умови стандартизації і перевірки валідність і надійність тесту відрізняються від тих умов, у як працює користувач, то на користувача лягає обов'язок провес. додаткові дослідження валідності тесту для власного використані або відмовитися від його застосування.
Дата добавления: 2015-05-26; Просмотров: 5794; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |