Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

ВОПРОСЫ. Почему Флинер и Кернс заключили, что старшие дети больше плачут при уходе матери, чем при уходе ассистентки




 

Почему Флинер и Кернс заключили, что старшие дети больше плачут при уходе матери, чем при уходе ассистентки, а у младших детей такого различия нет?

Что такое нуль-гипотеза?

Почему в эксперименте Флинера и Кернса возможно третье заключение, в то время как в эксперименте Иоки по предпочтению сорта томатного сока только два?

Что показывает диаграмма, иллюстрирующая: различие между средними для каждого условия, статистическое решение и заключение об экспериментальной гипотезе?

Как влияет уменьшение надежности на величину различия между средними, требуемую для отвержения нуль-гипотезы?

Как влияет альфа-уровень в правиле решения на величину различия между средними, требуемую для отвержения нуль-гипотезы?

Соотнесите альфа-уровень с риском ошибок I и II типов.

Когда особенно важно избегать ошибки I типа?

Опишите три фактора, влияющие на вероятность бета. Что это означает в отношении риска ошибки II типа?

При каких условиях экспериментатор может заключить, что независимая переменная не оказывает действия?

Почему говорят, что разумное использование правила статистического решения способствует внутренней валидности?

Может ли быть в эксперименте слишком много испытуемых?

Если в эксперименте получены надежные данные и высоко значимые различия между условиями, обеспечивает ли это полностью валидность вывода?

 

СТАТИСТИЧЕСКОЕ ПРИЛОЖЕНИЕ: t -КРИТЕРИЙ

 

В данном приложении будет описан метод нахождения величины различия между средними, необходимой для отвержения нуль-гипотезы. Фактически мы будем подробно объяснять диаграммы, представленные на рис. 6.1.

 

Выборочное распределение

 

Давайте еще раз предположим, что данные по времени реакции, представленные в предыдущих статистических приложениях, получены в межгрупповом эксперименте. Мы, таким образом, имеем среднее время реакции для каждого из 17 испытуемых, которым предъявлялось условие А (свет), и среднее время реакции для каждого из 17 испытуемых, которым предъявлялось условие Б (тон). Более того, известно общее среднее для испытуемых в условии А (185 мс) и общее среднее в условии Б (162 мс). Наконец, мы знаем разницу между этими двумя средними, МА—Мб, равную. +.23 мс.

 

Если бы исследовались две другие группы испытуемых, отобранные тем же способом, то, конечно, не следовало бы ожидать МА—Мб в точности равной 23 мс. Нельзя было бы ожидать точно такой же разницы + 23 мс и в третьем эксперименте. Напротив, мы предполагаем, что это значение МА—Мб будет несистематически варьировать от эксперимента к эксперименту.

 

Допустим, что путем повторения этого эксперимента был реализован бесконечный эксперимент, при котором каждое условие предъявлялось 17 испытуемым бесконечное число раз. Предположим далее, что нуль-гипотеза верна. Тогда различие между общими средними — которое есть параметр — должно равняться нулю. Другими словами, М̅А—М̅б=0. Однако величина статистики МА—Мб должна варьировать от эксперимента к эксперименту.

 

Распределение величин МА—Мб для серии последовательных экспериментов может быть представлено так, как было описано ранее. Обозначим величину +23, которая была получена в реальном эксперименте, номером 1; предположим, что мы провели второй такой же эксперимент и получили величину — 4, обозначим ее номером 2; величину, полученную в третьем эксперименте (допустим, 0), — номером 3 и т. д. Таким образом, результаты девяти экспериментов, в случае МА—Мб = 0, могли бы выглядеть следующим образом.

 

Рис, 6.2. Ось абсцисс — МА—Мб. Ось ординат — частота

 

К счастью, можно вывести, как это распределение выглядело бы для бесконечного числа экспериментов. Мы можем реально изобразить ожидаемое распределение величин МА—Мб. Более того, мы можем оценить стандартное отклонение, которое имело бы это распределение. Такой тип теоретически выведенного распределения называют выборочным распределением. Описываемое здесь распределение является выборочным распределением разностей между средними (имеются также выборочные распределения для средних, для стандартных отклонений и т. д.).

 

Приводим выборочное распределение для нашего эксперимента по времени реакции с предположением, что нуль-гипотеза М̅А—М̅б=0 верна.

 

Заметьте, что стандартное отклонение (СО) равно 6,1.

 

Рис. 6.3. Ось абсцисс — МА—Мб. Ось ординат — относительная частота

 

Поэтому разность МА—Мб = +12,20, полученная в каком-то эксперименте, находится на расстоянии двух стандартных отклонений выше предполагаемой величины М̅А—М̅б = 0, а разность МА—Мб, равная —18,30, -- на три стандартных отклонения ниже предполагаемого нуля и т. д.

 

Стандартная ошибка

 

До сих пор не объяснялось, как было вычислено стандартное отклонение этого гипотетического выборочного распределения. Вот эта формула:

 

SmА-mБ называется стандартной ошибкой разности между средними. Использование термина стандартная ошибка вместо стандартного отклонения показывает, что мы вывели стандартное отклонение, а не пришли к нему через (невозможные) бесконечные вычисления. Заметьте, что здесь используется S, а не σ̅. Это потому, что популяционный параметр σ̅МА—МБ оценивается на основе выборочных статистик.

 

Для вычисления в формулу просто подставляют величины S2A и S2Б, полученные нами в предыдущих статистических приложениях. Так,

Вы можете видеть, что формула применима также и в том случае, когда NA и NБ различны, т. е. когда число испытуемых (или проб в интраиндивидуальном эксперименте) различно для двух условий.

 

Определение величины t

 

Следующий шаг состоит в том, чтобы найти, на сколько единиц стандартной ошибки отстоит полученная нами разность МА—Мб от нуля, представляющего среднюю нуль-гипотезы. Поскольку полученная нами разность равнялась +23, а стандартная ошибка МА—Мб =6,10, то очевидно, что наша разность находится на расстоянии 3,77 единицы стандартной ошибки выше нуля. Единицы стандартной ошибки называют t-единицами. Выражение полученной разности в единицах стандартной ошибки называют нахождением величины t для данной разности. Это может быть выражено следующей формулой:

Подставляя значения из нашего эксперимента по измерению времени реакции, мы имеем

 

Заметьте, что нуль в числителе при числовых операциях можно опустить. Он служит для того, чтобы напомнить нам, что мы проверяем нуль-гипотезу: М̅А—М̅б = 0.

 

Отвержение или неотвержение нуль-гипотезы

 

Теперь мы готовы (наконец!) описать, как были получены диаграммы на рис. 6.1, показывающие величину разности между средними, необходимую для отвержения нуль-гипотезы. Давайте перерисуем выборочное распределение разностей.

Рис. 6.4. Ось абсцисс: первая — значения ί-критерия; вторая МА -ΜБ. Ось ординат — относительная частота. 1, III — р = 0,005, нуль-гипотеза отвергается; II — р=0,99, нуль-гипотеза не отвергается

Вы найдете в Статистической таблице 2 в конце данного приложения величину t, достаточную для отвержения нуль-гипотезы. Она дана и для альфа-уровня 0,05, и для альфа-уровня 0,01. Эти критические величины зависят от величины N для каждого условия, или, иначе, от числа степеней свободы, N—1, для каждого среднего. (Если вы имеете данное среднее, скажем, 179 мс для 17 испытуемых, эта величина могла бы быть получена путем свободного приписывания любых величин 16 испытуемым. Однако затем вам придется приписать семнадцатому испытуемому совершенно определенную величину, чтобы получить заданное среднее.) Таким образом, поскольку было 17 испытуемых для каждого условия, имели место 16+16 = 32 степени свободы (или df).

 

В таблице нет значений именно для 32df (но величина для 30df вполне годится, так как разница между величинами t для 30 и 35df очень мала. Чтобы отвергнуть нуль-гипотезу для 0,05 альфа-уровня, требуется t, равное 2,04, для альфа-уровня 0,01—t, равное 2,75. Величина t, равная в нашем эксперименте 3,77, показывает, что полученная разность +23 попадает в область отвержения, даже если использовать альфа-уровень 0,01.

 

Вероятности показаны так же, как на рис. 6.1 (в). Исходя из этого, наше статистическое решение будет заключаться в отвержении нуль-гипотезы.

 

Распределение, представленное в величинах t, является выборочным распределением t. Точная форма t-распределения будет разной в зависимости от числа степеней свободы в эксперименте. Вот почему вы должны находить критические величины, чтобы определить, является ли полученное вами различие значимым.

 

Нуль-гипотеза и ω2

 

Из данного статистического приложения видно, что в эксперименте по измерению времени реакций независимая переменная оказывала сильное влияние: est ω2= = 0,28. Ясно, что получить такую разность между условиями в высшей степени невероятно, если верна нуль-гипотеза. Но не смешивайте эти два понятия — силу действия и статистическую значимость. При очень надежных данных даже небольшая разность между средними позволит отвергнуть нуль-гипотезу. В то же время разность может оказаться статистически значимой даже при слабом действии независимой переменной.

 

Задача: Вычислите t и проверьте нуль-гипотезу при альфа-уровне 0,01 для эксперимента по измерению времени реакции выбора между двумя вспышками света (условие В) и выбора между двумя тонами (условие Г).

 

  Условие В (вспышки)     Условие Г (тоны)  
Испыт. ВР Испыт. ВР Испыт. ВР Испыт. ВР
               
               
               
               
               
               
               
               
               

Ответ: Мв=265; Мг=250; S2B=292; 52Г=337; t=2,47.

 

Нуль-гипотеза может быть отвергнута при альфа-уровне 0,05, но не при альфа-уровне 0,01.

 

Статистическая таблица 2 Величина t-критерия, отвергающая нуль-гипотезу

Степень свободы df 0,05 0,01 Степень свободы df 0,05 0,01
  12,71 63,66   2,06 2,80
  4,30 9,92 2,06 2,79
  3,18 5,84   2,06 2,78
  2,78 4,60   2,05 2,77
  2,57 4,03   2,05 2,76
  2,45 3,71   2,04 2,76
  2,36 3,50   2,04 2,75
  2,31 3,36   2,03 2,72
  2,26 3,25   2,02 2,71
  2,23 3,17   2,02 2,69
  2,20 3,11   2,01 2,68
  2,18 3,06   2,00 2,66
  2,16 3,01   2,00 2,65
  2,14 2,98   1,99 2,64
  2,13 2,95   1,99 2,63
  2,12 2,92   1,98 2,63
  2,11 2,90   1,98 2,62
  2,10 2,88   1,98 2,61
  2,09 2,86   1,97 2,60
  2,09 2,84   1,97 2,59
  2,08 2,83   1,97 2,59
  2,07 2,82   1,96 2,59
  2,07 2,81   1,96 2,58
        1,96 2,58

Статистическая таблица 2 взята из таблицы IV в работе Фишера и Ятса «Статистические таблицы для биологических, сельскохозяйственных и медицинских исследований».

 

 

Глава 7. МНОГОУРОВНЕВЫЕ ЭКСПЕРИМЕНТЫ

Предположим, что три исследователя А, Б и В поставили перед собой вопрос: как наилучшим образом использовать фиксированный отрезок времени для заучивания списка объектов (символов)? А решил, что лучше всего подолгу останавливаться на каждом элементе списка, и, таким образом, устраивая длительные интервалы между каждым предыдущим и последующим элементами, пройти весь список всего лишь несколько раз. Б предположил прямо противоположное: лучше всего делать короткие интервалы между элементами и быстро пройти список много раз подряд. В решил, что характер распределения отпущенного времени не играет существенной роли; главное — это общее время заучивания.

 

Теперь дополним наши предположения некоторыми деталями. Пусть А, Б и В независимо друг от друга решили провести эксперимент по запоминанию списка из 16 элементов, представляющих собой сочетание двузначных чисел с группами из трех букв (называемых триграммами). Испытуемый должен усвоить, что при показе, например, триграммы ВАР нужно отвечать «27», а при показе КОМ — «84» и т. д. для каждого из 16 сочетаний. Общая длительность эксперимента — 320 секунд. Процедура опыта состоит в предъявлении списка — элемент за элементом — в соответствии с выбранным планом распределения времени заучивания и затем, по истечении этого времени (320 с) — в проверке того, сколько пунктов запомнил испытуемый.

 

Вот что делал А и вот что он обнаружил. Он использовал два условия: (а) 1 с между элементами (20 предъявлений списка) и (б) 4 с между элементами (5 предъявлений списка). Испытуемые с интервалом 1 с в среднем дали 7 правильных ответов, а испытуемые с интервалом 4 с — 13 правильных ответов. Таким образом, с достаточной уверенностью можно сказать, что 8его гипотеза о большей эффективности больших интервалов времени подтвердилась.

 

Б также использовал интервал 4 с (условие а), но сравнивал его с интервалом 20 с (условие б), при котором список предъявлялся только один раз. Он также получил около 13 правильных ответов для интервала 4 с, но меньше 10 правильных ответов для интервала 20 с. В результате заключил, что подтверждается его гипотеза о большей эффективности более коротких интервалов.

 

В использовал интервалы 3 с (а) и 10 с (б). При обоих условиях он получил в среднем около 12 правильных ответов. И снова была подтверждена исходная гипотеза, на этот раз о том, что характер распределения экспериментального времени не играет роли.

 

Наконец, давайте представим, что вы редактор журнала, в который А, Б и В одновременно подали свои статьи. Вы оказались перед необходимостью представить вместе три ряда результатов и показать отношение между независимой переменной (интервал между элементами) и зависимой переменной (среднее число правильных ответов — заученных элементов списка), как это показано на рис. 7.1.

 

Рис. 7.1. Воображаемые двухуровневые эксперименты А, Б и В на примере результатов исследования Калфи и Андерсон (1971). Ось абсцисс — временные интервалы между предъявляемыми знаке-ми. Ось ординат — среднее количество правильных ответов

 

В действительности вы, конечно, не сможете соединить результаты именно таким образом из-за многих различии, имевших место во всех трех исследованиях. На рис. 7.1 представлены данные действительных экспериментов, однако не таких разрозненных, как мы это только что представили. Это — части одного и того же обширного исследования влияния темпа предъявления на заучивание, проведенного Р. Калфи и Р. Андерсон (1971). Значения интервалов в «исследованиях» А, Б и В показаны на графике. Каждое из них — это эксперимент с двумя условиями (иногда называемый бивалентным). Эксперимент же Калфи и Андерсон ‑ это многоуровневый эксперимент (иногда называемый мультивалентным); в нем было использовано много уровней независимой переменной, а именно шесть временных интервалов между элементами: 1, 2, 3, 4, 10 и 20 с.

 

Как вы могли убедиться, выход, когда это возможно, за рамки двухуровневого эксперимента весьма плодотворен. Ведь, как оказалось, мы узнали очень немного из каждого отдельного эксперимента А, Б и В. И только применение нескольких уровней независимой переменной позволило установить реальные отношения с зависимой переменной. В этой главе мы рассмотрим эти преимущества более детально. После этого мы разберем экспериментальные схемы, которые могут быть использованы в многоуровневом эксперименте. Мы увидим, что наши прежние схемы, такие, как межгрупповые и индивидуальные, применимы и здесь. Однако наиболее употребима здесь новая основная схема - кросс-индивидуального контроля. Затем мы перейдем к проблемам внутренней валидности в многоуровневых экспериментах.

 

Из этой главы вы должны вынести новое представление об эксперименте как средстве установления связи между двумя непрерывными переменными, а именно о том, что происходит с зависимой переменной по мере того, как шаг за шагом меняется независимая переменная. Посмотрите в литературе статьи с двухили трехуровневыми экспериментами и попытайтесь решить, можно ли превратить их в многоуровневые эксперименты. Попробуйте представить себе, как выглядели бы в этом случае их результаты. Мы надеемся, что вы поймете все «угрозы» внутренней валидности, которые таятся в типичных схемах многоуровневых экспериментов, и, читая статьи, сможете оценить, в какой мере их понимал и сам автор.

 

Вопросы, на которые вы должны будете ответить в конце главы, относятся к следующим темам:

 

Контрольные функции многоуровневого эксперимента.

Более тонкие экспериментальные гипотезы, которые можно проверять только в многоуровневых экспериментах.

Различные экспериментальные схемы, использующие межиндивидуальное позиционное уравнивание.

Вопросы, касающиеся внутренней валидности при выборе экспериментальной схемы многоуровневого эксперимента.

 




Поделиться с друзьями:


Дата добавления: 2015-05-26; Просмотров: 483; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.044 сек.