КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Пример задачи на выявление степени влияния изучаемого фактора
Условие задачи: три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью - 1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты измерений представлены в таблице 24. Таблица 24 Результаты запоминания слов, предъявляемых испытуемым
Статистическая гипотеза: - Основная (H0): различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы. - Альтернативная (H1): Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы.
Решение: запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Дисп_анализ». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю. Этапы выполнения дисперсионного анализа. 1. Подсчет SSФакт. - вариативности признака, обусловленную действием исследуемого фактора (межгрупповое разнообразие):
, где: Тс – сумма индивидуальных значений по каждому из условий. Для нашего примера 43, 37, 24 (см. таблицу); с – количество условий (градаций) фактора (=3); n – количество испытуемых в каждой группе (=6); N – общее количество индивидуальных значений (=18); – квадрат общей суммы индивидуальных значений (=1042=10816).
Отметим разницу между , в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и , где индивидуальные значения сначала суммируются для получения общей суммы, а потом уже эта сумма возводится в квадрат. По формуле (1) рассчитав фактическую вариативность признака, получаем:
.
2. Вычисление SSОбщ. – общей вариативности признака:
.
3. Вычисление случайной (остаточной) величины дисперсии SSСл., обусловленной неучтенными факторами (внутригрупповое разнообразие):
4. Определение числа степеней свободы dfОбщ. , dfФакт. , dfСл. :
5. Математическое ожидание суммы квадратов или «средний квадрат»,усредненная величина соответствующих сумм квадратов SS равна:
6. Значение статистики критерия F Эмп. вычисляется по формуле:
Для нашего примера имеем: F Эмп .= 7,45
7. Определение F Крит. выполняется по статистическим таблицам (Приложение 3) для степеней свободы df1 = k1 =2 и df2 = k2 =15 и уровне значимости 0,05. Табличное значение статистики равно F Крит. = 3,68. В программе Excel критическое значение критерия Фишера определяется функцией =FРАСПОБР(Уровень значимости; df1; df2) =FРАСПОБР(0,05;2;15) = 3,68232034.
8. Если F Эмп. < F Крит., то нулевая гипотеза принимается, в противном случае принимается альтернативная гипотеза. Для нашего примера F Эмп. > F Крит. (7,45>3,68), следовательно, принимается альтернативная гипотеза - влияние существует. В программе Excel с помощью функции ФТЕСТ можно сразу вычислить вероятность различий двух массивов данных. Вводим в ячейку функцию =ФТЕСТ(Первый диапазон данных; Второй диапазон данных). Получаем вероятность 0,99999999 > 0,95 (95%). Аналогичные вычисления выполняются с помощью надстройки «Анализ данных» в модуле «Однофакторный дисперсионный анализ». Результат обработки данных задачи этой командой показан в таблице 25. Таблица 25
Вывод: различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы (р<0,05). Таким образом, скорость предъявления слов влияет на объем их воспроизведения.
ЗАДАНИЯ Запустите программу Excel, откройте файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». На листе «Дисп_анализ», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.
Вариант 1 В эксперименте на животных измерено время пробежки мышей по лабиринту на фоне различной концентрации препарата, стимулирующего нервную систему. Результаты измерений в секундах указаны в таблице 26. Таблица 26 Результаты измерения времени пробежки мышей по лабиринту (сек.)
Необходимо подтвердить влияние стимулирующего вещества с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».[a18]
Вариант 2 На предприятии проведено изучение уровня травматизма с учетом фактора стажа работы сотрудников 5-и участков с близкими условиями труда, получены следующие данные (таблица 27). Таблица 27 Уровень травматизма на 100 работающих
Необходимо оценить влияние стажа работы на уровень травматизма с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ». Вариант 3 Проведено изучение уровня загрязнения водоема в 10 точках с учетом времени года, получены следующие данные (таблица 28). Таблица 28 Уровень загрязнения водоема
Требуется определить влияние времени года на уровень загрязнения водоема с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ»
Вариант 4 Проведено обследование 8 групп пациентов, которым выполнялось лечение кариеса с применением 3-х типов пломбировочного материала и с учетом времени выполнения работы врача, получены следующие данные (таблица 29). Таблица 29 Время работы врача-стоматолога (мин)
Необходимо подтвердить влияние типа используемого материала на время работы врача с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Вариант 5 Проведено обследование длительности лечения 6 групп пациентов, которые получали терапию с применением лекарственного препарата, изготовленного тремя фармацевтическими компаниями, получены следующие данные (таблица 30).
Таблица 30 Длительность лечения (дней)
Необходимо подтвердить влияние на длительность лечения пациентов применения лекарства изготовленного разными фармацевтическими компаниями с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ».
Вариант 6 Выполнен отбор проб атмосферного воздуха населенного пункта для изучения уровня загрязнения фенолом с учетом расстояния от промышленной зоны, получены следующие данные (таблица 31). Таблица 31 Уровень загрязнения воздуха фенолом
Требуется подтвердить влияние на уровень загрязнения фенолом фактора удаленности от промышленной зоны с помощью дисперсионного анализа в программе Excel надстройкой «Анализ данных» модулем «Однофакторный дисперсионный анализ». [a19] Контрольные вопросы
1. Дисперсионный анализ (определение). 2. Что такое результативный признак? 3. Понятие «Фактор» в дисперсионном анализе. 4. Межгрупповое, внутригрупповое и общее разнообразие в дисперсионном анализе. 5. Независимые и зависимые переменные. 6. Сущность дисперсионного анализа? 7. Методика вычисления критерия Фишера.
Рекомендуемая литература: 1. Гельман В.Я. Медицинская информатика. Практикум. СПб: Питер, 2001. – 420 с. 2. Гмурман В.Е.Теория вероятностей и математическая статистика: Учебное пособие – 12-е изд., перераб. и доп. – М.: Юрайт, 2011. – 478 с.: ил. 3. Информатика. Книга 2. Основы медицинской информатики: учебник / В.И. Чернов, И. Э. Есауленко, М В. Фролов и др. – М.: Дрофа, 2009. – 205, [3] с.: ил. 4. Применение методов статистического анализа для изучения общественного здоровья и здравоохранения [Электронный ресурс]: учебное пособие для практических занятий / под ред. В.З. Кучеренко. - 4-е изд., перераб. и доп. - М.: ГЭОТАР-Медиа, 2011. - 256 с. – Режим доступа: http://www.studmedlib.ru
Дата добавления: 2014-12-23; Просмотров: 1004; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |