КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Из графика ясно видно, что между группами людей разного возраста есть разница в уровне дохода. Чем выше возраст, тем больше доход
Аналогичные операции проведём для взаимодействия нескольких факторов. В диалоговом окне Таблица всех эффектов выберем Пол * Возраст и нажмём ОК.
Рис. 11. График зависимости среднего дохода от пола и возраста Получен неожиданный результат: для опрошенных людей в возрасте до 50 лет уровень дохода растёт с возрастом и не зависит от пола; для опрошенных людей старше 50 лет женщины имеют значимо больший доход, чем мужчины. Стоит построить полученный график в разрезе уровня образования. Возможно, такая закомерность нарушается в некоторых категориях или, наоборот, носит универсальный характер. Для этого выберем Уровень образования * Пол * Возраст и нажмём ОК.
Рис. 12. График зависимости среднего дохода от пола, возраста, уровня образования Видим, что полученная зависимость не характерна для среднего и среднего профессионального образования. В остальных случаях она справедлива. 6 шаг. Анализ результатов – оценка качества модели. Выше в основном использовались графические средства дисперсионного анализа. Рассмотрим некоторые другие полезные результаты, которые можно получить. Во-первых, интересно посмотреть, какую долю изменчивости объясняют рассматриваемые факторы и их взаимодействия. Для этого во вкладке Итоги нажмём на кнопку Общая R модели. Появится следующая таблица.
Рис. 13. Таблица SS модели и SS остатков Число в столбце Множеств. R2 – квадрат множественного коэффициента корреляции; оно показывает, какую долю изменчивости объясняет построенная модель. В нашем случае R2 = 0.195, что говорит о невысоком качестве модели. В самом деле, на уровень дохода влияют не только факторы, внесённые в модель. 7 шаг. Анализ результатов – анализ контрастов. Часто требуется не только установить различие в среднем значении зависимой переменной для разных категорий, но и установить величину различия для заданных категорий. Для этого следует исследовать контрасты. Выше было показано, что уровень дохода для мужчин и женщин значимо отличается для возраста от 51, в остальных случаях различие не значимо. Выведем разницу в уровне дохода для мужчин и женщин в возрасте выше 51 года и между 40 и 50 годами. Для этого перейдём во вкладку Контрасты и выставим все значения следующим образом.
Рис. 14. Вкладка Контрасты При нажатии кнопки Вычислить появится несколько таблиц. Нас интересует таблица с оценками контрастов.
Рис. 15. Таблица Оценки контрастов Можно сделать следующие выводы: для мужчин и женщин старше 51 года разница в уровне дохода составляет 48,7 тыс. долл. Разница значима; для мужчин и женщин в возрасте от 41 до 50 лет разница в уровне дохода составляет 1,73 тыс. долл. Разница не значима. Аналогично можно задать более сложные контрасты или воспользоваться одним из заранее заданных наборов. 8 шаг. Дополнительные результаты. Используя остальные вкладки окна результатов можно получить следующие результаты: средние значения зависимой переменной для выбранного эффекта – вкладка Средние; проверка апостериорных критериев (post hoc) – вкладка Апостериорные; проверка сделанных для проведения дисперсионного анализа предположений – вкладка Предположения; построение профилей отклика/желательности – вкладка Профили; анализ остатков – вкладка Остатки; вывод матриц, используемых в анализе – вкладка Матрицы; доступ к опциям отправки спецификаций переменных, кода анализа и предсказанного уравнения в отчёт, а также создании кода модели на языках C/C++/SVB/PMML – вкладка Отчёт. Результаты доступны как в численном, так и в графическом видах. Пример 1. Тест точности вычислений при малой относительной дисперсии. В приведённом ниже тестовом наборе данных переменная var2 (второй столбец), имеющая небольшую относительную дисперсию, линейно зависит от переменной var3 (третий столбец); следовательно, коэффициент корреляции между любой переменной (напр., var1) и переменной var2 должен быть примерно равен коэффициенту корреляции между этой переменной и переменной var3.
Приведём два коэффициента корреляции (между переменными var1*var2 и var1*var3), вычисленных в STATISTICA при использовании алгоритма оптимизации вычислений повышенной точности и отображаемых с наибольшей доступной точностью.
Пример 2. Многофакторный несбалансированный план дисперсионного анализа среднего размера. Рассмотрим план 5 х 5 х 5 х 3 (между группами) х 3 х 3 х 3 (повторные измерения) с неодинаковым числом наблюдений в группах. То есть, имеем 375 групп и 27 зависимых переменных (файл данных ANOVA4 может быть получен от StatSoft). Матрица межгруппового плана при наибольшем порядке взаимодействия имеет 128 степеней свободы. Ниже приведены результаты одномерного и многомерного дисперсионного анализа при взаимодействии наивысшего порядка.
Дата добавления: 2015-06-28; Просмотров: 1295; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |