КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 10. Статистические методы изучения взаимосвязей 3 страница
(73) где - урожайность картофеля, ц/га; - количество внесенных органических удобрений под картофель, т/га; - удельный вес посевов высокосортными семенами, %. Требуется определить параметры уравнения связи коэффициент множественной корреляции. Решение: Составим систему нормальных уравнений с тремя неизвестными: (74) Подставив в эту систему данные из табл. 261, получим: Разделим каждое из уравнений на коэффициенты при первом известном : первое уравнение - на 20, второе - на 354, третье - на 1508, получим: Теперь поочередно вычтем первое уравнение из второго и третьего: (175,2 - 164,5) = - + (19,0 - 17,7) + (79,5 - 75,4) ; (173,3-164,5) = - + (18,6 – 17,7) + (78,9 – 75,4) . Получим: Разделив каждое из двух этих уравнений на коэффициент при , первое уравнение - на 1,3, второе - на 0,9, получим: Из второго уравнения вычитаем первое и освобождаемся от параметра : 9,78 -8,23 = (3,8889 - 3,1538)а2, 1,55 = 0,73 5а2, отсюда а2 = 1,55: 0,735 = 2,11. Подставляем значение а2 в уравнение 8,23 = + 3,1538 ∙ 2,11, отсюда = 1,58. Далее надо найти значение параметра ао, для чего используем уравнение 164,5 = + 17,7 ∙ 1,58 + 75,4 ∙ 2,11. Сделаем соответствующие расчеты: 164,5 = + 27,966 + 159,09; отсюда а0.= - 22,6. Уравнение множественной линейной зависимости примет вид: Параметры уравнения множественной регрессии показывают, что с увеличением дозы внесения органических удобрений на 1 т в расчете на 1 га урожайность картофеля возрастает на 1,58 ц, а повышение удельного веса высокосортных семян на 1 % дает прирост урожайности 2,11 ц. Параметр экономического смысла не имеет. Теперь определим тесноту связи. Рассчитаем множественный (совокупный) коэффициент корреляции по формуле (75) Для его расчета надо найти средние значения , а также средние квадратические отклонения по урожайности, внесению удобрений и удельному весу высокосортных семян:
Теперь рассчитаем средние квадратические отклонения: Рассчитаем парные коэффициенты корреляции:
Эти коэффициенты можно рассчитать с помощью MS Excel. В главном меню последовательно выбираем Данные /Анализ данных /Корреляция (рис. 42). Рис. 42. Расчет коэффициентов корреляции Так же можно воспользоваться программой Statgraphics, используя в расчетах функцию Multiple Variable Analisis (рис. 43). Рис. 43. Расчет коэффициентов корреляции Подставив значения коэффициента корреляции и детерминации в формулу множественной (совокупной) корреляции получим: Связь между признаками очень тесная, так как коэффициент множественной корреляции составляет 0,981, а детерминации — 0,962. т.е. 96,2 % колебаний урожайности картофеля в данных условиях зависит от исследуемых факторов и только 3,8 % - от других, не уточненных в анализе. Значимость оценим t-критерием Стьюдента: Табличное значение t-критерия Стьюдента при 5 % уровне значимости и 17 степенях свободы (n-m=20-2-1=17) составляет 2,1098. Так как только при условии оба фактора , считаются значимыми. Однако меньше положенного. Поэтому величина является статистически незначимой, ненадежной, т.е. она сформировалась под воздействием случайных факторов. То же касается и величины . Теперь воспользуемся инструментом анализа данных Регрессия (рис. 43). Рис. 43. Результаты расчетов Уравнение множественной линейной зависимости примет вид: . Коэффициент детерминации 0,9629. Табличное значение F-критерий Фишера составило 3,59, расчетное – 220,59. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо. Решим эту же задачу с помощью программы Statgraphics, используя в расчетах функцию Multiple Regression (рис. 44). Рис. 44. Результаты расчетов Уравнение множественной линейной зависимости примет вид: . Случайные ошибки параметров , , равны , , . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: , , . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,1098, , т.е. с вероятностью 0,99 – 2,8982. Статистически значимыми здесь являются , , а величина сформировалась под воздействием случайных причин. Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров ( и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так и То есть вероятность случайно получить такие значения t-критерия Стьюдента составляет 4,8 % и 0,0000, что не превышает допустимый уровень значимости 5 %. Чуть ниже на рис. 44 представлен расчет F-критерий Фишера, и он составляет 29,23. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0000, что не превышает допустимый уровень значимости 5%. Отсюда же берем нескорректированный коэффициент детерминации , который оценивает долю вариации результата в зависимости от факторов в общей вариации. Этот показатель показывает на достаточно высокую связь результата и от факторного признака. Скорректированный коэффициент детерминации оценивает тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому может сравниваться по разным моделям с разным числом факторов. Табличное значение F-критерий Фишера составило 3,59, расчетное – 220,59. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.
Задание 3. Определение показателей связи при парной криволинейной зависимости. Имеются данные по группе коров об их продуктивности возрасте (числе отелов) (табл. 266). Таблица 266 - Данные для уравнения связи и индекса корреляции (корреляционное отношение)
Продолжение таблицы 266
Анализ исходных данных позволил установить, что зависимость криволинейная и может быть описана уравнением параболы 2-го порядка: (76) Требуется определить параметры уравнения связи и индекс корреляции. Решение: Составим систему уравнений для нахождения параметров , , : В систему уравнений подставим данные из табл. 266: Разделим члены каждого уравнения на коэффициент при ао Теперь из второго уравнения вычтем первое, а из третьего - второе: Освободимся от коэффициента при , для чего все члены уравнения разделим на коэффициент при : Из первого уравнения вычтем второе и получим 0,727=-1,206 , отсюда а2=-0,603. Подставим значения а2 в уравнение 1,103= +13,668∙(-0,603); отсюда = 9,345. В уравнение 93,077 = + 6,385 + 51,346a2 подставим значения найденных параметров и а2: 93,077 = а0 + 6,385∙9,345 + 51,346∙(- 0,603); 93,077 = + 59,668 - 30,962; = 93,007 - 59,668 + 30,962; = 64,371. Следовательно, уравнение параболы второго порядка будет иметь следующий вид: = 64,371 + 9,345 - 0,603 . Отрицательное значение а2 показывает, что с увеличением возраста коров до определенного предела (6-го отела) удой возрастает на 9,345 % с каждым новым отелом, а затем после определенного предела (с 6-го отела до 12-го отела) начинает падать в среднем на 0,603 %. Когда связь между нелинейная (в нашем случае - параболическая), для измерения тесноты связи используют корреляционное отношение, которое рассчитывается по формуле: Полученный результат свидетельствует о наличии тесной связи между возрастом коров и их продуктивностью, так как 95,03 % вариации в продуктивности связано с возрастом данной группы коров. Решим эту же задачу с помощью программы Statgraphics, используя в расчетах функцию Polynomial Regression (рис. 45). Рис. 45. Результаты расчетов Уравнение парной криволинейной зависимости примет вид: . Случайные ошибки параметров , , равны , , . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: , , . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,2281, , т.е. с вероятностью 0,99 – 3,1693. Статистически значимыми здесь являются , , . Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров (, и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так , и То есть вероятность случайно получить такие значения t-критерия Стьюдента составляет 0,0000 %, что не превышает допустимый уровень значимости 5 %. Чуть ниже на рис. 45 представлен расчет F-критерий Фишера, и он составляет 71,06. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0000, что не превышает допустимый уровень значимости 5%. Отсюда же берем нескорректированный коэффициент детерминации , который оценивает долю вариации результата в зависимости от факторов в общей вариации. Этот показатель показывает на достаточно высокую связь результата и от факторного признака. Скорректированный коэффициент детерминации оценивает тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому может сравниваться по разным моделям с разным числом факторов.
Задача 4. Имеются выборочные данные по 12 однородным предприятиям (табл. 267). Определите в программе Statgraphics уравнение регрессии, наиболее полно отражающее исходные данные. Оцените значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Таблица 267 – Исходные данные
Построить однофакторную регрессионную модель. Решение: воспользовавшись программой Statgraphics, получим следующие данные (табл. 268). Таблица 268 – Уравнения регрессии, коэффициент детерминации и достоверность
Дата добавления: 2015-03-31; Просмотров: 655; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |