Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Типовой пример выполнения индивидуальной работы по теме 1




Задание:

По исходным данным, характеризующим территории региона за 199х год необходимо[1]:

1) Построить поле корреляции.

2) Для характеристики зависимости у от х:

а) построить линейное уравнение парной регрессии у от х;

б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;

в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;

г) дать оценку силы связи с помощью среднего коэффициента эластичности;

д) оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера;

е) оценить статистическую значимость параметров регрессии и корреляции.

3) Проверить результаты, полученные в п.2 с помощью ППП Exel.

4) Рассчитать параметры показательной парной регрессии. Проверить результаты с помощью ППП Exel. Оценить статистическую надежность указанной модели с помощью F-критерия Фишера.

5. Обосновано выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости γ = 0,05.

 

Решение:

Для нашего примера

Результативный признак (у) – урожайность картофеля, ц/га

Факторный признак (х) – доза внесения органических удобрений, ц/га

 

Таблица 1.1. – Исходные данные для анализа

№ региона Доза внесения удобрений, ц/га х Урожайность картофеля, ц/га у
     
     
     
     
     
     
     
     
     
     
     
     

 

1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной системе координат точки (xi yi) (рис.1.1).

Рис. 1.1. Поле корреляции

Расположение точек на графике не позволяет точно определить тип уравнения регрессии. Для выявления типа зависимости воспользуемся экспериментальным методом.

 

2. Для расчета параметров линейной регрессии построим расчетную таблицу (табл.1.2)

 

Таблица 1.2. – Расчетные значения

х у xy х2 у2 , ·100%, (Ai, %)
            131,675 0,996 1,755 86,490 45,630
            118,625 27,554 656,540 75,690 39,627
            123,700 10,362 204,490 2,890 1,488
            117,175 4,654 33,931 113,849 59,985
            136,750 4,389 33,161 266,669 139,948
            111,375 6,408 58,141 348,569 183,467
            133,850 11,542 191,823 152,028 79,744
            128,775 123,979 332,151 28,408 14,861
            120,075 5,453 47,956 44,488 23,474
            135,300 1,241 2,890 205,348 107,744
            115,000 127,451 169,000 186,868 98,406
            126,600 1,860 5,7660 5,429 2,822
Итого           1499,00 325,89 1737,59 1243,20 797,319
Ср.зн 87,67 124,92 11042,67 7811,83 15404,75 х 27,157      
σ 10,19 13,1818                
σ2 103,97 173,76                

2а. Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 2, имеем:

β= = =0,725

a = = 124,92-0,725∙87,67=61,35.

Тогда линейное уравнение парной регрессии имеет вид:

Полученное уравнение показывает, что с увеличением дозы внесения органических уравнений на l ц/га урожайность картофеля возрастает в среднем на 0,725 ц/га.

Рис. 1.2. Зависимость между дозой внесения органических удобрений и урожайностью картофеля (линейная регрессия).

 

Подставляя в полученное уравнение регрессии значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).

2б. При линейной корреляции между х и у исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.

Учитывая:

,

оценим тесноту линейной связи с помощью линейного коэффициента парной корреляции

Связь между факторами прямая. В соответствии со шкалой Чеддока теснота характеризуется как заметная.

Изменение результативного признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.

R2=rху2·100%

R2= 0,562 ∙100%=0,3145

Следовательно, вариация урожайности картофеля на 31,45 % объясняется вариацией дозы внесения удобрений, а остальные 68,55% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.

= = 325,889/12=27,16%.

В среднем расчетные значения отклоняются от фактических на 27,16%. Это значение значительно превышает допустимый предел, следовательно качество построенной модели невысокое. Это, а также небольшое значение коэффициента детерминации говорит о том, что линейный тип модели не достаточно хорошо отражает представленные эмпирические данные.

2г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности:

.= = = 0,5088

Таким образом, в среднем на 0,5% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.

 

2д) Для оценки статистической надежности результатов используем F-критерий Фишера.

Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.

Fфакт = = · (n-2)

Fфакт= = 4,5879

 

Сравним фактическое значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).

В нашем примере k1=1; k=12-1-1=10.

Таким образом. F табл .=4,96 при =0,05.

Т.к. Fфакт.< Fтабл., то при заданном уровне вероятности g=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.

 

2е) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля a=b=rух =0.

Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

; ;

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.

Если tтабл < tфакт, то Но отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл > tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b, r.

 

; ;

t табл при уровне значимости g=0,05 и числе степеней свободы равных 12-2=10 равно 2,2281 (приложение 2).

< tтабл, < tтабл, < tтабл,

следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии принимается, т. е. r, b и a статистически незначимы.

Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:

∆a = tтабл ma= 2,2281∙29,92=66,654

∆b = tтабл mb= 2,2281∙0,3388=0,7541

Доверительные интервалы:

Для параметра a: (-5,304; 128,011)

Для параметра b: (-0,029; 1,479)

Анализ верхних и нижних границ доверительных интервалов приводит к выводу, что с вероятностью p = 1–γ = 0,95 параметры a и b находятся в указанных пределах, причем оба параметра являются статистически незначимыми, т.к. в границы доверительного интервала попадает ноль.

3. Проверим результаты, полученные в п.2 с помощью ППП Exel.

Встроенная функция ЛИНЕЙН определяет параметры линейной регрессии. В ходе анализа придерживайтесь следующего порядка вычислений:

1) введите исходные данные или откройте существующий файл, содержащий исходную информацию для анализа;

2) выделите область пустых ячеек 5Í2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики;

3) активизируйте Мастер функций одним из способов:

а) в главном меню выберите Вставка/Функция;

б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;

 

4) в окне Категория (рис. 1.3) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК.

5) Заполните аргументы функции (рис. 1.4):

известные_значения_у – диапазон, содержащий данные результативного признака;

известные_значения_х – диапазон, содержащий данные факторов независимого признака;

константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член = 0;

 

Рис. 1.3. Диалоговое окно «Мастер функций».

статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.

Щелкните по кнопке ОК.

6) В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу <F2>, а затем – на комбинацию клавиш <CTRL>,<SHIFT>,<ENTER>.

Дополнительная регрессионная статистика будет выводится в порядке, указанном в следующей таблице:

Таблица 1.3.– Регрессионная статистика

Значение коэффициента β Значение коэффициента α
Среднеквадратическое отклонение β Среднеквадратическое отклонение α
Коэффициент детерминации R2 Среднеквадратическое отклонение у
F– статистика Число степеней свободы
Регрессионная сумма квадратов Остаточная сумма квадратов

 

 

Рис. 1.4. Диалоговое окно ввода аргументов функции ЛИНЕЙН

 

3а) Результат вычислений функции ЛИНЕЙН для рассматриваемого примера представлен на рис. 1.5.

 

Рис. 1.5. Результат вычисления функции ЛИНЕЙН

С помощью инструмента анализа данных Регрессии, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий следующий:

 

1) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите метку Пакет анализа (рис. 1.6).

 

 

Рис. 1.6. Подключение надстройки Пакет анализа

 

2) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК.

 

Рис.1.7. Диалоговое окно Анализ данных

3) заполните диалоговое окно ввода данных и параметров вывода (рис.1.8):

входной интервал У – диапазон, содержащий данные результативного признака;

входной интервал Х – диапазон, содержащий данные факторов независимого признака;

метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

константа – ноль – флажок, указывающий наличие или отсутствие свободного члена в уравнении;

выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

новый рабочий лист – можно задать произвольное имя нового листа.

Если необходимо получить информацию и графики остатков, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК.

 

 

Рис. 1.8. Диалоговое окно ввода параметров инструмента Регрессия

 

3б) Проведем анализ исходных данных рассматриваемого примера с помощью инструмента анализа Регрессия (рис. 1.9).

Рис. 1.9. Результаты применения инструмента Регрессия

 

Сравнивая полученные вручную и с помощью ППП Exel данные, убеждаемся в правильности выполненных действий.

4. Построению показательной модели у=a∙b х (29) предшествует процедура линеаризации переменных.

Данная функция нелинейна относительно параметров, но линейна по переменным. В нелинейных регрессиях относительно параметров процедура линеаризации производится путем логарифмирования обеих частей уравнения:

ln y = ln a + x ∙ln b (30)

Введем обозначения

У= ln y, С= ln a, В= lnb

Тогда уравнение (30) запишется в виде:

У= С+ В∙ x. (31)

 

Для нахождения параметров полученной линейной модели (31) воспользуемся вспомогательными расчетами (табл. 1.4)

Таблица 1.4. – Расчетные величины

х Y У∙х х2 Y2 ·%,
    4,890 474,363   23,915 4,877 0,262 0,00017 87,111 0,00327 0,0049
    4,532 358,075   20,54446 4,767 5,175 0,05503 75,111 0,00282 0,0828
    4,927 423,743   24,27783 4,810 2,377 0,01373 2,777 0,00010 0,0114
    4,812 370,538   23,15712 4,755 1,189 0,00328 113,777 0,00427 0,0001
    4,875 507,020   23,76755 4,920 0,927 0,00204 266,777 0,01001 0,0030
    4,779 329,759   22,84002 4,706 1,532 0,00536 348,444 0,01308 0,0017
    4,787 478,749   22,92008 4,896 2,264 0,01175 152,111 0,00571 0,0011
    4,990 464,110   24,90442 4,853 2,754 0,01889 28,444 0,00106 0,0289
    4,844 392,379   23,46615 4,779 1,336 0,00419 44,444 0,00166 0,0006
    4,919 501,838   24,20621 4,908 0,240 0,00014 205,444 0,00771 0,0099
    4,625 342,248   21,39037 4,736 2,412 0,01245 186,777 0,00701 0,0382
    4,859 437,383   23,61778 4,835 0,518 0,00064 5,444 0,00020 0,0016
Σ   57,84 5080,209   279,0075 57,843 20,99 0,12766 1243,200 0,05696 0,14642
Ср.зн 87,67 4,820 423,351 7811,8 23,25062 4,820 1,749        
σ 10,1964 0,1129                  
σ2 103,97 0,0127                  

 

Построим линейное уравнение парной регрессии У по х. используя данные таблицы 4, имеем:

=4,820-87,67∙0,0061285=4,285355.

Получим линейное уравнение регрессии:

Ŷ= 4,285+0,0061∙ х. (32)

 

Тесноту полученной линейной модели характеризует линейный коэффициент парной корреляции:

Коэффициент детерминации при этом равен:

 

R2=r2хУ=0,3067.

 

Это означает, что чуть более 30% вариации фактора Y объясняется вариацией фактора x.

Средняя ошибка линейной аппроксимации составляет:

= ∙100% = 20,992/12=1,15%.

В среднем по полученной линейной модели расчетные значения отклоняются от фактических на 1,15%, что входит в допустимый предел.

 

Проведя потенцирование уравнения (32), получим искомую нелинейную (показательную) модель.

72,628∙1,006 х (33)

 

Результаты вычисления параметров показательной кривой (1) проверим с помощью ППП Exel, для чего используем встроенную статистическую функцию ЛГРФПРИБЛ. Порядок вычислений аналогичен применению функции ЛИНЕЙН.

Сравнивая полученные вручную и с помощью ППП Exel данные, и учитывая тот факт, что в первой строке таблицы (рис.1.10) функция ЛГРФПРИБЛ возвращает коэффициенты показательной модели (29), а остальные параметры соответствуют линейной модели (31), убеждаемся в правильности выполненных действий.

Для расчета индекса корреляции ρxy нелинейной регрессии воспользуемся вспомогательной таблицей 5.

ρxy= = .=

Рис. 1.10. Результат вычисления функции ЛГРФПРИБЛ

 

Таблица 1.5. – Расчетные величины

х у
      131,008 3,967928 65,33974 87,111
      117,424 596,5368 1018,676 75,111
      122,531 239,296 171,1727 2,777
      116,005 48,9366 3,673739 113,777
      136,705 32,55268 37,00654 266,777
      110,496 72,32147 35,00734 348,444
      133,420 180,1 24,17394 152,111
      127,860 366,355 487,6721 28,444
      118,861 66,24258 4,340139 44,444
      135,053 3,791488 146,0061 205,444
      113,907 141,7835 525,1751 186,777
      125,548 11,91613 16,67334 5,444
Итого     1488,818 1763,8 2534,917 1243,200
Ср.зн 87,67 124,92 124,068 146,983 211,243 103,600

 

Найдем коэффициент детерминации

R2= ρ2xy ·100%=0,55152=0,3042

Полученное значение коэффициента детерминации говорит о том, что 30,42% вариации урожайности картофеля объясняется вариацией фактора х – дозы внесения органических удобрений.

Рассчитаем фактическое значение F-критерия при заданном уровне значимости =0,05:

Fфакт = = · (n-2)= = 4,37.

 

Сравнивая табличное F табл= 4,96 и фактическое Fфакт= 4,37 значение отмечаем, что Fфакт.< Fтабл.,

Это означает, что при заданном уровне вероятности g=0,05 следует принять нулевую гипотезу о статистической незначимости параметров уравнения регрессии.

 

5. Так как коэффициенты детерминации, соответствующие линейной и показательной моделям практически равны (около 30% вариации урожайности картофеля объясняется вариацией фактора х – дозы внесения органических удобрений в обеих моделях), то нет весомых оснований отдать предпочтение какой-либо модели.

Кроме того, в виду того, что оба уравнения регрессии является статистически незначимыми и ненадежными, рассчитывать прогнозируемое значение среднедушевого прожиточного минимума в день ни по одному из рассмотренных уравнений не имеет смысла, поскольку данный прогноз не даст достоверного результата.

Тем не менее, для закрепления методики расчета прогнозов, выполним расчет прогнозного значения результата по линейной модели. (R2лин = 0,3145 >R2показ= 0,3042).

По условию задачи прогнозное значение фактора выше его среднего уровня =87,67 на 5%, тогда оно составит:

=1,05∙87,67=92,05

и прогнозное значение урожайности картофеля при этом составит:

=61,35+0,725∙92,05=128,086

Найдем ошибку прогноза:

=

=

Далее строится доверительный интервал прогноза при уровне значимости g=0,05:

;

предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

=2,23∙13,8155=30,81

Доверительный интервал прогноза

(61,24; 122,86).

 




Поделиться с друзьями:


Дата добавления: 2017-02-01; Просмотров: 65; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.