КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Зависимость расходов на потребление от дохода 3 страница
3. ОБРАЗЕЦ ВЫПОЛНЕНИЯ Исходные данные Пусть X – личный доход в США (млрд. долларов, в ценах 2000-2011 гг.), Y – персональный расход на потребление в 2000-2011 гг. (табл.2.4) Таблица 2.4
Данные взяты на сайте https://datamarket.com/data/set/1fsm/us-economic-statistics-disposable-personal-income-seasonally-adjusted-annual-rate#! 1. По заданному варианту экспериментальных данных построим корреляционное поле (xi, yi), i = 1,2,…, 12 (см. рис.2.3). На основании визуального исследования выдвинем гипотезу о линейной зависимости Y от X : Y = a + bX + e. 2. Числовые характеристики случайных величин найдем по формулам, приведенным в таблице 1.3. = (1/ n)å xi = (1/12)(7327,1 + 7648,4 + … + 11553,2) = 9534,4; = (1/ n)å yi = (1/12)(6830,3 +7151 + … + 10724,4) = 8853,8; = (1/12)å xi 2 – = (1/12)((7327,1)2 + … + (11553,2)2) – (9534,4)2 =2008664,8; = = 1417,2; = (1/12)å yi 2 – = (1/12)((6830,3)2 + … + (10724,4)2) – (8853,8)2 = 1611909,8; = = 1269,6; cov(X, Y) = (1/ n)å – = (1/12)(6830,3 × 7327,1 + … + 10724,4 × 11553,2) – 8853,8 × 9534,4 = 1794293,6 = cov (X, Y) / ( ) = 1794293,6/(1269,6 ×1417,2 ) = 0,99. 3. Оценки коэффициентов уравнения регрессии находим по формулам (2.2): b = cov(X, Y)/s x 2 = 1794293,6 / 2008664,8= 0,893 a = – b· = 8853,8– 0,893 × 9534,4 = 339,5 Уравнение регрессии имеет вид y = a + b·x = 339,5 + 0,893· x. (2.4) 4. Рассчитаем по уравнению регрессии значение и прогнозируемое значение y *: = a + b·x 1 = 339,5 + 0,893 × 7327,1 = 6882,6, y *= a + b·x * = 339,5 + 0,893 × 12000 = 11055,5. Погрешность d1 = y 1 – = 6830,3– 6882,6 = -52,3. Относительная погрешность вычисления y 1 равна 0,7%: d1/ y 1 » 0,007. 5. Построим линию регрессии y = a + b·x = 339,5 + 0,893· x по двум точкам (x 1, y 1) и (x *, y *) (рис.2.1). 6. Коэффициент детерминации r2 = R 2 =(0.99)2=0.98, что говорит о высоком качестве модели. Действительно, 98% изменчивости расходов Y объясняется влиянием фактора X, остальные 2% -влиянием других факторов. Критерий проверки гипотезы о значимости уравнения регрессии по критерию Фишера описан в п.1.10. Расчетное значение статистики Фишера определяем по формуле (1.22 ), учитывая, что число факторов модели k=1: Fрасч= 0.98·10/(1-0.98) =495. 8. Критическое (табличное) значение статистики Фишера определим по таблице (например, [ 2], табл.А.3) для заданного уровня значимости α =0.05 и числа степеней свободы k=1 и n-k-1=12-1-1=10: Fтабл(1, 10)=4.96. Т.к. Fрасч > Fтабл, то гипотеза H0 об отсутствии влияния переменной X на Y отклоняется, а уравнение регрессии (2.4) признается значимым на уровне значимости α =0.05. Решение с помощью ППП Excel При использовании в расчетах пакета Excel сначала в первые две колонки файла вводятся исходные денные. Далее можно в соседних колонках вычислить квадраты значений x i2, y i2 и произведение двух столбцов xi, yi, i = 1, …, n. Проводя суммирование по каждому из полученных пяти столбцов, получим значения å xi, å yi, å xi 2, å yi 2, å xiyi, по которым непосредственно рассчитываются числовые характеристики из заданий 2 и 3. Фрагмент расчетов для нашего примера приведен в таблице 2.2. Таблица 2.4
По найденным значениям сумм затем, как это сделано выше, проводятся все остальные расчеты. Гораздо более эффективно задачу о нахождении уравнения линейной регрессии можно решить, используя встроенную функцию ЛИНЕЙН., определяющую параметры линейной регрессии и ряд дополнительных статистик. Для обращения к этой функции: 1) открыть файл, содержащий анализируемые данные (два столбца), и выделить в нем область пустых ячеек 5´2 для вывода результатов анализа; 2) в главном меню выбрать пункт Вставка/Функция, а в нем функцию Статистические/ЛИНЕЙН., и заполнить диалоговое окно ввода переменных (введя информацию о значениях X и Y и две константы 1 и 1); 3) вывести дополнительные статистики можно, нажав клавиши F2, затем Ctrl + Shift + Enter. Решение с помощью ППП STATGRAPHICS 1. Создайте файл, и в нем занесите ваши данные (xi, yi), i = 1, …, n, в колонки X и Y соответственно. 2. Для нахождения числовых характеристик случайных величин X и Y откройте окно описательного анализа функций многих переменных Describe\Numeric Data\One Variable Analysys. В нем нажмите кнопку Tabular Options и в диалоговом окне отметьте пункты Summary Statistics и Correlation. Результат появится в виде таблицы, фрагмент которой представлен в табл. 2.5. Таблица 2.5.
Дата добавления: 2014-12-24; Просмотров: 495; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |