КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Оценка параметров уравнения регреcсии. Пример
Задание: Требуется:
Посмотрите, как легко было найдено уравнение степенной регрессии с помощью сервиса.
Решение: 1. Уравнение имеет вид y = α + βx
Дисперсия Среднеквадратическое отклонение Коэффициент корреляции Коэффициент детерминации
Доверительный интервал для коэффициента корреляции Межгрупповая и общая дисперсии помогают определить, на сколько сильно результат педагогического эксперимента (или любого другого опыта) обусловлен принадлежностью испытуемого к той или иной группе. Для этого используетсякоэффициент детерминации . Рассмотрим пример. Пусть оценки, полученные на ЕГЭ по математике выпускниками классов с разными профилями, описаны в следующей таблице.
Определим, в какой степени успешность сдачи ЕГЭ зависит от принадлежности учащегося к той или иной группе. Для этого сначала найдем средний балл за экзамен для всей совокупности испытуемых: Найдем межгрупповую дисперсию: Далее следует определить внутригрупповую дисперсию: Определим общую дисперсию:Dв=Dвнгр+Dмежгр=9,98+45,66=55,64. Следовательно: . Полученный коэффициент детерминации показывает, что успешность сдачи ЕГЭ в данном опыте на 82% обусловлена принадлежностью учащегося к той или иной группе. Используют также эмпирическое корреляционное отношение, получаемое извлечением квадратного корня из коэффициента детерминации. В рассмотренном примере . Чем ближе значение корреляционного соотношения к единице, тем более тесную связь мы наблюдаем. Соответственно, в данном случае было показано наличие тесной связи между успешностью сдачи ЕГЭ и принадлежностью учащегося к той или иной группе обучаемых. Общая дисперсия помогает численно оценить, как сильно отличаются варианты выборки друг от друга. Межгрупповая дисперсия помогает выявить степень различия между группами данной выборки. Однако, в педагогических исследованиях зачастую не требуется численная оценка параметра, но при этом важно знать, существенно ли отличаются испытуемые (или группы испытуемых) друг от друга по тому или иному признаку. Ответ на такой вопрос даёт коэффициент вариации. Расчет линейного коэффициента корреляции Пирсона: В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы. Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом. Коэффициенты корреляции, основанные на использовании ранжированного метода, были предложены К. Спирмэном и М. Кендэлом. Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле (8.9) где d = Nx - Ny, т.е. разность рангов каждой пары значений х и у; n - число наблюдений. Ранговый коэффициент корреляции Кендэла () можно определить по формуле (8.10) где S = P + Q. К непараметрическим методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон, которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков. Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:
Здесь а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков ; n - общая сумма частот. Коэффициент ассоциации можно расcчитать по формуле (8.11) Коэффициент контингенции рассчитывается по формуле (8.12) Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации. Если необходимо оценить тесноту связи между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (КП). Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:
Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений. Коэффициент взаимной сопряженности Пирсона определяется по формуле (8.13) где - показатель средней квадратической сопряженности: Коэффициент взаимной сопряженности изменяется от 0 до 1. Наконец, следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле (8.14) где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb- соответственно количество несовпадений. Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0. 38.Изучение зависимости между количественными признаками. Ранговые показатели связи.Для исследования взаимосвязи качественных альтернативных признаков, принимающих только 2 взаимоисключающих значения, используется коэффициент ассоциации и контингенции. При расчете этих коэффициентов составляется т.н. таблица 4-х камней, а сами коэффициенты рассчитываются по формуле:
Если коэффициент ассоциации ³ 0,5, а коэффициент контингенции ³ 0,3, то можно сделать вывод о наличии существенной зависимости между изучаемыми признаками. Если признаки имеют 3 или более градаций, то для изучения взаимосвязей используются коэффициенты Пирсена и Чупрова. Они рассчитываются по формулам: С - коэффициент Пирсена К - коэффициент Чупрова
j - показатель взаимной сопряженности K - число значений (групп) первого признака K1 - число значений (групп) второго признака
fij - частоты соответствующих клеток таблицы mi - столбцы таблицы - j - строки Для расчета коэффициентов Пирсена и Чупрова составляется вспомогательная таблица:
При ранжировании качественных признаков с целью изучения их взаимосвязи используется коэффициент корреляции Кэндалла.
- - число наблюдений S - сумма разностей между числом последовательностей и числом инвервий по второму признаку. S=P+Q P - сумма значений рангов, следующих за данными и превышающих его величину Q - сумма значений рангов, следующих за данными и меньших его величины (учитывается со знаком «-»). При наличии связанных рангов формула коэффициента Кендалла будет следующей:
Vxи Vyопределяются отдельно для рангов Xи Yпо формуле: 39. Понятие и классификация рядов динамики Рядами динамики называются последовательно расположенные в хронологическом порядке статистические данные, отображающие развитие изучаемого явления во времени. В каждом ряду динамики имеются два основных элемента: 1. показатель времени t, который может быть представлен в виде определенных дат (моментов) времени, либо отдельных периодов (год, квартал, месяц, сутки); 2. уровни развития изучаемого явления у – отображают количественную оценку (меру) развития во времени изучаемого явления. Они могут выражаться абсолютными, относительными или средними величинами. В зависимости от характера изучаемого явления уровни рядов динамики могут относиться или к определенным датам (моментам) времени, или к отдельным периодам. В соответствии с этим, ряды динамики подразделяются на: 1. моментные ряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени, например, остатки товаров на складе готовой продукции на определенный момент времени (дату); 2. интервальные ряды динамики отображают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени, например товарооборот предприятия за определенный период. Чем больше изменчивость явления во времени, тем меньше должны быть промежутки во времени между данными. Отличительной особенностью моментного и интервального рядов динамики является понятие интервала. Для моментного ряда динамики интервал – промежуток времени между датами. § полный ряд - ряд динамики, в котором одноименные моменты времени или периоды времени строго следуют один за другим в календарном порядке или равноотстоят друг от друга. § неполный ряд динамики - ряд, в котором уровни зафиксированы в неравноотстоящие моменты или периоды времени. 40. Правила построения ряда динамики.1. Периодизация развития, т.е. расчленение его во времени на однородные этапы, в пределах которых показатель подчиняется одному закону развития. По существу, это типологическая группировка во времени. 2. Статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии расчета. 3. Величины временных интервалов должны соответствовать интенсивности изучаемых процессов. Чем больше вариация уровней во времени, тем чаще следует делать замеры, соответственно для стабильных процессов интервалы можно увеличить. 4. Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями. 41. Показатели анализа ряда динамикиПри изучении явления во времени перед исследователем встает проблема описания интенсивности изменения и расчета средних показателей динамики. Решается она путем построения соответствующих показателей. Для характеристики интенсивности изменения во времени такими показателями будут: Расчет показателей динамики представлен в следующей таблице.
* В случае, когда сравнение проводится с периодом (моментом) времени, начальным в ряду динамики, получают базисные показатели. Если же сравнение производится с предыдущим периодом или моментом времени, то говорят о цепных показателях. 42. Структура ряда динамики. Проверка ряда на наличие тренда.Всякий ряд динамики теоретически может быть представлен в виде составляющих: Ø тренд – основная тенденция развития ряда, обусловливающая увеличение или снижение его уровней; Ø циклические (периодические) колебания (в том числе сезонные); Ø случайные колебания. Проверка ряда динамики на наличие в нем тренда возможна несколькими способами (в порядке усложнения): 1. Графический метод, когда на графике по оси абсцисс откладывается время, а по оси ординат – уровни ряда. Соединив полученные точки линиями, в большинстве случаев можно выявить тренд визуально. 2. Метод средних, согласно которому изучаемый ряд динамики делится на два равных подряда, для каждого из которых определяется средняя величина и . И если они различаются существенно (более 10%), то признается наличие тренда. 3. Метод Кокса и Стюарта, согласно которому ряд динамики делится на три равные по числу уровней группы и существенное различие выявляется между средними уровнями первой и третьей групп. Если общее число уровней не делится на три, то надо добавить недостающий уровень или исключить излишний. 4. Метод Валлиса и Мура, согласно которому наличие тренда признается в том случае, если ряд не содержит либо содержит в приемлемом количестве фазы, т.е. перемену знака при определении абсолютного изменения цепным способом. 5. Метод серий, согласно которому каждый уровень ряда считается принадлежащим к одному из двух типов, например типу А – меньше медианного или среднего значения или типу В – больше его. Затем в образовавшейся последовательности типов устанавливается число серий R. Они называются последовательностью уровней одинакового типа, которая граничит с уровнями другого типа. Если в ряду динамики общая тенденция к росту или снижению уровней отсутствует, то число серий является случайной величиной, распределенной приближенно по нормальному закону (при n>30) или по распределению Стьюдента (при n<30). Следовательно, если закономерности в изменениях уровней нет, то случайная величина R оказывается в доверительном интервале где t – коэффициент доверия для принятого уровня вероятности при нормальном законе или со степенью свободы k = (n - 1) при распределении Стьюдента; – среднее число серий в ряду, определяемое по формуле: ; – среднее квадратическое отклонение числа серий в ряду, определяемое по формуле . Подставляя среднее число серий и его среднее квадратическое отклонение в доверительный интервал, получим его развернутое значение в виде . Значит, с заданной вероятностью тренд имеет место, если установленное число серий ряда не входит в доверительный интервал, и тренд отсутствует, если установленное число серий находится в этом интервале. 43. Анализ сезонных колебаний.При анализе колеблемости динамических рядов наряду с выделением случайных колебаний, возникает задача изучения периодических колебаний. Как правило, изучение периодических (сезонных) колебаний необходимо с целью исключения их влияния на общую динамику для выявления чистой (случайной) колеблемости. К сезонным относят все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность внутригодичных изменений, т.е. более или менее устойчиво повторяющиеся из года в год колебания уровней. Часто эти колебания могут быть не связаны со сменой времен года. К сезонным явлениям относят, например, потребление электроэнергии; неравномерность производственной деятельности в отраслях пищевой промышленности, связанных с переработкой сельскохозяйственного сырья; перевозки пассажирским транспортом; спрос на многие виды продукции и услуги. Как бы ни проявлялась сезонность, она наносит большой ущерб национальной экономике, связанной с неравномерным использованием оборудования и рабочей силы, с неравномерной загрузкой транспорта, необходимостью создания резервов мощностей и т.д. Комплексное регулирование сезонных изменений по отдельным отраслям должно основываться на исследовании сезонных отклонений. Многие временные ряды имеют ярко выраженные сезонные компоненты, повторяющиеся с определенной периодичностью. Эта периодичность имеет место каждый год. Если в анализируемой временной последовательности наблюдаются устойчивые отклонения от тенденции (в большую или в меньшую сторону), то можно предположить наличие в ряду динамики некоторых (одного или нескольких) колебательных процессов. Это особенно заметно, когда изучаемые явления имеют сезонный характер, — возрастание или убывание уровней повторяется регулярно с интервалом в один год (например, производство молока и мяса по месяцам года, потребление топлива и электроэнергии для бытовых нужд, сезонная продажа товаров и т.д.). Задачи, которые необходимо решить в ходе исследования сезонности:
Для измерения сезонных колебаний статистикой предложены различные методы. Наиболее простые и часто употребляемые из них:
Первые два способа предполагают нахождение разностей фактических уровней и уровней, найденных при выявлении основной тенденции развития (тренда). Применяя способ абсолютных разностей, оперируют непосредственно размерами этих разностей, а при использовании метода относительных разностей, определяют отношение абсолютных размеров указанных разностей к выровненному уровню. При выявлении основной тенденции используют либо метод скользящей средней, либоаналитическое выравнивание. В некоторых случаях в стационарных рядах можно пользоваться разностью фактических уровней и средним месячным уровнем за год. Использование данных за несколько лет связано с тем обстоятельством, что в отклонениях по отдельным годам сезонные колебания смешиваются со случайными. Чтобы элиминировать случайные колебания, берут средние отклонения за несколько лет. Для выделения сезонной волны надо определить средний уровень за каждый месяц по 3-5-летним данным и общую среднюю за весь рассматриваемый период. Общая средняя получается делением суммы уровней за все три-пять лет на 36 или 60 (общее число месяцев). Затем определяется абсолютное отклонение средних месячных показателей от общей средней. Метод абсолютных разностей заключается в расчете месячных средних и общей средней с последующим их сравнением:
Если сезонность оценивается по данным за 3 года (36 месяцев), если за 5 лет (60 месяцев): где: yi — значение уровня динамического ряда. Величина и знак значений абсолютных отклонений определяют наличие сезонности. В качестве показателя, характеризующего сезонную неравномерность, используется показатель относительного отклонения. Метод относительных разностей является развитием метода абсолютных разностей. Для нахождения относительных разностей абсолютные отклонения делят на общую среднюю и выражают в процентах. По величине и знакам значений относительных отклонений можно судить о величине и силе влияния сезонного фактора. Вместо относительных разностей за каждый месяц может быть вычислен индекс сезонности, который рассчитывается как отношение среднего уровня соответствующего месяца к общей средней. Индекс сезонности рассчитывается:
Рассчитанные значения индекса сезонности сравниваются со значением 100 %. Если индекс сезонности превышает 100 % — это свидетельствует о влиянии сезонного фактора в сторону увеличения уровней динамического ряда и наоборот. Расчет индекса сезонности по данной формуле не учитывает наличие тренда. Выделение сезонной волны можно выполнить на основе построения аналитической модели проявления сезонных колебаний. Построение аналитической модели выявляет основной закон колеблемости данного временного ряда в связи с переходом от месяца к месяцу и дает лишь среднюю характеристику внутригодичных колебаний. 44. Элементы прогнозирования и интерполяции.Анализ динамики социально-экономических явлений, выявление и характеристика основной тенденции развития дают основание для прогнозирования - определения будущих размеров уровня экономического явления. Процесс прогнозирования предполагает, что закономерность развития, действующая в прошлом (внутри ряда динамики), сохранится и в прогнозируемом будущем, то есть прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называется перспективой, и в прошлое - ретроспективой. Обычно, говоря об экстраполяции рядов динамики, подразумевают чаще всего перспективную экстраполяцию. Первоначальные прогнозы, как правило, сводятся к экстраполяции тенденции. При этом могут использоваться разные методы, в зависимости от исходной информации. Можно выделить следующие элементарные методы экстраполяции: на основе среднего абсолютного прироста, среднего темпа роста и экстраполяция на основе применения метода наименьших квадратов и представления развития явлений во времени в виде уравнения тренда, т.е. математической функции уровней ряда (у) от фактора времени (t). Прогнозирование по среднему абсолютному приросту может быть выполнено в том случае, если есть уверенность считать общую тенденцию линейной, то есть метод основан на предположении о равномерном изменении уровня (под равномерностью понимается стабильность абсолютных приростов). В этом случае, чтобы получить прогноз на «i» шагов вперед (i - период упреждения), достаточно воспользоваться следующей формулой: (9.34.) где уn - фактическое значение в последней n-ой точке ряда (конечный уровень ряда); - прогнозная оценка значения (п+1) уровня ряда; ∆¯ - значение среднего абсолютного прироста, рассчитанное для ряда динамики y1; y2; y3;…; yn. Прогнозирование по среднему темпу роста можно осуществлять в случае, когда есть основание считать, что общая тенденция ряда характеризуется показательной (экспоненциальной) кривой. Для нахождения прогнозного значения на «i» шагов вперед необходимо использовать следующую формулу: (9.35.) где К¯p - средний коэффициент роста, рассчитанный для ряда y1; y2; y3;…; yn. К недостаткам рассмотренных методов следует отнести то, что они учитывают лишь конечный и начальный уровень ряда, исключая влияние промежуточных уровней. Тем не менее, методы среднего абсолютного прироста и среднего темпа роста имеют весьма широкую область применения, что объясняется простотой их вычисления. Они могут быть использованы как приближенные, простейшие способы прогнозирования, предшествующие более глубокому количественно-качественному анализу. Наиболее распространенным методом прогнозирования является аналитическое выражение тренда. При этом для выхода за границы исследуемого периода достаточно продолжить значения независимой переменной времени (t). При таком подходе к прогнозированию предполагается, что размер уровня, харак-теризирующего явление, формируется под воздействием множества факторов, причем не представляется возможным выделить отдельно их влияние. В связи с этим ход развития связывается не с какими-либо конкретными факторами, а с течением времени. На практике для описания тенденции развития явления широко используются модели кривых роста, представляющие собой различные функции времени у = f(t). Процедура разработки прогноза с использованием кривых роста включает в себя следующие этапы: 1) выбор одной или нескольких кривых, форма которых соответствует характеру изменения ряда динамики; 2) оценка параметров выбранных кривых;-3) проверка адекватности выбранных кривых прогнозируемому процессу и окончательный выбор кривой роста; 4) расчет точечного и интервального прогнозов. Остановимся на величине доверительного интервала прогноза, который определяется по формуле: 9.36) где: σ - средняя квадратическая ошибка тренда; y¯t+1 - расчетное значение уровня; ta - доверительная величина, определяемая на основе t-критерия Стьюдента. Вместо ta - критерия удобно использовать коэффициент (К*). Например, необходимо провести прогноз на 2005-2006 гг. по данным таблицы (9.5) количества проданных квартир в N-ом регионе. Для экстраполяции используем уравнение тренда, полученное по прямой: y¯t = 39,7 + 0,25t. Подставив соответствующее значение t в наше уравнение, получим точечные прогнозы на 2005-2006 гг. (графа 2 таблицы 9.9). Для построения интервальных прогнозов рассчитаем среднеквадратическую ошибку тренда (σt=0,56) и используем значения К Результаты прогноза представлены в таблице 9.9. ^ Таблица 9.9.
Дата добавления: 2014-12-24; Просмотров: 1579; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |