Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Основные понятия корреляционного и регрессионного анализа

ТЕМА 7. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ

7.1 Основные понятия корреляционного и регрессионного анализа

7.2. Парная корреляция и парная линейная регрессия

7.3. Множественная линейная регрессия

7.4. Нелинейная регрессия. Коэффициенты эластичности

7.5. Множественная корреляция

7.6. Оценка статистической значимости параметров взаимосвязи

7.7. Непараметрические методы оценки связи

Оценка связей между явлениями и процессами, характера этих связей, особенностей воздействия одних факторов на другие, выделение наиболее существенных взаимозависимостей между изучаемыми статистическими показателями является одной из основных задач статистики. Для описания статистических связей разработана система количественных оценок.

Формы проявления взаимосвязей весьма разнообразны. В самом общем виде выделяют связи функциональные и связи корреляционные. В случае функциональной связи величине факторного признака строго соответствует одно или несколько значений функции (признака-результата). Достаточно часто функциональная связь проявляется в естественных науках. В экономике примером может служить пропорциональная зависимость объема произведенной продукции от уровня производительности труда, зависимость суммы выручки от количества товара и его цены и т.д.

Корреляционная или статистическая связь проявляется в среднем, для массовых наблюдений, когда каждому конкретному значению независимой переменной X (фактору) соответствует некоторое вероятное значение зависимой переменной Y (результата). В общем случае – конкретным значениям одного или нескольких факторных признаков соответствует некоторое вероятное значение результата. Объяснение этому и в сложности непосредственных взаимосвязей между анализируемыми признаками, и в том, что на характер этих связей влияют случайные причины. Поэтому общая связь между признаками проявляется лишь в среднем, в массе случаев. Некоторое изменение аргумента повлечет лишь среднее увеличение (или уменьшение – в зависимости от направленности связи) функции. Конкретные значения функции-результата у отдельных единиц наблюдения будут отличаться от среднего уровня функции при конкретном для данного наблюдения значении аргумента.

Такие зависимости встречаются повсеместно. В сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что количество удобрений важно для формирования урожая. Но для каждого конкретного участка одно и то же количество внесенных удобрений определяет разный уровень урожайности, поскольку во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. В среднем же такая связь наблюдается: увеличение массы внесенных удобрений ведет к росту урожайности.

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, когда рост факторного признака сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.

По своей аналитической форме связи проявляются как линейные или нелинейные. В первом случае между признаками в среднем проявляются линейные соотношения. Во втором – переменные связаны между собой не линейно, например, зависимостью параболической, экспоненциальной, гиперболической и т.д.

Важной является характеристика связей с точки зрения количества взаимодействующих факторов. Если изучается связь двух признаков, то ее принято называть парной. Если изучаются зависимости между системами признаков (предполагается, что хотя бы в одной из систем число признаков больше 2), связь принято называть множественной.

По степени (силе, тесноте) различаются связи слабые и сильные. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.

Дли изучения взаимосвязи в статистике используются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. Иногда эти методы объединяют в один корреляционно-регрессионный анализ (КРА), что имеет под собой определенные основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов. Поэтому можно говорить о корреляционном анализе в широком смысле, когда взаимосвязь характеризуется всесторонне. В то же время выделяют корреляционный анали з в узком смысле, когда исследуется сила связи, и регрессионный анализ, в ходе которого оцениваются форма связи и воздействие одних признаков на другие.

Задачи собственнокорреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на вариацию результативного признака. Задачирегрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной.

Методы анализа корреляции и регрессии широко представлены в современных системах обработки статистических данных на ПЭВМ (например, STATISTICA, SPSS). Исследователь должен подготовить исходную информацию и быть готовым к интерпретации полученных результатов. В настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов является обязательным условием исследования.

Методы оценки тесноты связи разделяются на параметрические (корреляционные) и непараметрические. Параметрические методы основаны на использовании оценок параметров распределения вероятностей изучаемых величин: математического ожидания, дисперсии и т.д., и, следовательно, применяются в случаях, когда эти параметры можно предварительно вычислить. На практике в начале исследования обычно считают, что первичные данные подчиняются закону нормального распределения вероятностей.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин и обычно более просты в вычислениях. Поэтому их применяют и для оценки корреляционных связей, и особенно широко для оценки связи атрибутивных (качественных) признаков.

<== предыдущая лекция | следующая лекция ==>
Распространение выборочных результатов | Парная корреляция и парная линейная регрессия
Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 1642; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.