КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Анализ статистических связей и зависимостей
Статистическая связь между двумя и более переменными – это такое соотношение между ними, когда при изменении значения одной переменной меняются распределения других переменных. Отсутствие статистической связи между переменными называется статистическойнезависимостью.
Статистическая связь ассиметрична (в противовес функциональной, как, например, в физике), тут изменение одной переменной может повлечь за собой изменение другой, не обязательно наоборот. Плюс ко всему статистическая связь выражается как общая тенденция (есть исключения), а не закон.
Если наблюдается связь меду двумя переменными, она называется парной; если же переменных больше, чем две, то связь между ними называется множественной.
Если хотя бы одна из переменных номинальная (не дихотомическая), говорят, что связь является ненаправленной. Если обе переменные являются порядковыми или количественными, можно говорить о направленной (прямой или обратной) связи между ними. Прямая (положительная) связь означает одновременное увеличение/уменьшение обеих переменных. Обратная (отрицательная связь) связь – связь, при которой с увеличением значения одной переменной уменьшается значение другой (исключение тут – дихотомические переменные: значение не возрастают и не уменьшаются, но связь может быть направленной). Если обе переменные являются дихотомическими, то связь между ними является прямой в случае, когда обе переменные появляются (или не появляются) чаще вместе, чем порознь; и является обратной, если переменные чаще появляются порознь. Если дихотомическая переменная связана с количественной или порядковой переменной, то она (дихотомическая переменная) считается обычной номинальной переменной и связь считается ненаправленной.
Если пара переменных просматривается без выделения причины и следствия, связь между ними является корреляционной. Если одна переменная измеряет причину, а вторая следствие, связь называется причинной (каузальной) или зависимостью (следствие зависит от причины). Выделяют следующие необходимые (но не достаточные) принципы (критерии) каузальности (причинности) связи: 1. измерение причины должно во времени предшествовать следствию (исключение составляют аскриптивные переменные – измеряющие врожденные статус (пол, раса, характеристики родителей) и образование, если оно закончено к моменту появления следствия) 2. переменные должные коррелировать друг с другом, т.е. мы сначала должны убедиться в наличии связи прежде, чем говорить о её причинности. 3. на причину и следствие не должны влиять третьи факторы (может иметь место ложная корреляции и ложная интерпретация).
Таблица сопряженности как инструмент изучения связей. Таблица сопряженности – наиболее универсальный инструмент исследования связей: 1. Применяется для перченых всех уровней измерения в любых сочетаниях (количественные переменные группируются в интервалы). 2. Применяются для направленных и ненаправленных связей. 3. Применяются для изучения корреляционных и каузальных связей. Главный недостаток таблицы – нечувствительность к характеру и модели связи (к тому, в чем именно заключается связь).
Тут представлено совместное частотное распределение двух переменных, на пересечении строки и столбца таблицы указывается количество объектов, которые одновременно обладают соответствующими значениями обеих переменных. Другими словами, на пересечении находится частота одновременного появления переменных. В таблице могут быть представлены как абсолютные, так и относительные частоты. В зависимости от задачи, стоящей перед исследователем, относительные частоты бывают трех видов: 1. с итогом по строке:
2. с итогом по столбцу:
3. с итогом, равным объему выборки.
В общем виде таблицу сопряженности можно представить так:
Тут с – количество столбцов. r – количество строк. f(r,с) – частота совместного появления признаков. Правильно обозначать частоту f(i,j) () На полях отображаются суммы частот: Сумма частот по строке i обозначается и называется маргинальной частотой строки i: Сумма частот по столбцу j обозначатся и называется маргинальной частотой столбца j: Объем выборки (правый нижний угол таблицы) – 1) сумма маргинальных частот по строкам, 2) сумма маргинальных частот по столбцам, 3) сумма всех частот внутри таблицы. 1) 2) 3)
Дата добавления: 2014-01-11; Просмотров: 808; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |