Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Функциональные и корреляционные связи




В теории, как правило, все соотношения устанавливаются в детерминированной форме, то есть допускает, что если две переменные взаимосвязаны, то любому заданному значению одной переменной отвечает лишь одно значение второй. Такие связи называются функциональными. Для них характерно то, что изменения результативного признака в целиком обусловлены действием факторного признака х:

Y = f (X)

Особенностью функциональной связи есть то, что она проявляется с одинаковой силой для каждого элемента изучаемой совокупности. Поэтому, установив при изучении любого элемента совокупности ту или иную закономерность, ее можно распространять и на всю совокупность. С самого начала следует учитывать, что даже предположение относительно возможности получить полную информацию обо всех аспектах рассматриваемого явления нереально. Но есть и другой, более важный и фундаментальный аспект неопределенности информации — многофакторность и взаимное влияние процессов. Такой случай можно представить как корреляционную связь, при котором переменная результативного признака Y обусловлена влиянием на нее Х не целиком, а лишь частично:

Y=f (X)+ε

Случайная часть ε отображает или внутренне присущую результативному признаку переменчивость, или влияние на нее факторов, не учтенных этим соотношением, или то и другое вместе. Хотя абстрагирование от ряда параметров ведет к некоторому упрощению (аппроксимации) реального механизма связи, тем не менее, именно это дает возможность установить закономерности во взаимодействии изучаемых признаков и разрешает получить количественные характеристики корреляционной связи.

Парадо́кс закономе́рности — наблюдение, заключающееся в том, что большинство людей, увидев явную закономерность в результатах серии испытаний (например, выпадение 10000 раз подряд одного и того же исхода из двух возможных), будут склонны считать, что испытания не являются случайными, потому что появление этой последовательности в случайных испытаниях является маловероятным событием. Однако, появление любой другой последовательности из 10000 значений в случайных испытаниях является настолько же маловероятным.

Парадокс может быть проиллюстрирован с помощью следующей игры с двумя участниками. Первый участник подбрасывает монету 50 раз и записывает результаты бросаний на листе бумаги (пусть орел обозначается 0, а решка — 1). Второй участник не видит результатов этих испытаний. На втором листе бумаги первый участник пишет любую последовательность такой же длины из нулей и единиц (его мотивы и способ формирования этой последовательности преднамеренно не раскрываются). Затем листы бумаги перемешиваются и отдаются второму участнику. Оказалось, что на одном из них написано 00111100000100110100000111010111101000111101011010, а на другом — 00000000000000000000000000000000000000000000000000. Второй участник должен угадать, на каком из листов записан результат бросания монеты. Если он выберет лист произвольно, то вероятность правильного ответа будет 1/2. Есть ли у него возможность увеличить шансы правильного ответа? Парадокс заключается в том, что многие люди уверены, что, выбрав лист с последовательностью 00111100000100110100000111010111101000111101011010, второй участник может значительно увеличить свои шансы на успех, в то время как другие уверены, что вероятность правильного ответа в любом случае не превысит 1/2.

Разрешение парадокса. На самом деле здесь описываются два разных процесса, один из них вероятностный, а другой — вполне сознательный, выбор человека из того, что написано другим человеком.

Есть некоторые ограничения, налагаемые на принципиальное применение методов корреляционного анализа. Применение возможно в случае наличия достаточного количества случаев для изучения: для конкретного вида коэффициента корреляции составляет от 25 до 100 пар наблюдений. Второе ограничение вытекает из гипотезы корреляционного анализа, в которую заложена линейная зависимость переменных. Во многих случаях, когда достоверно известно, что зависимость существует, корреляционный анализ может не дать результатов просто ввиду того, что зависимость не линейна (выражена, например, в виде параболы). Сам по себе факт корреляционной зависимости не даёт основания утверждать, какая из переменных предшествует или является причиной изменений, или что переменные вообще причинно связаны между собой, например, ввиду действия третьего фактора.

Кроме того, корреляция может быть ложной. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Иллюстрацией этому служит хорошо известный анекдот: если выйти на улицу и измерить у 1000 случайных прохожих размер обуви и IQ, между ними будет обнаружена статистически значимая корреляция. Однако это не значит, что размер ноги влияет на интеллект, так как на наличие этой взаимосвязи, скорее всего, повлияли такие факторы, как пол и возраст участников исследования.

 

Коэффициент корреляции r равен ±1 тогда и только тогда, когда две выборки линейно зависимы. Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Если модуль коэффициента (без учета знака) более 0.95, говорят о наличии практически линейная зависимость. При 0.75<|r|<0.95 говорят о сильной степени линейной зависимости между параметрами. При 0.45<|r|<0.75 - о существовании линейной связи между параметрами. при |r|<0.45 говорят, что линейную связь выявить не удалось.

В этом случае применяют так называемые непараметрические методы оценивания. Такими методами можно оценивать данные, которые не подчиняются нормальному закону распределения. В Статистике непараметрические методы реализованы в модуле Nonparametrics/Distrib.

 

Оценка значимости различия частот наблюдений в независимых выборках по χ2-критсрию Пирсона.

Для оценки значимости различия частот наблюдения изучаемого признака в нескольких независимых группах без расчета относительных величин частоты и оценки их точности и надежности рекомендуется непараметрический критерий Пирсона «хи-квадрат».

Критерий хи-квадрат — это наиболее простой критерий проверки значимости связи между двумя категорированными переменными. Точное название - "хи-квадрат Пирсона". Критерий Пирсона основывается на том, что в двухвходовой таблице ожидаемые частоты при гипотезе "между переменными нет зависимости" можно вычислить непосредственно. Например, что 20 мужчин и 20 женщин опрошены относительно выбора газированной воды марки A или марки B. Если между предпочтением и полом нет связи, то естественно ожидать равного выбора марки A и марки B для каждого пола.

Критерий представляется уравнением:

χ2 = Σ(n1i-n2i)2/ n2i,

где n1i - наблюдавшееся число случаев признака в і-ой ячейке частотной таблицы;

n2i - теоретическое (рассчитанное, как среднеожидаемое) число случаев признана в і-й ячейке частотной таблицы.

При точном совпадении n1i и n2i во всех ячейках таблицы χ2 = 0, чтосвидетельствует о полном соответствии числа наблюдений в группе по данному признаку.

При увеличении разности | n1i - n2i |величина χ2 возрастает, увеличивается вероятность различия, и когда она становится равна или больше 95% считают, что различие групп по данному критерию значимо.

Решение получают, сравнивая рассчитанное значение χ2 с критическими значениями χ205,, χ201, χ2001 , которые берут из соответствующей таблицы по уровням значимости р=0,05; 0,01; 0,001 и числу степеней свободы

n` = (m-1)*(s-1),

где m - число сравниваемых групп,

s- число уровней изучаемого признака.

 

При χ2 < χ205 различие групп по данным признакам незначимо (p >0,05)

При χ2χ205 или χ201, или χ2001 - различие значимо с уровнем значимости соответственно р≤0,05; р≤0,01; р≤0,001.

Исходной для решения задачи служит частотная таблица, содержащая m строк и s столбцов по числу уровней изучаемого признака. Корректное решение может быть получено, если число наблюдений будет ≥ 5. При меньшем числе наблюдений можно получить лишь приблизительное решение.

 




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 1748; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.014 сек.