Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Методы анализа с двумя переменными




Многие вопросы анализа информации касаются связей между различными переменными и не поддаются исследованию с помощью вышеописанных методов. Основной признак двумерных методов в том, что одновременно анализируются две переменные, исследуются взаимосвязи и зависимости между ними. В дальнейшем будут рассмотрены наиболее часто применяемые на практике методы перекрестных таблиц, корреляции и простой регрессии. Выбор метода зависит от целей анализа и уровня шкалы анализируемых переменных (табл.4.2.)

Таблица 4.2.

Влияние уровня шкалы на выбор метода исследования зависимостей

Переменные Зависимые
    Независимые Уровень шкалы Номинальный Метрический
Номинальный Перекрестные таблицы Дисперсионный анализ
Метрический Дискриминантный анализ Регрессионный анализ

 

Метод перекрестных таблиц. Этот метод является наиболее простым подходом для исследования зависимостей между двумя переменными. Вначале строится таблица, в которую заносятся все возможные значения двух переменных (перекрестная таблица), в клетки которой записывают частоты каждой комбинации значений переменных. Метод можно применять по номинальным данным, ординальные и метрические данные должны быть приведены в номинальный вид. Связь проверяется с помощью хи-квадрат теста. Для расчета используется следующая формула:

 

 

где: - наблюдаемая частота в ячейке ij;

- ожидаемая при независимости переменных частота в ячейке ij;

r- число колонок;

s- число строк.

Критические значения хи-квадрат теста определяются в зависимости от степеней свободы для заданной вероятности ошибки по специальным таблицам. Тест выявляет лишь наличие статистической зависимости, но не позволяет оценить ее силу. В принципе этот недостаток характерен для всех статистических методов. В случае хи-квадрат теста, кроме того, неизвестно и направление зависимости.

 

Корреляция и регрессия

Корреляционный анализ является важнейшим методом для определения величины и направления линейной зависимости между метрическими переменными. Коэффициент корреляции может принимать значения от -1 до 1, он показывает силу и направление линейной связи между X и Y. Экстремальные значения +1 и -1 наблюдаются в том случае, когда все пары наблюдений находятся на прямой, поднимающейся, или, соответственно, падающей слева направо. Коэффициент корреляции, больший чем 0.5, принято считать признаком относительно сильной прямой корреляции, меньший, чем -0.5- признаком относительно сильной обратной корреляции. Значение r в пределах 0 показывает слабую связь или отсутствие линейной связи. Однако в этом случае может наблюдаться квадратическая или экспотенциальная связь. Принципиально следует отметить, что коэффициент корреляции, как и любой метод для измерения связи, показывает только формальную, а не причинно-следственную связь. Например, можно обнаружить тесную статистическую связь между приливами и количеством лунатиков, однако эта связь не имеет причинного основания. Обе характеристики обусловлены движением Луны.

Регрессионный анализ также работает с метрическими переменными, однако, в отличие от корреляционного, подразумевает деление на зависимые и независимые переменные. В случае простой регрессии исследуются зависимая переменная Y и независимая переменная X, что можно показать графически. Отдельные пары значений образуют, как и при корреляционном анализе, “облако” в системе координат. Основная цель регрессионного анализа состоит в поиске функции, по возможности точно отражающей данное “облако”, для того чтобы на основе известного значения X спрогнозировать значение Y. В большинстве случаев выбирается линейная форма связи с функцией Y= a+bX. Коэффициенты регрессии a и b рассчитываются таким образом, что реальные значения Y как можно меньше отклоняются от рассчитанных значений. Как правило, при этом используется метод наименьших квадратов, минимизирующий сумму квадратов отклонений расчетных и фактических значений Y.

Дискриминантный анализ

С помощью дискриминантного анализа исследуется два основных вопроса. Во-первых, речь идет о выявлении различий между группами объектов- носителей определенного признака. Во-вторых, дискриминантный анализ применяется для отнесения объектов с неопределенной до того групповой принадлежностью к определенной группе на базе значения их характеристик. Как и в случае регрессионного анализа, упор делается на объяснение и прогноз, однако зависимая переменная имеет номинальный характер. В простейшем случае изучается 2 группы и 2 независимых характеристики. С методической точки зрения цель анализа заключается в построении дискриминантной функции y= b1x1+b2x2, которая наилучшим образом разделяет группы А и Б. По формальному построению дискриминантная функция во многом соответствует функции многомерной регрессии, отсутствует лишь константа.




Поделиться с друзьями:


Дата добавления: 2014-12-29; Просмотров: 401; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.