КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Статистическая обработка данных обычно начинается с вычисления основных характеристик распределения изучаемых показателей. Прежде всего, это одномерные частотные распределения
Для номинальных порядковых и дискретных количественных признаков они показывают распространенность объектов с различными значениями; для непрерывных количественных признаков, которые должны быть предварительно сгруппированы в интервалы, - число или долю объектов, попавших в каждый интервал. Частотные распределения могут быть представлены визуально в виде всевозможных графиков и диаграмм. Для количественных признаков вычисляют характеристики распределения, называемые описательными статистиками, - минимальное, максимальное, среднее арифметическое значения, дисперсию, границы процентилей (интервалов, содержащих определенное число наблюдений), коэффициент асимметрии и другие. Эти величины позволяют описать распределение более сжато. При необходимости сопоставить распределение признака для разных групп респондентов. Одномерные распределения по каждой группе (которые в этом случае удобнее представлять в относительных частотах - долях или процентах) могут быть сведены в одну компактную таблицу (Рис. 11).
Рис. 11. Распределение ответов студентов мужского и женского пола на вопрос об отношении к вере.
Такие таблицы не следует путать с таблицами сопряженности, которые предназначены для исследования связи между признаками, и представляют их совместное распределение (Рис. 12).
Рис. 12. Распределение респондентов лонгитюдного проекта "Пути поколения" и их родителей по уровню образования.
Проверка гипотезы о статистической связи между признаками, представленными в таблице сопряженности, чаще всего осуществляется по критерию "хи-квадрат"; для измерения тесноты связи применяются различные коэффициенты, выбор которых зависит от характера таблицы. Наиболее простые двумерные таблицы сопряженности очень популярны среди социологов благодаря своей простоте, наглядности и универсальности. Это единственный метод анализа связей, который может применяться при любых уровнях измерения признаков. Для изучения линейных парных связей между количественными показателями используется корреляционный анализ. Линейность связи означает, что значения одного признака изменяются (уменьшаются или увеличиваются) в среднем пропорционально увеличению значений другого, при этом корреляция двух переменных не предполагает объяснения изменений одной переменной изменениями другой, т.е. причинно-следственного характера связи между ними. Чаще всего корреляция является следствием воздействия каких-то более глубоких (и не всегда наблюдаемых) причин на оба показателя. В тех случаях, когда связь между переменными имеет нелинейный характер, а также для порядковых переменных, применяются коэффициенты ранговой корреляции. Для описания структуры связей в некоторой системе показателей применяется матрица корреляций - квадратная таблица, в каждой клетке которой помещают коэффициент корреляции для пары переменных (Рис. 13). Изучая ее, можно выделить блоки показателей, более тесно связанных друг с другом, чем с другими показателями этой же системы.
Рис. 13. Матрица корреляций (данные республиканского лонгитюдного проекта Пути поколения").
Y - оценка удачности жизни в целом; X1 - возможность иметь интересную работу; Х2 - возможность приобретать ценные вещи; Х3 - возможность жить по своему усмотрению; Х4 - возможность хорошо питаться; Х5 - возможность покупать модную одежду; Х6 - возможность продвигаться. Для того, чтобы проанализировать матрицу корреляций более строго, используют разведочный (эксплораторный) факторный или кластерный анализ. Выделенные блоки переменных в дальнейшем часто используют для построения интегральных показателей - индексов. В этом случае говорят о снижении размерности пространства признаков. Кластерный анализ применяется также для описания структуры объектов, составляющих выборку. Необходимо помнить, что все результаты, полученные с помощью статистической обработки, относятся только к выборке. Для того, чтобы обобщить их на генеральную совокупность, необходимо обосновать репрезентативность выборки. Статистический анализ социологических данных обычно применяется к исследованию причинных связей! между изучаемыми показателями или, точнее, к проверке гипотез о наличии и характере таких связей. Для того, чтобы связь могла рассматриваться причинная, необходимо (но не достаточно), чтобы выполнялись три принципа причинности (каузальности): 1) причины (предикторы) должны во времени предшествовать следствию и с очевидностью порождать (инициировать) его наступление; 2) причины и следствие должны коррелировать друг с другом; 3) взаимосвязь причины и следствия должна быть изолирована от влияния третьих факторов, неучтенных в причинной модели, но способных породить корреляцию между ними. Популярным примером нарушения третьего принципа причинности является зависимость ущерба, нанесенного пожаром, от числа тушивших его пожарных. В этом примере как будто выполняются два первых принципа: ущерб действительно коррелирует с числом занятых пожарных, и тушение пожара предшествует подсчету ущерба. Однако обнаруженная связь является артефактом, который можно объяснить, например, зависимостью обоих показателей от третьего - масштаба пожара.
При решении практических задач легче всего проверяется второй принцип - коррелированности показателей. Выполнение первого принципа в рамках одномоментного социологического исследования проверить довольно сложно. Поэтому наиболее популярными предикторами являются атрибутивные и статусные переменные, не нуждающиеся в такой проверке, - пол, раса, язык, общеобразовательный и должностной статус, тип населенного пункта и т.п. С целью обеспечить временной "зазор" между измерением причины и следствия, иногда прибегают к ретроспективному исследованию жизненного пути - трудовой биографии, образовательного пути, истории семьи, - в котором можно зафиксировать последовательность событий в жизни человека. Особую ценность для изучения причинных связей представляют панельные и лонгитюдные исследования, которые позволяют в качестве предикторов использовать любые переменные, измеренные на предыдущих этапах, например, влияние ценностных ориентации при окончании школы на последующую профессиональную карьеру. Наиболее сложной задачей является обеспечение третьего принципа каузальности - изолированности изучаемой связи от влияния посторонних факторов. Для ее решения классическая статистика требовала, чтобы гипотезы о причинных связях проверялись только на данных, полученных в результате тщательно спланированного эксперимента, в котором изолированность достигалась за счет строгого соблюдения правил формирования групп. В последние два десятилетия особое внимание уделяется методологии исследования причинных связей на данных описательных исследований, к которым относится и большинство социологических. В рамках этого подхода изолированность связи достигается за счет глубокой теоретической проработки системы гипотез, обеспечивающей возможно полный набор предикторов. В некоторых случаях контроль "внешних" факторов осуществляется через фиксацию определенных параметров выборки.
Выбор модели, адекватной проверяемой гипотезе и характеру имеющихся данных, является одним из критических моментов исследования. Традиционно он определяется уровнем измерения анализируемых показателей. Для количественных зависимых переменных обычно используется регрессионный (если независимые переменные также являются количественными) или дисперсионный (если предикторы измерены по номинальным или порядковым шкалам) анализ. К качественным (номинальным и порядковым) зависимым переменным в аналогичных ситуациях применяется дискриминантный или кластерный анализ с обучением. Этот подход по-прежнему широко используется, однако развитие современных методов статистического анализа постепенно стирает его жесткие ограничения. Появление множественного классификационного анализа и метода индикаторных переменных позволило и пользовать в любых моделях как количественные, так качественные предикторы. Это произвело настоящую революцию в анализе данных и привело к широкому распространению регрессионных и регрессионноподобных моделей. Современные регрессионные техники обладают большой гибкостью и дают возможность использовать в моделях как количественные, так и качественные зависимые и независимые переменные. Структура связей между предикторами может быть учтена в моделях путевого анализа. Наиболее общим является метод линейно-структурных уравнений, позволяющий строить сложные модели с большим числом взаимодействующих между собой зависимых и независимых переменных, среди которых могут быть не только наблюдаемые, но и латентные признаки. Регрессивный, дисперсионный, путевой и конфирматорный (подтверждающий) факторный анализ является его частным случаем. Выбор методов обработки и анализа информации; зависит от целей и задач исследования, а также от способов измерения используемых показателей. Как правило, при решении реальных задач не удается обойтись одним каким-либо методом, их применяют комплексно — последовательно на разных стадиях решения задачи или параллельно на одной и той же стадии для более глубокого анализа материала.
Дата добавления: 2014-01-15; Просмотров: 406; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |