Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Статистическая обработка данных обычно начи­нается с вычисления основных характеристик распределения изучаемых показателей. Прежде всего, это одно­мерные частотные распределения

Для номинальных порядковых и дискретных ко­личественных признаков они показывают распространен­ность объектов с различными значениями; для непрерыв­ных количественных признаков, которые должны быть предварительно сгруппированы в интервалы, - число или долю объектов, попавших в каждый интервал. Частотные распределения могут быть представлены визуально в виде всевозможных графиков и диаграмм.

Для количественных признаков вычисляют харак­теристики распределения, называемые описательными статистиками, - минимальное, максимальное, среднее арифметическое значения, дисперсию, границы процентилей (интервалов, содержащих определенное число на­блюдений), коэффициент асимметрии и другие. Эти ве­личины позволяют описать распределение более сжато.

При необходимости сопоставить распределение признака для разных групп респондентов. Одномерные распределения по каждой группе (которые в этом случае удобнее представлять в относительных частотах - долях или процентах) могут быть сведены в одну компактную таблицу (Рис. 11).

 

 

Считаете ли Вы себя верующим? Пол
мужской женский
Нет 36.7 % 15.7%
Отчасти 34.7 % 54.1 %
Да 28.6 % 30.2%
Всего 100.0 % 100.0 %

Рис. 11. Распределение ответов студентов мужского и женско­го пола на вопрос об отношении к вере.

 

Такие таблицы не следует путать с таблицами со­пряженности, которые предназначены для исследования связи между признаками, и представляют их совместное распределение (Рис. 12).

 

Образование родителей Образование детей Всего
    ПТУ общее среднее среднее спец. выс­шее    
Неполное Среднее 127 23.5 31.2 153 28.3 92 17.0 540 100.0
Общее Среднее 36 14.2 76 29.9 71 28.0 71 28.0 254 100.0
Среднее Спец. 25 8.5 62 21.1 84 28.6 123 41.8 294 100.0
Высшее 5 3.0 23 13.8 24 14.5 114 68.7 166 100.0
Всего 193 15.4 329 26.2 332 26.5 400 31.9 1254 100.0

 

Рис. 12. Распределение респондентов лонгитюдного проекта "Пути поколения" и их родителей по уровню образования.

 

Проверка гипотезы о статистической связи между признаками, представленными в таблице сопряженно­сти, чаще всего осуществляется по критерию "хи-квадрат"; для измерения тесноты связи применяются раз­личные коэффициенты, выбор которых зависит от ха­рактера таблицы.

Наиболее простые двумерные таблицы сопряжен­ности очень популярны среди социологов благодаря сво­ей простоте, наглядности и универсальности. Это един­ственный метод анализа связей, который может приме­няться при любых уровнях измерения признаков.

Для изучения линейных парных связей между ко­личественными показателями используется корреляцион­ный анализ. Линейность связи означает, что значения одного признака изменяются (уменьшаются или уве­личиваются) в среднем пропорционально увеличению значений другого, при этом корреляция двух перемен­ных не предполагает объяснения изменений одной пере­менной изменениями другой, т.е. причинно-следствен­ного характера связи между ними. Чаще всего корреля­ция является следствием воздействия каких-то более глубоких (и не всегда наблюдаемых) причин на оба по­казателя.

В тех случаях, когда связь между переменными имеет нелинейный характер, а также для порядковых переменных, применяются коэффициенты ранговой корре­ляции.

Для описания структуры связей в некоторой сис­теме показателей применяется матрица корреляций - квадратная таблица, в каждой клетке которой помещают коэффициент корреляции для пары переменных (Рис. 13). Изучая ее, можно выделить блоки показателей, более тесно связанных друг с другом, чем с другими по­казателями этой же системы.

Рис. 13. Матрица корреляций (данные республиканского лонгитюдного проекта Пути поколения").

 

  Y X1 Х2 Х3 Х4 Х5 Х6
Y 1.00 0.15 0.30 0.19 0.23 0.24 0.21
X1 0.15 1.00 0.34 0.32 0.29 0.30 0.42
Х2 0.30 0.34 1.00 0.39 0.45 0.67 0.35
Х3 0.19 0.32 0.39 1.00 0.35 0.41 0.30
Х4 0.23 0.29 0.45 0.35 1.00 0.52 0.26
Х5 0.24 0.30 0.67 0.41 0.52 1.00 0.33
Х6 0.21 0.42 0.35 0.30 0.26 0.33 1.00

Y - оценка удачности жизни в целом;

X1 - возможность иметь интересную работу;

Х2 - возможность приобретать ценные вещи;

Х3 - возможность жить по своему усмотрению;

Х4 - возможность хорошо питаться;

Х5 - возможность покупать модную одежду;

Х6 - возможность продвигаться.

Для того, чтобы проанализировать матрицу корре­ляций более строго, используют разведочный (эксплораторный) факторный или кластерный анализ. Выделен­ные блоки переменных в дальнейшем часто используют для построения интегральных показателей - индексов. В этом случае говорят о снижении размерности простран­ства признаков.

Кластерный анализ применяется также для описа­ния структуры объектов, составляющих выборку.

Необходимо помнить, что все результаты, получен­ные с помощью статистической обработки, относятся только к выборке. Для того, чтобы обобщить их на генеральную совокупность, необходимо обосновать репрезентативность выборки.

Статистический анализ социологических данных обычно применяется к исследованию причинных связей! между изучаемыми показателями или, точнее, к проверке гипотез о наличии и характере таких связей.

Для того, чтобы связь могла рассматриваться причинная, необходимо (но не достаточно), чтобы выполнялись три принципа причинности (каузальности): 1) причины (предикторы) должны во времени предшест­вовать следствию и с очевидностью порождать (инициировать) его наступление; 2) причины и следствие должны коррелировать друг с другом; 3) взаимосвязь причины и следствия должна быть изолирована от влияния третьих факторов, неучтенных в причинной модели, но способных породить корреляцию между ними.

Популярным примером нарушения третьего принципа причинности является зависимость ущерба, нане­сенного пожаром, от числа тушивших его пожарных. В этом примере как будто выполняются два первых прин­ципа: ущерб действительно коррелирует с числом заня­тых пожарных, и тушение пожара предшествует подсчету ущерба. Однако обнаруженная связь является артефак­том, который можно объяснить, например, зависимо­стью обоих показателей от третьего - масштаба пожара.

При решении практических задач легче всего проверяется второй принцип - коррелированности по­казателей.

Выполнение первого принципа в рамках одномо­ментного социологического исследования проверить до­вольно сложно. Поэтому наиболее популярными пре­дикторами являются атрибутивные и статусные перемен­ные, не нуждающиеся в такой проверке, - пол, раса, язык, общеобразовательный и должностной статус, тип населенного пункта и т.п. С целью обеспечить времен­ной "зазор" между измерением причины и следствия, иногда прибегают к ретроспективному исследованию жизненного пути - трудовой биографии, образовательно­го пути, истории семьи, - в котором можно зафиксиро­вать последовательность событий в жизни человека. Особую ценность для изучения причинных связей представля­ют панельные и лонгитюдные исследования, которые по­зволяют в качестве предикторов использовать любые пере­менные, измеренные на предыдущих этапах, например, влияние ценностных ориентации при окончании школы на последующую профессиональную карьеру.

Наиболее сложной задачей является обеспечение третьего принципа каузальности - изолированности изу­чаемой связи от влияния посторонних факторов. Для ее решения классическая статистика требовала, чтобы ги­потезы о причинных связях проверялись только на дан­ных, полученных в результате тщательно спланирован­ного эксперимента, в котором изолированность достига­лась за счет строгого соблюдения правил формирования групп.

В последние два десятилетия особое внимание уде­ляется методологии исследования причинных связей на данных описательных исследований, к которым относит­ся и большинство социологических. В рамках этого под­хода изолированность связи достигается за счет глубокой теоретической проработки системы гипотез, обес­печивающей возможно полный набор предикторов. В некоторых случаях контроль "внешних" факторов осу­ществляется через фиксацию определенных параметров выборки.

Выбор модели, адекватной проверяемой гипотезе и характеру имеющихся данных, является одним из кри­тических моментов исследования. Традиционно он опре­деляется уровнем измерения анализируемых показате­лей. Для количественных зависимых переменных обыч­но используется регрессионный (если независимые пере­менные также являются количественными) или диспер­сионный (если предикторы измерены по номинальным или порядковым шкалам) анализ. К качественным (но­минальным и порядковым) зависимым переменным в аналогичных ситуациях применяется дискриминантный или кластерный анализ с обучением.

Этот подход по-прежнему широко используется, однако развитие современных методов статистического анализа постепенно стирает его жесткие ограничения.

Появление множественного классификационного анализа и метода индикаторных переменных позволило и пользовать в любых моделях как количественные, так качественные предикторы. Это произвело настоящую революцию в анализе данных и привело к широкому распространению регрессионных и регрессионноподобных моделей.

Современные регрессионные техники обладают большой гибкостью и дают возможность использовать в моделях как количественные, так и качественные зависимые и независимые переменные. Структура связей между предикторами может быть учтена в моделях путево­го анализа. Наиболее общим является метод линейно-структурных уравнений, позволяющий строить сложные модели с большим числом взаимодействующих между собой зависимых и независимых переменных, среди ко­торых могут быть не только наблюдаемые, но и латентные признаки. Регрессивный, дисперсионный, путевой и конфирматорный (подтверждающий) факторный анализ является его частным случаем.

Выбор методов обработки и анализа информации; зависит от целей и задач исследования, а также от спо­собов измерения используемых показателей. Как прави­ло, при решении реальных задач не удается обойтись од­ним каким-либо методом, их применяют комплексно — последовательно на разных стадиях решения задачи или параллельно на одной и той же стадии для более глубо­кого анализа материала.

 

 

<== предыдущая лекция | следующая лекция ==>
Порядок виконання роботи | Административное устройство Internet
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 406; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.019 сек.