Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Содержательный контент-анализ




Определение контент-анализа

Тема 11. Контент-анализ

 

1. Определение контент-анализа.

2. Содержательный контент-анализ.

3. Структурный контент-анализ.

4. Что нужно учитывать при проведении контент-анализа.

 

 

 

Кроме исследований, построенных на различных видах опроса (см. тему 8), существуют неопросные методы исследования. Оказывается, многое можно узнать об индивидах, социальных группах и учреждениях, не опрашивая их напрямую в ходе интервью или анкетирования. К таким неопросным методам относится контент-анализ. Его можно определить как систематическая числовая обработка и оценка содержания и формы информационного источника [19].

Слово «контент-анализ» происходит от английского выражения «content-analysis», его можно перевести как анализ содержания. Контент-анализ может быть использован, если имеется какой-то материальный носитель информации. Примеры таких носителей: книги, журналы, газеты, фонограммы, аудио- и видеозаписи, фотографии, протоколы собраний, документы, фильмы, плакаты, карикатуры и лозунги, тексты речей, письма и дневники. Условно различаются содержательный и структурный контент-анализы.

Содержательный контент-анализ начинается с определения генеральной совокупности сообщений, которую предстоит изучать. Допустим, нас интересует освещение в газетах предвыборной кампании кандидатов в депутаты Законодательного собрания области. Тогда генеральной совокупностью будут все предвыборные газетные публикации относительно этих кандидатов определенного объема (допустим, два и более газетных столбца) в ежедневных газетах региона за определенный период времени. Или мы проводим мониторинг областных газет за неделю. В таком случае берутся все областные газеты за одну неделю.

После определения генеральной совокупности необходимо решить вопрос: исследовать всю совокупность либо ограничиться выборкой на основе простого случайного либо систематического случайного отбора. Например, можем анализировать газеты, выпущенные лишь по средам. Эту будет пример применения систематического случайного отбора. Но в этом случае в нашу выборку может как раз не попасть именно то, что нас интересует, если этот материал помещается, как правило, в пятничных номерах. Так что наилучшим способом определения выборки будет все-таки простой случайный отбор.

Далее необходимо принять решение о единице измерения, или единице анализа, это – минимальный элемент источника информации, на основе которого делаются обобщения. Простейшим элементом сообщения является слово или словесное выражение.

Допустим, мы хотим сравнить значимость проблемы развития малого бизнеса для двух кандидатов в депутаты – Петрова и Николаева. Мы можем взять все выступления кандидатов и подсчитать, сколько раз в них присутствует выражение «малый бизнес». Таким образом, метод состоит в определении ключевых слов в качестве единицы измерения и подсчете частоты их употребления в выступлениях.

Однако здесь необходимо решить две проблемы. Первая состоит в выборе способа стандартизации измерения. Пусть в своих выступлениях Петров использовал выражение «малый бизнес» 30 раз, а Николаев произнес это выражение 40 раз. И получается вроде бы, что Николаев в 1,33 раза (40: 30) больше озабочен проблемой малого бизнеса, чем Петров.

Но если мы стандартизируем меру, и возьмем в качестве показателя количество ключевых слов на каждые 1000 слов в выступлениях, то получится иная картина. За все выступления Петров употребил 20 000 слов, и стандартизированный показатель у Петрова составит примерно 1,5 (30: 20 000 х 1000). Николаев в своих выступлениях употребил 56 000 слов, и его показатель будет равен соответственно 0,7 (40: 56 000 х 1000). Получается, что теперь Петров в 2,1 раза (1,5: 0,7) больше озабочен проблемами малого бизнеса.

Но мы можем взять в качестве показателя количество выражений «малый бизнес» на каждые 100 строк в выступлениях. Пусть у кандидата Петрова все выступления составляют 1800 строк, тогда стандартизированный показатель окажется равным 1,67 (30: 1800 х 100). Николаев в своих выступлениях употребил 4800 строк и его показатель будет равен 0,83 (40: 4800 х 100). Получается, что Петров снова примерно в 2 раза (1,67: 0,83) больше озабочен проблемами малого бизнеса.

Но мы можем взять количество выражений «малый бизнес» в среднем в течение одного выступления. Пусть у Петрова будет 28 выступлений, а у Николаева всего 18 выступлений. Тогда соответствующий показатель у Петрова будет 1,07 (30: 28). А у Николаева показатель будет равен 2,2 (40: 18). Таким образом, окажется, что уже Николаев в своих выступлениях в 2 раза (2,2: 1,07) чаще употреблял ключевое слово, чем Петров (см. табл. 11.1).

Мы столкнулись с известной проблемой операционализации. Нужно определиться, что взять в качестве количественного показателя понятия «значимость проблемы малого бизнеса для данного кандидата». Мы видим, что в зависимости от способа операционализации результат будет различный, и надо выбирать, какой подход все же использовать. Тут нужно рассуждать следующим образом: наиболее близкие показатели получились при первом и втором способах стандартизации. Это означает, что именно эти показатели наиболее валидны. Остается выбрать из данных двух способов стандартизации наиболее дешевый и простой. Таким будет, очевидно, второй способ, потому что количество строк сосчитать проще, чем количество слов.

 

Таблица 11.1

Тема малого бизнеса в выступлениях кандидатов в депутаты

 

Кандидаты в депутаты Общее число выражений «малый бизнес» Способы стандартизации
Число выражений на каждые 1000 слов Число выражений на каждые 100 строк Число выражений на 1 выступление
Петров   1,5 1,67 1,07
Николаев   0,7 0,78 2,2
Коэффициент 1,33 (в пользу Николаева) 2,1 (в пользу Петрова) 2(в пользу Петрова) 2 (В пользу Николаева)

 

На практике делают так. Отбирают произвольным способом из заданной выборки примерно четверть материала, и на нем выясняют наиболее валидный и дешевый способ стандартизации. И затем этот способ используют для обработки всего массива выборки.

Итак, мы получили количественные показатели значимости проблемы малого бизнеса для данного кандидата. Эти показатели, как мы видим, можно сравнивать и определять, во сколько раз данный кандидат больше интересуется проблемой, чем другой кандидат.

Но возникает вторая проблема. Она состоит в необходимости учета контекста, в котором употребляется выражение «малый бизнес». Сравним фразы: «Я за то, чтобы помогать малому бизнесу, чтобы он становился все более массовым» и «О потакании так называемому малому бизнесу с его неизбежными нарушениями санитарных норм не может быть и речи». В обоих случаях используется ключевое выражение, но в разных контекстах, и смысл получается противоположный. Поэтому считать слова необходимо с учетом контекста.

Для учета контекста и избежания разночтений каждое упоминание должно быть прочитано не менее чем двумя членами исследовательской группы, причем оценки их должны быть согласованы. Таким образом, подсчитывается числовое соотношение позитивных, негативных и нейтральных упоминаний. Интересно то, что, оказывается, необязательно читать всю статью, чтобы определить характер контекста. Достаточно учесть смысл нескольких слов до и после ключевого выражения. Это позволяет машинизировать определение контекста через автоматический поиск ключевого выражения и прибавления к нему этих нескольких слов до и после.

Допустим, что у Петрова из всех 30 случаев употребления выражений «малый бизнес» 10 случаев даны в отрицательном контексте. Тогда показатель положительного или хотя бы нейтрального контекста будет равен 1,1 ((30 – 10): 1800 х 100). Мы тут выбрали второй способ операционализации: учет количества применения ключевого слова на 100 строк. Николаев из всех 40 случаев употребления выражений «малый бизнес» 15 случаев дает в отрицательном контексте. Тогда показатель положительного или хотя бы нейтрального контекста будет равен 0,52 ((40 – 15): 4800 х 100). Соотношение положительных показателей будет равно 2,1 (1,1: 0,52). Можно сделать вывод, что отношение к малому бизнесу Петрова является в 2,1 раза более положительным, чем у Николаева.

Очевидно, что любой внимательный читатель выступлений обоих кандидатов уже на уровне интуиции поймет, что для Петрова тема малого бизнеса более значима, чем для Николаева, и что Петров более положительно относится к данной теме, чем Николаев. Но мы, проведя контент-анализ, получили количественные выражения того, как относятся тот и другой кандидат к проблеме малого бизнеса. Мы выяснили, что не просто более значима и более положительно, но во сколько раз более значима и более положительно. Это является особенно важным, когда сравниваются несколько фигур или проблем, и здесь интуиция уже точно не поможет.

Возможны другие способы применения контент-анализа. Допустим, мы исследуем газетные статьи, посвященные реформе местного самоуправления. Здесь применим так называемый метод «снежного кома»[20].

Рассматривая отдельную статью, мы обнаруживаем, что в ней можно выделить две темы: изложение общей сути реформы и критику реформы в том виде, в каком она предлагается.

Мы объединяем все фрагменты статьи, которые относятся к первой теме, и все фрагменты, которые относятся ко второй теме. Получаем два отдельных текста. Помещаем их в два разных файла. Это несложно сделать, если уже проведена работа по переносу всех газетных статей в компьютер в электронном виде.

Таким же образом анализируем вторую статью. Обнаруживаем, что в ней рассматриваются тоже две темы, но теперь речь идет об общей сути реформы и проблемах, с которыми скорее всего столкнется ее реализация. Мы объединяем фрагменты статьи, которые относятся к первой теме, и переносим их в файл с фрагментами первой статьи по данной же проблеме. И так же объединяем в отдельный, уже третий, файл все фрагменты, которые относятся к третьей теме.

Таким образом, из обеих статей мы разнесли по разным файлам тексты по трем темам в проблеме реформы местного самоуправления: общая суть реформы, критика реформы и проблемы ее реализации.

Аналогичным образом разделяем другие статьи на фрагменты, соответствующие разным темам, переносим эти фрагменты в соответствующие файлы. А далее определяем объем текстов в каждом файле через количество знаков с пробелами. Изобразим ход дела в виде табл. 11.2.

Здесь строчные латинские буквы с индексами указывают объем части статьи, посвященной данной теме.

В крайней правой колонке мы записываем суммарные объемы всех тем, эти объемы в таблице обозначены буквами Sai, Sbi, Sci, Sdi. Буквой N обозначим общий объем всех рассмотренных статей на тему о местном самоуправлении.

 

Таблица 11.2

 

Распределение тем по проблеме местного самоуправления в СМИ

 

Темы Статья 1 Статья 2 Статья 3 Статья 4 Всего
Общая суть реформы a 1 a 2 a 4 Sa i
Критика реформы b 1 b 3 b 4 Sb i
Проблемы реформы c 2 c 3 Sc i
Финансовая суть реформы d 4 Sd i
Всего a 1+ b 1 a 2+ c 2 b 3+ c 3 a 4+ b 4+ d 4 N

 

Теперь, деля по отдельности объемы Sai, Sbi, Sci, Sdi на общий объем N, мы получаем удельный вес каждой темы в общем массиве статей. Эти веса можно выразить в процентах. После этого мы можем проранжировать темы по их удельному весу в общем массиве публикаций, посвященных реформе местного самоуправления.

В изложении данного метода мы опирались на пример конкретного исследования по проблеме местного самоуправления. Покажем реальное соотношение объема тем, которое получилось при анализе статей, помещенных в газетах федерального уровня (табл. 11.3).

 

Таблица 11.3

Распределение тем по проблеме местного самоуправления

 

Место Темы Удельный вес темы, в %
  Проблемный аспект  
  Критика 24,5
  Финансовая суть реформы 21,5
  Изложение общей сути реформы  

 

Мы можем сделать вывод, что в прессе главное внимание при обсуждении реформы местного самоуправление было уделено ее проблемным аспектам и критике, которые вместе заняли 63,5% от общего объема всех анализируемых статей[21].

Возможно применение иных единиц при контент-анализе. Например, мы можем за единицу измерения взять статью или книгу, и определить процент книг и статей, пропагандирующих европейские ценности, среди всех книг и статей, опубликованных в России в течение определенного года. И соотнести его с процентом, изданных за этот же период книг и статей, в которых подчеркивается особый путь России.

Если мы сопоставим такого рода данные за несколько лет, то перед нами проступит некая тенденция, отражающая сдвиг в понимании места России в мире.




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 4091; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.033 сек.