Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проблемы машинной обработки информации




Здесь мы должны коснуться возможностей машинной обработки материалов способом контент-анализа. Из всех возможностей кон-тент-анализа, которые суммированы в группах I и II, ЭВМ можно поручить те задачи анализа текстов, когда в качестве единицы анализа выступает слово. Когда мы говорим, что речь идет о достаточно ограниченном наборе слов, мы имеем в виду ограниченность с точки зрения человеческого мышления. Память компьютера оперирует списком, состоящим из тысяч слов, но машинный анализ текста возможен, когда эти тысячи слов заложены в память ЭВМ. И тогда машина при обработке текстов занимается ни чем иным, как подсчитывает число материалов, в которых встречаются слова, интересующие исследователя. Подобные операции находят все большее применение, и предложениями провести такой анализ уже пестрят рекламные странички профессиональных журналов. Самое большее, чего можно ожидать от компьютера в плане усложнения задач, — выявление связки ключевых слов с близлежащими прилагательными, лексические цепочки. Иногда это вполне исчерпывающая задача для исследователя, и скорость считывания информации компьютером делает его незаменимым. Прибавим сюда возможности сканирования рукописного текста.

Более сложные случаи, когда речь идет о генерализации вывода, не обеспеченного симметричным рядом известных слов, пока неподвластны компьютеру. Другое дело, что экран компьютера может выступать в роли машинописного листа фиксации результатов, к которым приходит кодировщик. Но и тут существует соображение контроля за этим выводом. Думается, именно возможность контроля пока сдерживает применение компьютера в таком качестве.

Вспомним, как все это начиналось. Группа ученых Гарвардского университета в США (руководитель Ф. Стоун) в 1961 г. начала разработку принципов машинной обработки материала, проведя серию анализов самых различных текстов: газет, сочинений членов малых групп, программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партий США, документов личного характера (писем, дневников, автобиографий)'.

С самых первых попыток использования электронно-счетных устройств для работы с текстом становились ясными преимущества и не-

298 Часть III Социологические исследования звеньев коммуникативного процесса

достатки обработки текстового материала с помощью машин — они обеспечивали адекватность анализа огромных текстовых материалов, но требовали огромных усилий по составлению программы — собственно «словника», с учетом всех синонимических вариантов понятий, которые надо будет отыскивать в этом море пропускаемых через машину слов.

Авторы отлично понимали перспективы развития компьютерного дела — их размышления о том, что наборная клавиатура, связанная с компьютером, будет обычной принадлежностью школьного класса и делового офиса учителя, бухгалтера, психотерапевта, библиотекаря (ясно видно, что эти размышления относились к дореволюционной эпохе — до революции, связанной с изобретением персонального компьютера), звучат сегодня, как предвидение. Но для того чтобы выполнять все эти ожидаемые операции, нужно было, чтобы компьютер мог различать не только слова, но и смысл более пространных языковых единиц. Для этого нужно было решение проблемы синтаксического анализа. К сегодняшнему дню частично такие проблемы решены, коль скоро мы доверяем своему компьютеру — при наличии в нем специфических программ — проверку ошибок набранного текста.

С тех пор машинный метод обработки текстовых массивов все больше находит себе применение. Уже через десять лет после этого пионерского проекта Стоуна и его коллег практически повсеместно стали осуществляться проекты контент-аналитических исследований с применением ЭВМ.

Как ни странным это покажется на первый взгляд, именно пример с машинной обработкой текстов иллюстрирует очень важную для понимания сущности контент-анализа мысль. И в другом месте учебника эта мысль не прозвучала бы так явственно. Анализ содержания, как метод, не обладает магическими качествами — вы не получите из него больше, чем вложили. Если нечто значительное, важное, необычное не предусмотрено процедурой, то оно не появится в результате анализа, каким бы сложным и кропотливым он ни был.




Поделиться с друзьями:


Дата добавления: 2014-12-16; Просмотров: 357; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.