Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Введение. Перед тем, как перейти непосредственно к методике разработки экспертной системы, необходимо сказать несколько слов о контент-анализе




 

 

Перед тем, как перейти непосредственно к методике разработки экспертной системы, необходимо сказать несколько слов о контент-анализе.

Контент-анализ – количественный анализа текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей. Основная идея контент-анализа проста и интуитивно наглядна.

При восприятии текста и особенно больших текстовых потоков мы достаточно хорошо ощущаем, что разные формальные и содержательные компоненты представлены в них в разной степени, причем эта степень по крайней мере отчасти поддается измерению: ее мерой служит то место, которое они занимают в общем объеме, и/или частота их встречаемости.

Замысел контент-анализа заключается в том, чтобы систематизировать интуитивные ощущения, сделать их наглядными и проверяемыми и разработать методику целенаправленного сбора тех текстовых свидетельств, на которых эти ощущения основываются. При этом предполагается, что вооруженный такой методикой исследователь сможет не просто упорядочить свои ощущения и сделать свои выводы более обоснованными, но даже узнать из текста больше, чем хотел сказать его автор. Скажем, настойчивое повторение в тексте каких-то тем или употребление каких-то характерных формальных элементов или конструкций может не осознаваться автором, но обнаруживает и определенным образом интерпретируется исследователем - отсюда принадлежащее социологу А.Г.Здравомыслову полушутливое определение контент-анализа как «научно обоснованного метода чтения между строк».

Реально главной отличительной чертой контент-анализа является не его декларируемая во многих определениях «систематичность» и «объективность» (эти черты присущи и другим методам анализа текстов), а его квантитативный (количественный) характер. Контент-анализ – это прежде всего количественный метод, предполагающий числовую оценку каких-то компонентов текста, дополняющийся также различными качественными классификациями и выявлением тех или иных структурных закономерностей.

Поэтому наиболее удачным определением контент-анализа можно считать то, которое зафиксировано в относительно недавней книге Мангейма и Рича: контент-анализ – это систематическая числовая обработка, оценка и интерпретация формы и содержания информационного источника.

В качестве примера приведем стихотворение Анны Ахматовой «Мне голос был. Он звал утешно…»:

 

Когда в тоске самоубийства

Народ гостей немецких ждал,

И дух суровый византийства

От русской церкви отлетал,

 

Когда приневская столица,

Забыв величие своё,

Как опьяневшая блудница,

Не знала, кто берёт ее,-

 

Мне голос был. Он звал утешно,

Он говорил: "Иди сюда,

Оставь свой край, глухой и грешный,

Оставь Россию навсегда.

 

Я кровь от рук твоих отмою,

Из сердца выну черный стыд,

Я новым именем покрою

Боль поражений и обид".

 

Но равнодушно и спокойно

Руками я замкнула слух,

Чтоб этой речью недостойной

Не осквернился скорбный дух.

 

Стихотворение «Мен голос был. Он звал утешно…» было написано в 1917 году. Это произведение вошло в сборник стихов ''Белая гвардия'', в котором личные переживания Анны Ахматовой связаны с событиями войны и приближающейся революции. На смену интонациям живого разговора приходит ''одическая, пророчески-возвышенная'' манера письма, преобладают классические стихотворные размеры. В этот период в лирику Ахматовой включается ''пушкинский слой'', стихи насыщаются цитатами и образами пушкинской поэзии, а также других классических поэтов и знаменитых современников. Стиль Ахматовой соединил в себе традиции классики и новейший опыт русской поэзии.События современности всегда находили отклик в ахматовской лирике, в том числе и события политические. В стихах открыто говорится о неприятии революционных событий, одновременно с этим – о невозможности оставить Родину в дни испытаний.

Основная тема произведения: патриотизм, неприятие революции и духовный стоицизм, т.е. твердость и мужество героини. Главная любовь А. Ахматовой была любовь к родной земле:''…ложился в неё и становился ею, оттого и зовём так свободно своею''. Идея произведения в том, чтобы всегда быть со своей страной, не ''бросать её при первой же опасности'', а защищать и оставаться верной до конца. Автор использует такие эпитеты, как ''глухой и грешный'', ''черный стыд'', ''утешно, равнодушно и спокойно''. Благодаря этим средствам выразительности А. Ахматова показывает глубокий психологизм, искренние чувства горечи, печали, неприятия войны, насилия и противопоставления частной жизни.

Такой литературоведческий анализ несомненно содержит элемент субъективизма, и он также не позволяет дать необъективную сравнительную оценку этого стихотворения с произведениями других поэтов.

Покажем, что такие несубъективные оценки можно производить с помощью информационных измерений.

Известно, что впервые числовые оценки поэтического текста выполнялись известным русским математиком Марковым А.А. в начале ХХ столетия. Сущность этих оценок сводилась к следующему: из романа Пушкина А.С. «Евгений Онегин» составлялся список всех слов, например, на начальную букву «а», затем, исходя из этого списка, подсчитывалась вероятность появления всех букв русского алфавита на втором месте после буквы «а», далее на третьем месте и т.д. По такой же схеме анализировались списки слов на другие начальные буквы.

Вероятностный процесс появления букв алфавита в определенных позициях слова Марков А.А. назвал случайным процессом, начинающимся с некоторого начального состояния. В указанном случае начальное состояние – это список слов на начальную букву «а».

В настоящее время в теории массового обслуживания такие случайные процессы стали называться цепями Маркова.

Итак, нашей задачей является построение экспертной системы для оценки поэтических текстов А.А.Ахматовой. Для ее построения за основу возьмем исследования поэта Юрия Кузнецова.

Поэт Юрий Кузнецов в своем творчестве следовал традициям русской поэзии, в своих размышлениях о русской поэзии выделил в них 2 характерные темы:

1. любовная череда, начатая Пушкиным;

2. дорожная череда, начатая Лермонтовым.

Он выбрал следующие стихотворения:

 

Название Автор
1. «Я помню чудное мгновенье» Пушкин А.С.
2. «Средь шумного бала» Толстой Л.Н.
3. «К.Б.» Тютчев Ф.И.
4. «Сияла ночь» Фет А.А.
5. «Незнакомка» Блок А.А.
6. «За дорожной случайной беседой» Кузнецов Ю.Н.
7. «Выхожу один я на дорогу» Лермонтов М.Ю.
8. «Тройка» Некрасов Н.А.
9. «Накануне годовщины» Тютчев Ф.И.
10. «Осенняя воля» Блок А.А.
11. «Распутье» Кузнецов Ю.Н.

 

Для этих текстов были вычислены следующие показатели: Н1, Н2, ∆, S и λ1, λ2, λ3.

Энтропия поэтических текстов
Н1 Н2 ∆ = Н12 S λ1 λ2 λ3
1. 4,0163 4,4958 0,4795 4,8 3,1   92,1
2. 3,9922 4,5610 0,5688 4,3   99,6 89,6
3. 3,2041 4,3764 1,1724 4,4 3,1 89,8 90,9
4. 4,0219 4,5122 0,4903 4,0   97,6 92,2
5. 4,0503 4,5093 0,4590 5,1     91,1
6. 4,0407 4,4605 0,4197 4,6 3,6 91,4 93,5
7. 4,0871 4,5144 0,427 4,2 1,1   91,1
8. 3,9837 4,5853 0,601 5,1 3,7 90,6 90,5
9. 3,7151 4,3921 0,677 4,2 1,5   95,4
10. 4,0756 4,5543 0,479 4,8 1,1   94,4
11. 3,9345 4,3805 0,446 4,5 1,1   89,8

 

Были выделены эталонные показатели:

4 ≤ Н1 ≤ 4,1

0,4 ≤ ∆ ≤ 1,2

4 ≤ S ≤ 5,1

1 ≤ λ1 ≤ 3,7

90 ≤ λ2 ≤ 100

90 ≤ λ3 ≤ 96

Далее были отобраны стихотворения, подходящие под эталонные показатели:

Название Н1 Н2 ∆ = Н12 S λ1 λ2 λ3
1. «Я помню чудное мгновенье» Пушкин А.С. 4,0163 4,4958 0,4795 4,8 3,1   92,1
4. «Сияла ночь» Фет А.А. 4,0219 4,5122 0,4903 4,0   97,6 92,2
5. «Незнакомка» Блок А.А. 4,0503 4,5093 0,4590 5,1     91,1
7. «Выхожу один я на дорогу» Лермонтов М.Ю. 4,0871 4,5144 0,427 4,2 1,1   91,1
10. «Осенняя воля» Блок А.А. 4,0756 4,5543 0,479 4,8 1,1   94,4

 

 




Поделиться с друзьями:


Дата добавления: 2014-10-31; Просмотров: 470; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.