Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лабораторная работа №5. Частотный анализ поэтических текстов по всем буквам 2 страница




Таблица 4 иллюстрирует значения предельных частот для каждой из букв русского алфавита.

Оказалось, что существуют такие поэтические тексты Н. Рубцова, в которых отсутствуют некоторые буквы алфавита. Это тексты, для которых Pmin=0. В данном случае к указанным буквам относятся следующие: ё, ф, х, ц, ш, щ, ъ, э, ю (см. таблицу 4). Кроме того, можно выделить буквы, для которых имеет место закон устойчивости частот.

 

Таблица 4

Буква Экстремальные Буква Экстремальные
  частоты   частоты
  Pmax Pmin   Pmax Pmin
а 0,1015 0,0374 п 0,0528 0,0081
б 0,0406 0,0027 р 0,0651 0,0222
в 0,0683 0,0028 с 0,1022 0,0232
г 0,1922 0,0019 т 0,3036 0,0051
д 0,0612 0,0134 у 0,0665 0,0044
е 0,1187 0,0055 ф 0,0193  
ё 0,2026   х 0,0355  
ж 0,0364 0,0014 ц 0,0137  
з 0,0347 0,0022 ч 0,0324 0,0029
и 0,1005 0,0246 ш 0,0167  
й 0,0445 0,0051 щ 0,0156  
к 0,0583 0,0156 ь 0,0459 0,0019
л 0,2265 0,0189 ы 0,242 0,0022
м 0,0765 0,0134 ъ 0,0036  
н 0,1228 0,0338 э 0,0075  
о 0,1833 0,0363 ю 0,0324  
      я 0,0351 0,0056

 

К таким буквам следует отнести только те, у которых предельные частоты различаются в одном и том же числовом знаке после запятой. Данные таблицы 6 позволяют к указанным буквам отнести следующие: д, к, м, р.

Для этих согласных характер изменения частот в зависимости от номера N текста иллюстрирует таблица 5. Заметим, что нумерация текстов Н. Рубцова в таблице 5 совпадает с их нумерацией в таблице 2. Построим гистограммы распределения частот для букв д, к, м, р.

Таблица 5

N номер текста частота появления букв N номер текста частота появления букв
  д к м р   0,0176 0,0463 0,0441 0,0529
  0,036 0,036 0,0249 0,0305   0,0334 0,039 0,0251 0,0418
  0,0305 0,0446 0,054 0,0563   0,0173 0,0259 0,0331 0,0317
  0,0286 0,0161 0,0321 0,0411   0,0612 0,0252 0,0432 0,036
  0,0221 0,0363 0,0315 0,0599   0,0383 0,0355 0,0164 0,0464
  0,0409 0,0498 0,0396 0,0434   0,0311 0,0342 0,0404 0,0559
  0,0341 0,0409 0,0221 0,0443   0,0237 0,0379 0,0355 0,0355
  0,0327 0,0245 0,0436 0,0381   0,0287 0,0161 0,0323 0,0412
  0,037 0,0398 0,0299 0,0441   0,0513 0,0493 0,0287 0,037
  0,035 0,0337 0,0391 0,0445   0,0562 0,0545 0,0221 0,0511
  0,031 0,0487 0,0398 0,0413   0,0254 0,0226 0,0565 0,0367
  0,024 0,0377 0,0171 0,0651   0,0289 0,0578 0,0193 0,0385
  0,0278 0,0298 0,0575 0,0496   0,0338 0,0451 0,0489 0,0602
  0,0202 0,0567 0,0324 0,0445   0,0282 0,0465 0,0183 0,0548
  0,0357 0,0204 0,0765 0,051   0,0134 0,0403 0,0134 0,0345
  0,0377 0,0493 0,0464 0,0493   0,0447 0,0404 0,0383 0,0404
  0,0363 0,0391 0,0503 0,0475   0,0192 0,0282 0,0282 0,0435
  0,0144 0,0542 0,0361 0,0469   0,0453 0,0283 0,034 0,0482
  0,0316 0,0281 0,0175 0,0632   0,0417 0,0583 0,0222 0,0222
  0,0338 0,0286 0,0338 0,0571   0,0263 0,0286 0,031 0,0597
  0,0297 0,027 0,0514 0,0432   0,0399 0,0156 0,0676 0,0433
  0,0266 0,0241 0,0254 0,0609   0,0502 0,027 0,027 0,0425
  0,0349 0,0349 0,0407 0,064   0,0354 0,0314 0,0511 0,0413

 

 

35. Выбор активного листа.

Параметры: - лист: «Лист3». Результат выполнения представлен на рисунке 37. Рис. 37.

 

36. Занесение заголовка в ячейку.

Параметры: - ячейка: A1; - данные: «Номер текста».

Результат выполнения частично представлен на рисунке 38. Рис. 38.

 

37. Объединение ячеек.

Параметры:: - диапазон: «B1÷E1». - данные: «Частота появления букв». Результат выполнения частично представлен на рисунке 39. Рис. 39.

 

38. Занесение заголовка в ячейку.

Параметры: - ячейка: B1; - данные: «Частота появления букв». Результат выполнения частично представлен на рисунке 40. Рис. 40.

 

39. Автозаполнение - нумерация.

Параметры: - ячейка 1: « A3 »;

- ячейка 2: « A4 »; - конечная ячейка: «A47»; - данные 1: «1»; - данные 2: «2»; Результат выполнения частично представлен на рисунке 41. Рис. 41.

 

40. Занесение заголовка в ячейку.

Параметры: - ячейка: B2; - данные: «д». Результат выполнения частично представлен на рисунке 42. Рис. 42.

41. Занесение заголовка в ячейку.

Параметры: - ячейка: C2; - данные: «к». Результат выполнения частично представлен на рисунке 43. Рис. 43.

 

42. Занесение заголовка в ячейку.

Параметры: - ячейка: D2; - данные: «м». Результат выполнения частично представлен на рисунке 44. Рис. 44.

 

43. Занесение заголовка в ячейку.

Параметры: - ячейка: E2; - данные: «р». Результат выполнения частично представлен на рисунке 45. Рис. 45.

 

44. Занесение десятичных дробей в диапазон ячеек.

Параметры: - диапазон ячеек: B3¸B47; - данные: «Таблица 7.Столбец “д”».

 

45. Занесение десятичных дробей в диапазон ячеек.

Параметры: - диапазон ячеек: C3¸C47; - данные: «Таблица 7.Столбец “к”».

 

46. Занесение десятичных дробей в диапазон ячеек.

Параметры: - диапазон ячеек: D3¸D47; - данные: «Таблица 7.Столбец “м”».

 

47. Занесение десятичных дробей в диапазон ячеек.

Параметры: - диапазон ячеек: E3¸E47; - данные: «Таблица 7.Столбец “р”».

Результат выполнения пунктов 44-47 частично представлен на рисунке 46.

Рис. 46.

48. Активизация диапазона ячеек.

Параметры: - диапазон: «A2÷B47». Результат выполнения частично представлен на рисунке 47. Рис. 47.

49. Копирование в буфер обмена.

Параметры: - ячейка-источник: «A2÷B47»; - ячейка-цель: « F1 ». Результат выполнения представлен на рисунке 48. Рис. 48.

 

50. Сортировка данных.

Параметры: - диапазон: «G1÷G46»; - тип: « по возрастанию »; - сортировка: « д ». Результат выполнения частично представлен на рисунке 49.

Рис. 49.

 

51. Построение диаграммы.

Параметры: - диапазон данных: « G2÷G46 »; - диапазон подписей: « F2÷F46 »; - тип: « гистограмма »; - вид: « обычная гистограмма »; - название оси Х: « x »; - название оси Y: « P5 »; - размещение: «в отдельном листе ». Результат выполнения представлен на рисунке 50.

Рис. 50. Закон распределения буквы «д» в порядке возрастания частоты.

 

52. Активизация ячейки.

Параметры: - ячейка: «G2 Результат выполнения частично представлен на рисунке 51. Рис. 51.

53. Копирование в буфер обмена.

Параметры: - ячейка-источник: «G2»; - ячейка-цель: « H2 ». Результат выполнения представлен на рисунке 52. Рис. 52.

 

54. Активизация ячейки.

Параметры: - ячейка: «G46» Результат выполнения частично представлен на рисунке 53. Рис. 53.

55. Копирование в буфер обмена.

Параметры: - ячейка-источник: «G46»; - ячейка-цель: « H3 ». Результат выполнения представлен на рисунке 54. Рис. 54.

Аналогичным образом необходимо последовательно скопировать наименьшие и наибольшие значения частот появления буквы «д». Вставлять скопированные значения следует в ячейки с H4 по H47. Результат выполнения частично представлен на рисунке 55.

Рис. 55

56. Построение диаграммы.

Параметры: - диапазон данных: « H2÷H46 »; - диапазон подписей: « F2÷F46 »; - тип: « гистограмма »; - вид: « обычная гистограмма »; - название оси Х: « x »; - название оси Y: « P5 »; - размещение: «в отдельном листе ». Результат выполнения представлен на рисунке 56.

Рис. 56. Закон устойчивости частот для буквы «д» (Р5).

 

Аналогичным образом, указанным в пунктах 48-56, следует построить диаграммы, иллюстрирующие закон устойчивости частот для букв «к», «м» и «р». Результаты выполнения представлены на рисунках 57-62.

 

Рис. 57. Закон распределения буквы «к» в порядке возрастания частоты.

 

Рис. 58. Закон устойчивости частот для буквы «к» (Р12).

 

 

Рис. 59. Закон распределения буквы «м» в порядке возрастания частоты.

Рис. 60. Закон устойчивости частот для буквы «м» (Р14).

Рис. 61. Закон распределения буквы «р» в порядке возрастания частоты.

Рис. 62. Закон устойчивости частот для буквы «р» (Р18).

 

На гистограммах, представленных на рисунках 50, 56, 57 - 62 по оси абсцисс отложен номер текста, который может и не совпадать с номером того же текста в таблице 2; а по оси ординат дается значение частоты появления данной буквы в стихотворении, рассматриваемого номера. При построении указанных гистограмм тексты перенумерованы так, что поведение частот носит колебательный характер, а с ростом номера частоты появления букв стремятся к средним частотам равным

(5).

Значения средних частот, рассчитанных по (5) предоставляются таблицей 6.

Таблица 6

Буква Pmax Pmin
д 0,061 0,013 0,048
к 0,058 0,016 0,043
м 0,077 0,013 0,063
р 0,065 0,022 0,043


Представленные таким образом колебательные поведения частот являются графической формой представления закона устойчивости частот.

Таблица 7
Буква Число текстов n Частота
ъ ф э   0,8899 0,8000 0,4444
щ ц ю   0,4444 0,3333 0,1778
ё х   0,0889 0,0222

Вполне очевидно, что закон устойчивости частот для букв, указанных в таблицах 5 и 6, определяет индивидуальность поэтических произведений Н. Рубцова. Он как бы определяет набор словесного материала, который инвариантен для всех произведений рассматриваемого поэта.

Уже отмечалось, что среди рассматриваемых текстов (табл. 2) были и такие, в которых некоторые буквы не встречаются вообще. В таблице 7 приводятся эти буквы и число n текстов, в которых они не встречаются. Так как всего рассмотрено сорок пять текстов Н. Рубцова, то по формуле

(6)

можно вычислить частоту появления текстов, в которых данные буквы отсутствуют. Результаты расчетов по (6) приведены в таблице 7.

Оказалось, что одной из редко встречающихся букв оказалась буква «ф» (см. табл. 7). За разъяснением этого обстоятельства обратимся к исследованиям выдающегося советского филолога Льва Васильевича Успенского (1900 – 1990). В его научно-занимательной книге [3] отмечается, что в поэтических произведениях Пушкина, Лермонтова, Крылова и других русских классиков буква «ф» почти не встречается. Обнаруживается и другое – каждое слово русского языка, в котором в начале, на конце или в середине пишется буква «ф», на поверку оказывается словом не исконно русским, а пришедшим к нам из других языков. По мнению Успенского, редкость буквы «ф» в русской литературе не случайность. Она – свидетельство глубокой народности, высокой чистоты русского языка у наших великих писателей.

Следовательно, указанная традиция великих русских классиков сохранена и в творчестве Н. Рубцова.

В настоящее время наметилась тенденция изучения поэтических текстов методами паралингвистики [3]. В этих исследованиях паралингвистические интонации, обнаруженные на основе частотного анализа буквосочетаний, обобщаются в модели эмоционально выразительных интонаций поэта.

Несомненно, что применение информационных технологий может активизировать исследования в паралингвистике.


 

Проект. Компьютерный анализ поэтических текстов конкретного автора (по выбору преподавателя)

 

 

Для выполнения проекта используются лабораторные работы №3,4,5.

 


 




Поделиться с друзьями:


Дата добавления: 2014-10-31; Просмотров: 387; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.069 сек.