КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Лабораторная работа №5. Частотный анализ поэтических текстов по всем буквам 2 страница
Таблица 4 иллюстрирует значения предельных частот для каждой из букв русского алфавита. Оказалось, что существуют такие поэтические тексты Н. Рубцова, в которых отсутствуют некоторые буквы алфавита. Это тексты, для которых Pmin=0. В данном случае к указанным буквам относятся следующие: ё, ф, х, ц, ш, щ, ъ, э, ю (см. таблицу 4). Кроме того, можно выделить буквы, для которых имеет место закон устойчивости частот.
Таблица 4
К таким буквам следует отнести только те, у которых предельные частоты различаются в одном и том же числовом знаке после запятой. Данные таблицы 6 позволяют к указанным буквам отнести следующие: д, к, м, р. Для этих согласных характер изменения частот в зависимости от номера N текста иллюстрирует таблица 5. Заметим, что нумерация текстов Н. Рубцова в таблице 5 совпадает с их нумерацией в таблице 2. Построим гистограммы распределения частот для букв д, к, м, р. Таблица 5
35. Выбор активного листа. Параметры: - лист: «Лист3». Результат выполнения представлен на рисунке 37. Рис. 37.
36. Занесение заголовка в ячейку. Параметры: - ячейка: A1; - данные: «Номер текста». Результат выполнения частично представлен на рисунке 38. Рис. 38.
37. Объединение ячеек. Параметры:: - диапазон: «B1÷E1». - данные: «Частота появления букв». Результат выполнения частично представлен на рисунке 39. Рис. 39.
38. Занесение заголовка в ячейку. Параметры: - ячейка: B1; - данные: «Частота появления букв». Результат выполнения частично представлен на рисунке 40. Рис. 40.
39. Автозаполнение - нумерация. Параметры: - ячейка 1: « A3 »; - ячейка 2: « A4 »; - конечная ячейка: «A47»; - данные 1: «1»; - данные 2: «2»; Результат выполнения частично представлен на рисунке 41. Рис. 41.
40. Занесение заголовка в ячейку. Параметры: - ячейка: B2; - данные: «д». Результат выполнения частично представлен на рисунке 42. Рис. 42. 41. Занесение заголовка в ячейку. Параметры: - ячейка: C2; - данные: «к». Результат выполнения частично представлен на рисунке 43. Рис. 43.
42. Занесение заголовка в ячейку. Параметры: - ячейка: D2; - данные: «м». Результат выполнения частично представлен на рисунке 44. Рис. 44.
43. Занесение заголовка в ячейку. Параметры: - ячейка: E2; - данные: «р». Результат выполнения частично представлен на рисунке 45. Рис. 45.
44. Занесение десятичных дробей в диапазон ячеек. Параметры: - диапазон ячеек: B3¸B47; - данные: «Таблица 7.Столбец “д”».
45. Занесение десятичных дробей в диапазон ячеек. Параметры: - диапазон ячеек: C3¸C47; - данные: «Таблица 7.Столбец “к”».
46. Занесение десятичных дробей в диапазон ячеек. Параметры: - диапазон ячеек: D3¸D47; - данные: «Таблица 7.Столбец “м”».
47. Занесение десятичных дробей в диапазон ячеек. Параметры: - диапазон ячеек: E3¸E47; - данные: «Таблица 7.Столбец “р”». Результат выполнения пунктов 44-47 частично представлен на рисунке 46. Рис. 46. 48. Активизация диапазона ячеек. Параметры: - диапазон: «A2÷B47». Результат выполнения частично представлен на рисунке 47. Рис. 47. 49. Копирование в буфер обмена. Параметры: - ячейка-источник: «A2÷B47»; - ячейка-цель: « F1 ». Результат выполнения представлен на рисунке 48. Рис. 48.
50. Сортировка данных. Параметры: - диапазон: «G1÷G46»; - тип: « по возрастанию »; - сортировка: « д ». Результат выполнения частично представлен на рисунке 49. Рис. 49.
51. Построение диаграммы. Параметры: - диапазон данных: « G2÷G46 »; - диапазон подписей: « F2÷F46 »; - тип: « гистограмма »; - вид: « обычная гистограмма »; - название оси Х: « x »; - название оси Y: « P5 »; - размещение: «в отдельном листе ». Результат выполнения представлен на рисунке 50. Рис. 50. Закон распределения буквы «д» в порядке возрастания частоты.
52. Активизация ячейки. Параметры: - ячейка: «G2 Результат выполнения частично представлен на рисунке 51. Рис. 51. 53. Копирование в буфер обмена. Параметры: - ячейка-источник: «G2»; - ячейка-цель: « H2 ». Результат выполнения представлен на рисунке 52. Рис. 52.
54. Активизация ячейки. Параметры: - ячейка: «G46» Результат выполнения частично представлен на рисунке 53. Рис. 53. 55. Копирование в буфер обмена. Параметры: - ячейка-источник: «G46»; - ячейка-цель: « H3 ». Результат выполнения представлен на рисунке 54. Рис. 54. Аналогичным образом необходимо последовательно скопировать наименьшие и наибольшие значения частот появления буквы «д». Вставлять скопированные значения следует в ячейки с H4 по H47. Результат выполнения частично представлен на рисунке 55. Рис. 55 56. Построение диаграммы. Параметры: - диапазон данных: « H2÷H46 »; - диапазон подписей: « F2÷F46 »; - тип: « гистограмма »; - вид: « обычная гистограмма »; - название оси Х: « x »; - название оси Y: « P5 »; - размещение: «в отдельном листе ». Результат выполнения представлен на рисунке 56. Рис. 56. Закон устойчивости частот для буквы «д» (Р5).
Аналогичным образом, указанным в пунктах 48-56, следует построить диаграммы, иллюстрирующие закон устойчивости частот для букв «к», «м» и «р». Результаты выполнения представлены на рисунках 57-62.
Рис. 57. Закон распределения буквы «к» в порядке возрастания частоты.
Рис. 58. Закон устойчивости частот для буквы «к» (Р12).
Рис. 59. Закон распределения буквы «м» в порядке возрастания частоты. Рис. 60. Закон устойчивости частот для буквы «м» (Р14). Рис. 61. Закон распределения буквы «р» в порядке возрастания частоты. Рис. 62. Закон устойчивости частот для буквы «р» (Р18).
На гистограммах, представленных на рисунках 50, 56, 57 - 62 по оси абсцисс отложен номер текста, который может и не совпадать с номером того же текста в таблице 2; а по оси ординат дается значение частоты появления данной буквы в стихотворении, рассматриваемого номера. При построении указанных гистограмм тексты перенумерованы так, что поведение частот носит колебательный характер, а с ростом номера частоты появления букв стремятся к средним частотам равным (5). Значения средних частот, рассчитанных по (5) предоставляются таблицей 6. Таблица 6
Представленные таким образом колебательные поведения частот являются графической формой представления закона устойчивости частот.
Вполне очевидно, что закон устойчивости частот для букв, указанных в таблицах 5 и 6, определяет индивидуальность поэтических произведений Н. Рубцова. Он как бы определяет набор словесного материала, который инвариантен для всех произведений рассматриваемого поэта. Уже отмечалось, что среди рассматриваемых текстов (табл. 2) были и такие, в которых некоторые буквы не встречаются вообще. В таблице 7 приводятся эти буквы и число n текстов, в которых они не встречаются. Так как всего рассмотрено сорок пять текстов Н. Рубцова, то по формуле (6) можно вычислить частоту появления текстов, в которых данные буквы отсутствуют. Результаты расчетов по (6) приведены в таблице 7. Оказалось, что одной из редко встречающихся букв оказалась буква «ф» (см. табл. 7). За разъяснением этого обстоятельства обратимся к исследованиям выдающегося советского филолога Льва Васильевича Успенского (1900 – 1990). В его научно-занимательной книге [3] отмечается, что в поэтических произведениях Пушкина, Лермонтова, Крылова и других русских классиков буква «ф» почти не встречается. Обнаруживается и другое – каждое слово русского языка, в котором в начале, на конце или в середине пишется буква «ф», на поверку оказывается словом не исконно русским, а пришедшим к нам из других языков. По мнению Успенского, редкость буквы «ф» в русской литературе не случайность. Она – свидетельство глубокой народности, высокой чистоты русского языка у наших великих писателей. Следовательно, указанная традиция великих русских классиков сохранена и в творчестве Н. Рубцова. В настоящее время наметилась тенденция изучения поэтических текстов методами паралингвистики [3]. В этих исследованиях паралингвистические интонации, обнаруженные на основе частотного анализа буквосочетаний, обобщаются в модели эмоционально выразительных интонаций поэта. Несомненно, что применение информационных технологий может активизировать исследования в паралингвистике.
Проект. Компьютерный анализ поэтических текстов конкретного автора (по выбору преподавателя)
Для выполнения проекта используются лабораторные работы №3,4,5.
Дата добавления: 2014-10-31; Просмотров: 406; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |