Процесс речеобразования и звуки речи

Образование речи является одним из сложнейших психофизиологических процессов. В нём тесно переплетены уровни создания звуков, слов, фраз, передачи смысла. Внешней, акустической речи предшествует этап так называемой внутренней речи. Внутриречевая программа будущего высказывания складывается из «смысловых вех», то есть включает в себя отдельные, особенно важные для высказывания компоненты.

Речевой аппарат человека условно можно разделить на источник возбуждения звука - это органы дыхания и речевой тракт -это полости рта и носа. Подвижные органы речевого тракта называют артикуляционными органами (в основном это язык, губы, мягкое нёбо, нижняя челюсть).

Звуки речи возникают обычно на выдохе. Возбуждение звуков может быть тональным или шумовым.

В первом случае (тональном), создавая давление воздуха в лёгких и напрягая голосовые связки, мы вызываем колебательные движения этих связок. В результате в речевой тракт поступают импульсы воздуха, их частота зависит главным образом от перепада давления воздуха до и после гортани, от массы и размера голосовых связок, от степени их напряжения. Эта частота и определяет высоту тона голоса.

Во втором случае (шумовом) связки не напряжены, свободная струя воздуха, не встречая на пути препятствия, создаёт шум.

Выходной звук определяется характером возбуждения и конфигурацией речевого тракта.

При тональном возбуждении конфигурация речевого тракта представляет собой как бы набор резонансных полостей, при этом на выходе образуются сложные колебания, содержащие гармоники (обертоны) основного тона. Состав обертонов и определяет тот или иной гласный звук.

Если при тональном возбуждении в речевом тракте создано существенное сужение, то выходной сигнал будет содержать как гармоническую (тональную) компоненту, так и шумовую, что характеризует звонкие согласные (например - з, ж).

В случае шумового источника образуются глухие согласные (например - с, ш).

Особое место в образовании речи занимает динамика работы артикуляционных органов. Некоторые звуки могут быть произнесены при статическом положении речевого тракта, это так называемые протяжные звуки (например, а, о, с, х).

А звук ц, напримерхарактеризуется предварительным полным перекрытием речевого тракта и затем резким нарастанием шумовой составляющей. Этот звук невозможно тянуть или произносить медленно.

Важно также заметить, что в процессе речи речевой тракт находится в постоянной перестройке, что ведёт к значительному взаимному перекрытию отдельных звуков и отсутствию физически очевидных меж звуковых границ. Это составляет важную особенность речевого сигнала, которую необходимо учитывать как при распознавании, так и при синтезе речи.

Основной единицей звукового строя языка является фонема. Звуковой состав различных языков имеет свои особенности. В русском языке насчитывают (от 39 до 41 фонем в зависимости от школ фонетики).

Многие согласные буквы имеют два фонетических аналога: твёрдый и мягкий. Некоторые гласные буквы (дифтонги, в ряде публикаций их называют дифонами), напротив, не имеют фонетических аналогов, а отображаются двойными звуками (j + гласный, например, я = j+а, ю = j+у).

При изучении письменной речи мы постепенно осваиваем эти сложные соотношения между тем, что пишется, и что произносится (и слышится). С этой точки зрения фонетическая транскрипция «называет вещи своими именами», непосредственно указывая, что именно надо произносить, не прибегая к анализу звукового контекста и других факторов. Фонетический текст является основой при построении некоторых типов синтезаторов речи.

Чтобы показать соотношение фонетического содержания речи и письменного текста, сравним соответствующие описания фрагмента текста.

Орфографическая форма:

«В одной из отдалённых улиц Москвы, в сером доме с белыми колоннами, антресолью и покривив ши мся балконом жила некогда барыня-вдова, окружённая многочисленной дворней». И.С.Тургенев «Муму».

Фонетическая форма:

«ва-дной-из-ад-да-лен-ных у-лиц ма-сквы, фсе-рам до-ме збе-лы-ми ка-лон-на-ми, а-нтре-соль-jу и па-кри-виф- шы -мся-ба-лко-нам, жы-ла не-ка-гда ба-ры-ня-вда-ва, а-кру-жон-наjа мна-га-чис-лен-най дворней»

(Пишем ШИ, произносим ШЫ, пишем О, произносим А и т.д.).

Как видно из фонетической формы, построенной на основе одного из диалектов русского языка – московского диалекта, распознавание речи представляет собой очень сложную проблему.

Понятие «фонема» может рассматриваться как абстрактное, типизированное представление звука языка. В живой речи существует, однако, бесчисленное множество разнообразных физических реализаций каждой фонемы. Одна из главных закономерностей в изменчивости фонем – это влияние соседних звуков.

Разновидности фонемы, обусловленные звуковым окружением, называются «аллофонами». Например, гласная буква «О» произносится по разному в словах «вода» и «водяной». Вместе с тем, эти гласные являются представителями,одной и той жефонемы «О». С учётом аллофонов звуковой состав речи может насчитывать 100 – 140 и более различных звуков.

Другие систематические факторы изменчивости фонем – это индивидуальные особенности артикуляции, местные диалекты, пол, возраст.

В силу всех этих причин речевой сигнал считают квазислучайным, обладающим регулярной и случайной компонентами, что важно учитывать при автоматическом распознавании речи и речевом синтезе.

Фонемы можно классифицировать на основе различных подходов: артикуляционного, слухового и технического.

При артикуляционном подходе признаками фонем являются факты, связанные с движением (или положением) речеобразующих подвижных органов (языка, губ). Например, звук «а» является гласным низкого подъёма (или открытым), заднего ряда (губы не участвуют).

Согласные фонемы определяются тем, при помощи какого органа они образуются (губные, переднеязычные, среднеязычные, заднеязычные). Звук «б», например, является губным по месту образования, взрывным по способу образования.

Слуховой подход к классификации звуков основан на выделении таких признаков, как звонкость, шумность, нозальность (участие полости носа), компактность и др. Эти признаки определяются методами психологической акустики.

Технический подход основан на описании фонем совокупностью измеренных параметров. Это могут быть последовательности спектральных отсчётов, формантные частоты и ряд других. В любом случае эти описания приводят к сложным алгоритмам распознавания фонем. Именно технический подход будем рассматривать далее (но с учетом двух остальных).

<== предыдущая лекция	\|	следующая лекция ==>
Звуковой диалог с компьютером	\|	Клиппирование речевого сигнала

Поделиться с друзьями:

Дата добавления: 2013-12-13; Просмотров: 2123; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.012 сек.