Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

И, наконец, на фазе отступа органы речи переводятся в спокойное состояние

Во время фазы выдержки органы речи сохраняют свое положение, необходимое для произнесения текущего звука.

Во время приступа артикуляции органы речи переходят из спокойного состояния в положение, необходимое для произнесения данного звука.

 

Управление артикуляторными органами осуществляется корой головного мозга человека как это было объяснено в лекции, посвященной формализму искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов.

  1. Структура приемника информации – слухового анализатора человека

Сенсорным органом слухового анализатора является улитка внутреннего уха. Будучи развернутой, она представляет собой эластичную мембрану неравномерную по толщине и ширине, в которой под воздействием звуковой волны возбуждаются стоячие волны, положение которых на мембране соответствует характеристикам гармоник звуковой волны. Т.н. волосковые клетки, прилегающие к мембране, воспринимают информацию о ее колебаниях и передают по слуховому нерву через несколько переключающих ядер (в том числе – медиальное коленчатое тело) в составе центрального слухового пути в слуховую кору. Слуховой нерв состоит из 10000 нервных волокон. Информация от каждого уха поступает в свое полушарие, но часть ее отводится в контралатеральное полушарие.

Рис. 7.7. Слуховой анализатор человека.

Рис. 7.8. Ухо человека.

Анатомически ухо делится на три части:

· наружное ухо;

· среднее ухо;

· внутреннее ухо.

Наружное ухо состоит из ушной раковины и наружного слухового прохода.

Функционально наружное ухо предназначено, во-первых, для улавливания и фокусировки звуковых волн, и, во-вторых, для защиты среднего и внутреннего уха от механических повреждений.

 

Среднее ухо. Строение среднего уха показано на рис. 6. Среднее ухо герметично отделено от наружного уха барабанной перепонкой. Толщина барабанной перепонки 0.1 мм.

Рис. 7.9. Среднее ухо.

Внутренняя область среднего уха называется барабанной полостью. В барабанной полости находится система так называемых слуховых косточек, состоящая из молоточка, наковальни и стремени. Эти косточки связаны между собой в единую подвижную цепь, состоящую из рычагов. Задача системы слуховых косточек заключается в передаче звуковых колебаний от барабанной перепонки в область внутреннего уха.

Внутреннее ухо ответственно за преобразование звуковых колебаний в электрические импульсы.Внутреннее ухо заполнено жидкостью. Оно состоит из двух частей: вестибулярного аппарата и улитки. Свое название улитка получила из-за своей формы — улитка свернута спирально, наподобие раковины обычной улитки. Улитка разделена эластичной перегородкой (мембраной) на два канала, заполненных жидкостью. В этой перегородке находятся чувствительные волосковые клетки и нервные клетки, которые передают сигналы с волосковых клеток в мозг.

Рис. 7.10. Внутреннее ухо.

Частотный диапазон слышимых звуковых колебаний. Согласно [24], человеческое ухо воспринимает звуковые волны длиной примерно от 1,6 см до 20 м, что соответствует частотному диапазону 16-20 000 Гц. Частотный диапазон человеческой речи - 300-4000 Гц. Надо заметить, что разборчивость речи остается вполне удовлетворительной при ограничении этого диапазона до 300-2400 Гц. Частотный диапазон обычных телефонных каналов еще меньше, однако, это не сказывается заметным образом на разборчивости речи.

 

Анализ звуковой информации, получаемой от уха человека, представлен в лекции, посвященной формализму искусственных нейронных сетей на основе нейроподобных элементов с временной суммацией сигналов.

  1. Структура приемника информации – машины

Для решения задачи коммуникации со стороны машины должны быть реализованы те же функции, что и со стороны человека – реципиента речевой посылки. Следовательно, и архитектура ее алгоритмов должна быть такой же, или похожей. Необходимо заметить, что эта тождественность реализуется на верхних уровнях отображения информации, на нижних же, в силу специфики обработки информации человеком (строго параллельно) и машиной (сугубо последовательно), в машинном варианте используются специфические алгоритмы обработки сигналов, имеющие строгое математическое обоснование. Хотя и в этом случае иногда привлекается психологическая эмпирика.

Традиционно в лингвистике рассматриваются следующие уровни представления речевой информации [10]: (1) уровень субфонемных элементов; (2) фонем; (3) корневых и флективных морфем, слогов; (4) слов; (5) уровень фразовых структур. Семантический и прагматический уровни представления знаний реализуются на стыке речевой и многомодальной моделей мира.

 

Акустико-фонетический уровень (АФУ) обработки информацииформирует представление классов фонотипов, фонем или аллофонов в зависимости от степени детальности представления акустического сигнала.

На входе АФУ речевая акустическая информация подвергается первичной обработке с целью уменьшения отношения сигнал/шум, уменьшения корреляции, а также уменьшения вариативности входной информации.

На вход АФУ подается обучающая выборка из реализации слов фонетически сбалансированного словаря (ФСС). Под фонетически сбалансированным словарем понимается набор слов, содержащих все варианты фонем, вероятность появления которых в речи превышает некоторую заданную.

Для упрощения задачи формирования словаря фонетического уровня возможна предварительная сегментация и разметка ФСС: выбор только сегментов, точно соответствующих интересующим нас фонетическим элементам и формирование уже из них обучающей выборки.

В АФУ формируется представление речевой информации фонетического уровня в виде словаря фонетических элементов. Детальность словаря зависит от детальности акустического описания входных реализаций, т.е. от способа первичной обработки.

Если в качестве первичного описания используются r-параметры в двух частотных каналах, будут сформированы только классы фонотипов: глухая смычка, гласная, назализованная согласная, согласная шумная. Более детальное описание, например кепстральный анализ, даст словарь фонем - приблизительно 32 звука. Еще более детальное описание на основе дискриминантных признаков, позволяющих разделить не только отдельные звуки, но и отдельные варианты звуков по месту в слове - даст словарь аллофонов (около 120 элементов).

Наличие сформированного словаря фонетического уровня позволяет использовать АФУ как структуру для выделения в явном виде фонологической информации. Взаимодействие произвольной выборки, поступающей на вход акустико-фонетического уровня, со сформированным в нем словарем приводит к выделению из входной информации последовательности транзем.

Следующий уровень представления речевых акустических знаний - лексический (ЛУ).

 

Лексический уровень. Подавая на вход АФУ обучающую выборку, содержащую множество реализаций слов оперативного словаря, на его выходе мы получаем ту же выборку, но уже в виде последовательности транзем с пробелами. Из этой последовательности на ЛУ формируется словарь слов, соответствующий оперативному словарю (наиболее часто встречающихся слов).

Параллельно словарю слов формируются дополнительно следующие подсловари: корневых морфем и флективных морфем.

 

Синтаксический уровень. Подавая на вход АФУ обучающую выборку, состоящую уже из множества типовых словосочетаний или фраз, на входе синтаксического уровня (СУ), после их взаимодействия со словарем фонем на АФУ и словарем корневых морфем на ЛУ, мы получим множество структур фраз, состоящих из последовательностей флективных морфем. Эти структуры в сигнальном пространстве СУ формируют словарь фразовых структур: в основе организации единиц этого уровня лежит общность звуковой формы - флективной структуры [11].

<== предыдущая лекция | следующая лекция ==>
Артикуляция. Движения, выполняемые органами речи в процессе произнесения звуков, называются артикуляцией | Первичная обработка
Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 533; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.