Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Система синтеза речи




Система синтеза речи – это система, которая преобразует орфографический текст или другую информацию в звучащий текст. Общепринятое в англоязычной литературе обозначение TTS - Text To Speech System [3]. Структурная схема системы синтеза речи представлена на рис. 3

Рассмотрим основные компоненты, показанные на рис. 3

Модель генерации речевых параметров - это блок преобразования входного орфографического текста в последовательность параметров, с помощью которых можно описать речь. Это могут быть артикуляторные параметры, либо параметры, связанные с акустикой речи, либо другие параметры, набор которых определяется, исходя из того, какая информация заключена в речевом потоке и каким образом она описана.

 

 

Рис. 3 – Обобщенная модель системы синтеза речи

Модель генерации речевого сигнала – это блок преобразования речевых параметров в речевой сигнал, который воспринимает пользователь системы. Данный блок сопряжен с динамиками и в некоторых реализациях синтезаторов речи представляет собой только соответствующую аппаратную часть речевого интерфейса, а в некоторых – аппаратно-программную.

Следует отметить, что если в распознавании речи имеется такая важная характеристика, как объём словаря, то при синтезе речи это не является актуальным. Современные системы синтеза речи ориентированы на неограниченный объём словаря, благодаря тому, что они построены не с учетом знаний языка, а с учетом знаний об особенностях строения речи. Таким образом, система автоматического синтеза речи «умеет читать» практически любой естественно-языковой текст.

Следует различать системы, которые работают с ограниченным словарём, не являются системами синтеза речи. Это простые синтезаторы, а точнее – воспроизводители некоторых записанных выражений, т.е. это системы типа цифрового магнитофона с произвольной выборкой сообщений.

Рассмотрим основные характеристики систем синтеза речи, влияющие на качество результата:

1). Разборчивость речи;

2). Естественность (натуральность) речи;

3). Мультимодальность речи;

4). Многоязычность;




Поделиться с друзьями:


Дата добавления: 2017-01-13; Просмотров: 310; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.