Основы цифрового представления речевых сигналов

⇐ Предыдущая 12

КЛАССИФИКАЦИЯ КОДЕРОВ РЕЧИ

Исторически сложились два направления кодирования речи:

§ кодирование формы сигнала (КФС), называемое также аппроксимацией формы речевой волны;

§ параметрическое компандирование речи, иногда называемое кодированием источника сигнала.

В первом методе кодер формы волны аппроксимирует форму речевого сигнала во времени. Этот метод основан на использовании статистических характеристик речевого сигнала (РС) и практически не зависит от механизма его формирования. Кодеры этого типа обеспечивают высокое качество передачи речи, но скорость цифрового потока редко бывает меньше 32 кбит/с. Поэтому для кодирования речи со скоростью передачи 16 кбит/с и меньше – прежде всего для цифровых систем сотовой и персональной спутниковой связи - получили мощное развитие разнообразные методы параметрического компандирования речи (таблица 1).

Трудность создания кодеков, обеспечивающих минимально возможную скорость передачи для речевого источника, обусловлена рядом причин. Во-первых, речь представляет собой колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего, а речевой сигнал не является стационарным процессом. Законы изменения его вероятностных характеристик на участках произнесения гласных и согласных звуков существенно различаются, не говоря уже о паузах и смычках (участки звучания согласных типа «м», «н», «п» и т. п.), где характеристики могут изменяться почти скачком.

Вторая причина связана с определением (формализацией) критерия верности передачи, свойственным получателю. Действительный критерий восприятия, который характеризует качество слухового приема речевого сигнала человеком, отличается от распространенного критерия среднеквадратической ошибки или от какого-либо другого критерия, контролирующего отклонение «формы реализаций». Поэтому воспользоваться непосредственно результатами теории передачи информации для расчета качественных характеристик источника речевого сигнала затруднительно. Однако, можно попытаться получить оценки минимально возможной скорости передачи из других соображений, используя физические свойства получателя и источника речевых акустических колебаний.

Вид преобразования речи	Устр-ва преоб-ра- зова-ния	Алгоритмы кодирования -декодирования речи	Скорость пере-дачи, кбит/с
Кодирование формы сигнала	Кодеры формы сигнала	Импульсно - кодовая модуляция (ИКМ)
Дифференциальная ИКМ (ДИКМ)	48/52/56
Адаптивная дельта-модуляция (АДМ)
Адаптивная дифференциальная ИКМ (АДИКМ)
Парамет- рическое компан-дирова-ние (кодирование) речи	Вокодеры	Спектрально-временные (полосный, формантный, гармонический)	1,2-4,8
Кодирование на основе линейного предсказания (LPC)
Гибридные кодеры	Линейное предсказание с возбуждением от остатка предсказания (RELP)	4,8-16
Линейное предсказание с многоимпульсным возбуждением (MPE-LPC)
Линейное предсказание с долговременным предсказанием (LTP-LPC)
Линейное предсказание с регулярным импульсным возбуждением (RPE-LPC)
Линейное предсказание с кодовым возбуждением (CELP)
Линейное предсказание с кодовым возбуждением и малой задержкой (LD-CELP)
Линейное предсказание с возбуждением алгебраическим кодом (ACELP)
Линейное предсказание с векторным возбуждением (VSELP)
Адаптивное кодирование с предсказанием (АРС)
Метод квантования по максимуму правдоподобия (MP-MLQ)

При параметрическом компандировании моделируется процесс речеобразования человека. Для этого в кодере из речевого сигнала вычисляются определенные параметры, которые передаются к декодеру, где они используются для восстановления формы сигнала. Восстановленная форма сигнала очень часто отличается от формы исходного сигнала; при этом звук подобен или близок к оригиналу. Использование полностью параметрических методов в настоящее время ограничено, так как они приводят к заметному ухудшению натуральности звучания голоса и чрезвычайно чувствительны к фоновому шуму. Один из способов снижения скорости передачи речи и повышения эффективности использования полосы пропускания канала связи состоит в применении гибридных методов, основанных на принципах линейного предсказания и объединяющих параметрическое компандирование и кодирование формы волны (таблица 1).

Основные характеристики наиболее распространенных и перспективных методов кодирования речи являются предметом изучения в следующих лекциях.

⇐ Предыдущая 12

Поделиться с друзьями:

Дата добавления: 2013-12-13; Просмотров: 402; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.007 сек.