Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Полосный вокодер

Полосный вокодер.

Тема лекции: Вокодеры

ЛЕКЦИЯ №6

 

 

 

 

Учебные вопросы:

2. Другие виды вокодеров.

Литература:

 

 

 

Повышение эффективности цифровых методов передачи возможно применением полосного кодирования, основанного на делении полосы частот речевого сигнала С¢ (t), ограниченного фильтром нижних частот (ФНЧ), до пределов эффективно передаваемой полосы частот (ЭППЧ) соответствующего канала передачи, на ряд полос с помощью блока полосовых фильтров (ПФ1ПФn) тракта передачи, образуя таким образом субканалы (СК), число которых лежит в пределах 4…8 (рисунок 1).

Тракт приема
Тракт передачи
С (t)
С ¢ (t)
ФНЧ
ПФ1
ПФ2
ПФn
Кодер АДИКМ1
Рисунок 1. Структурная схема кодера с разделением на полосы
Кодер АДИКМ2
Декодер АДИКМ1
Декодер АДИКМ2
Декодер АДИКМn
ПФ1
ПФ2
ПФn
Кодер АДИКМn
СРС
С ¢ (t)
 
 

 

 


 

 

В тракте передачи сигнал каждого из СК с помощью однополосной модуляции переносится в полосу частот 0… F макс и затемобрабатывается раздельно при помощи, например, кодера адаптивной дифференциальной импульсно-кодовой модуляции (Кодер АДИКМ). Для каждого СК дискретизация осуществляется с соответствующей частотой дискретизации F д j Квантование и кодирование в каждом СК осуществляется с разной точностью с учетом чувствительности уха. Если применяется кодирование с мгновенным компандированием, то для всех СК может быть использован общий кодер. Однако для минимизации скорости передачи для каждого СК используется адаптивный кодер.

После того как сигнал в каждом из СК закодирован, индивидуальные цифровые потоки объединяются устройством формирования канального цифрового сигнала (ФКЦС) для передачи по общему каналу. На приеме осуществляются обратные преобразования: разделение канального цифрового сигнала в распределителе канального цифрового сигнала (РКЦС), декодирование сигналов каждого СК в декодере АДИКМ и синтез исходного речевого сигнала в блоке синтеза речевого сигнала (СРС).

Раздельное кодирование в каждом СК обладает следующими преимуществами.

1. За счет использования раздельной адаптации в каждом СК можно выбрать размеры шагов квантования в соответствии с уровнем энергии сигнала в каждом СК. В СК, содержащих сигналы с относительно высокими уровнями, возможно осуществление квантования с большим шагом. Таким образом, спектр шума квантования подгоняются под мгновенный спектр сигнала СК.

2. Скорость передачи в каждом из СК может быть оптимизирована согласно степени воздействия каждой из полос на восприятие. В частности, относительно большое число разрядов тj на отсчет может быть использовано для низких частот спектра речи, где это важно для сохранения основного тона и структуры формант гласных и звонких согласных звуков. На высоких частотах можно использовать меньшее число разрядов на отсчет, поскольку шумоподобные глухие звуки не требуют сопоставимого качества воспроизведения.

Кодеры с разделением на полосы (СК) обеспечивают значительное уменьшение скорости передачи по сравнению с общими и относительно простыми алгоритмами кодирования в АДМ и АДИКМ.

Коэффициент сжатия цифрового сообщения при таком кодировании определяется из выражения

 

где Nс.с. - число служебных символов, например синхронизации, за 1с; F д0 и т 0 – частота дискретизации и число разрядов кодовой комбинации при типовом способе цифровой передачи (F д0 = 8 кГц и т 0 = 8).

Как показали экспериментальные исследования кодирование с разделением на полосы обеспечивает хорошее качество передачи речевого сигнала при скорости 16…24 кбит/с при коэффициенте сжатия Ксж = 3-4.

Реализация современных кодеков полосного кодирования осуществляется только методами цифровой обработки сигналов на всех этапах формирования канального цифрового сигнала с широким использованием микропроцессорной техники.

Метод полосного кодирования нашел применение при передаче речевого сообщения в полосе частот до 7 кГц на скорости основного цифрового канала (ОЦК). При этом полоса частот такого сигнала делится на две полосы с образованием двух СК. В первом СК передача осуществляется в полосе частот 0,1…4,0 кГц с помощью АДИКМ со скоростью 48 кбит/с; во втором канале передается полоса частот 4…7 кГц с предварительным преобразованием в полосу частот 0…3 кГц и передачей методом АДИКМ, но со скоростью 16 кбит/с. Алгоритмы полосного кодирования предназначаются прежде всего для воспроизведения формы входного сигнала С¢ (t) (рис.1) с максимально возможной точностью. Они предполагают малую степень или полное отсутствие знаний о природе сигнала и применимы, практически, к любому сигналу, передаваемому по каналу тональной частоты, например, к факсимильным сигналам. Для получения более низких скоростей передачи речевого сигнала (20 кбит/с и менее) необходимо учитывать статистические свойства речевого сигнала и применять весьма специфические методы его кодирования. Устройства, реализующие методы кодирования на основе использования статистических свойств речевого сигнала, называются вокодерами, от соединения слов «voice coders», что означает «кодеры речевого сигнала (голоса)».

Основным назначением вокодеров является кодирование только важных для восприятия речи параметров сигнала с уменьшенным числом символов. При построении вокодеров используются следующие специфические особенности спектра речевого сигнала:

1. Спектр гласных и звонких согласных звуков дискретный, все компоненты спектра являются кратными гармониками частоты основного тона F от, индивидуального для каждого говорящего. Такие звуки можно описать выражением С (t) = где Ak – амплитуда k -й гармоники частоты основного тона F от. Параметр Ak изменяется от звука к звуку, параметр F от - от говорящего к говорящему.

2. Спектр глухих звуков (глухих согласных) является практически сплошным.

3. Для всех звуков характерно неравномерное распределение энергии спектральных составляющих с концентрацией их в отдельных областях, называемых формантами. Число формант для каждого звука зависит от особенностей говорящего и лежит в пределах 3…5 (иногда доходит до 7). Основными параметрами формантной области являются ее центральная частота F ф i и максимальная амплитуда Аi., которые изменяются от звука к звуку и от говорящего к говорящему.

4. Усредненные центральные частоты первых трех формант лежат в пределах 200…700 Гц (с условным максимумом на частоте F ф1 = 500 Гц), 1000…2000 Гц (с условным максимумом на F ф2 = 1500 Гц), 2000…4000 Гц (с условным максимумом на F ф3 = 3500 Гц) для 1-й, 2-й и 3-й формантам соответственно.

5. Частота следования отдельных звуков или слогов для нормального речевого процесса не превышает 10 Гц, при этом длительность самых коротких согласных звуков – не менее 30 мс, а самых длинных гласных - не более 350.

6. Фазовые соотношения между отдельными частотными составляющими спектра речи менее существенны для ее восприятия. По существу, ухо воспринимает уровень энергии на различных частотах в спектре речи, но не фазовые соотношения между отдельными частотными составляющими.

В зависимости от того, какие из перечисленных особенностей выбраны при анализе речевого сигнале на передаче и его синтезе на приеме различают: полосные вокодеры (ПВК), формантные вокодеры (ФВК), гармонические вокодеры (ГВК), вокодеры с линейным предсказанием.

Полосный вокодер. ПВК был впервые разработан в 1928 г. Г. Дадли, в котором речевой сигнал путем компрессирования спектра преобразовывался в аналоговый сигнал с общей полосой порядка 300 Гц. Затем были разработаны цифровые полосные вокодеры (ЦПВК), основанные на этих идеях, на скорости передачи от 1 до 2 кбит/с.

Структурная схема тракта передачи цифрового полосного вокодера приведена на рис.2.

Групповой вокодерный цифровой сигнал
Рис.2. Структурная схема тракта передачи цифрового полосного вокодера  
Анализатор
С (t)
ФНЧ
ПФ1
ПФ2
ПФп
С ¢ (t)
 
 
ФНЧ1
ФНЧ2
ФНЧn
АЦП1
АЦП2
АЦПn
АД
ВОТ
ОТШ
 
 
 

 


Полоса частот первичного речевого сигнала С (t) фильтром нижних частот (ФНЧ) ограничивается до эффективно-передаваемой полосы частота канала тональной частоты. Получаемый на выходе ФНЧ сигнал С¢ (t), набором полосовых фильтром ПФ1ПФn делится на ряд субканалов (СК). В состав каждого СК входит амплитудный детектор АД, на выходе которого получается огибающая сигнала соответствующего СК, выделяемая ФНЧ, с полосой пропускания от 0 до 25…35 Гц. В результате на выходах этих фильтров имеем низкочастотные сигналы Si (t), i = 1, 2, …, n, каждый из которых несет информацию о средней интенсивности спектра речевого сигнала в пределах полосы частот СК. Далее сигнал Si (t) соответствующего СК в блоке аналого-цифрового преобразования (АЦП) подвергается всем процедурам формирования соответствующего цифрового сигнала на основе обычной ИКМ или ее модификаций: ДИКМ или АДИКМ.

С помощью блока ВОТ (выделитель основного тона) производится определение частоты основного тона F от, а с помощью блока ОТШ (определитель «тон-шум)» определяется тип звука – звонкий (тональный) или глухой («шумный»). Для передачи информации от ВОТ и ОТШ требуется полоса частот порядка 100 Гц. Совокупность устройств, образующих блок субканалов совместно с ВОТ и ОТШ, называется анализатором.

Затем цифровые сигналы отдельных СК и ВОТ и ОТШ объединяются в ФГВКЦС (формирователь группового вокодерного цифрового сигнала) в групповой вокодерный цифровой сигнал (ГВКЦС). Коэффициент сжатия по тактовой частоте определяется по формуле:

,

где F твк – тактовая частота ГЦС вокодера; Fi и mi – частота дискретизации и разрядность в i -ом СК (обычно Fi = 50…70 Гц и mi = 3…5); F д0 = 8 кГц и т 0 – частота дискретизации и разрядность кода типового основного цифрового канала ЦСП ИКМ-ВРК. Для передачи информации от ВОТ и ОТШ и сигнала цикловой синхронизации требуется до 600 бит. Для числа СК n = 6..12 скорость передачи полосового вокодера составляет 1200…2400 бит/с, что соответствует коэффициенту сжатия К сж = 26…53.

Обобщенная структурная схема тракта приема полосного вокодера приведена на рис.3, где происходят операции декодирования цифровых сигналов СК, получение соответствующих им огибающих и синтеза речевого сигнала по этим огибающим и сигналов основного тона и «тон-шум».

На вход тракта приема поступает вокодерный групповой цифровой сигнал (ВКГЦС), который в блоке разделения вокодерного группового цифрового сигнала делится на сигналы соответствующих субканалов, при этом информация от ВОТ тракта передачи поступает на импульсный генератор основного тона - ГОТ и управляет его частотой, информация от ОТШ тракта передачи поступает на коммутатор КОМ, который подключает к гребенке полосовых фильтров - ПФ субканалов или ГОТ или генератор шума - ГШ. Генератор шума формирует короткие импульсы случайной длительности и частоты, что эквивалентно шуму с равномерной спектральной плотностью.

 

БЛОК РАЗДЕЛЕНИЯ
ЦАП1  
ЦАПn  
Коммутатор
ГОТ
ГШ
АМСК1  
АМСКn  
ПФ1
ПФn  
 
ВКГЦС

 

 


Рисунок 3.

Генератор основного тона представляет собой генератор гармоник, формирующий периодическую последовательность импульсов, следующих с частотой основного тона F от. Совокупность элементов СК: цифро-аналоговый преобразователь - ЦАП, амплитудный модулятор субканала - АМСК, полосовые фильтры - ПФ субканалов, ГОТ, ГШ и КОМ образуют синтезатор речевого сигнала - СРС.

Огибающая сигнала S (t) соответствующего СК с выхода ЦАП поступает на АМСК, где происходит амплитудная модуляция либо сигналов ГОТ, либо ГШ. В результате чего формируется так называемый «окрашенный» спектр частот характерный для того или иного звука. В зависимости от значения сигнала S (t) соответствующего СК меняется интенсивность спектра в его полосе. Полосовые фильтры ПФ служат в основном для исключения побочных продуктов модуляции. Выходом вокодерного канала является усилитель УС, обеспечивающий номинальный уровень приема.

Наиболее трудным в реализации полосных вокодеров является точное определение параметров основного тона и сигнала «тон-шум» для гласных или звонких согласных звуков. Кроме того, определенные звуки затруднительно четко определить как чисто звонкие или чисто глухие (или шумовые). Поэтому усовершенствование полосовых вокодеров связано с получением более точных характеристики генераторов возбуждения (ГОТ и ГШ). Без точной информации об этих сигналах качество речи на выходе вокодера является низким и зависит от конкретных произнесенных звуков. Некоторые из более совершенных вокодеров при скорости передачи 2400 бит/с создают разборчивую речь, хотя с недостаточной узнаваемостью и несколько ощутимым синтетическим звучанием.

 

<== предыдущая лекция | следующая лекция ==>
 | Другие виды вокодеров
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 1346; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.025 сек.