Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Кодирование аудио сигналов




Процесс преобразования аналогового сигнала в форму, совместимую с цифровой системой связи начинается с процесса дискретизации. Для преобразования аналогового сигнала в дискретный сигнал в большинстве случаев используется выборка мгновенного значения сигнала через строго определенные промежутки времени. Результатом такого процесса дискретизации является сигнал в амплитудно-импульсной модуляции (Pulse-Amplitude modulation - PAM). Заметим, что аналоговый сигнал с определенной степенью точности легко восстановить, применив к PAM простой сглаживающий фильтр нижних частот. Оговорка с определенной степенью точности очень важна! Для того чтобы в результате обратного преобразования полученный сигнал в достаточной степени совпадал с исходным сигналом необходимо, что бы частота дискретизации (выборок) была в 2 раза выше максимальной частоты в спектральном разложении аналогового сигнала. Это утверждение было формализовано в 1933 году в теореме Котельникова:

1. Если аналоговый сигнал x (t) имеет ограниченный спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчётам, взятым с частотой не менее удвоенной максимальной частоты спектра Fmax:

Fдискр ≥ 2 ∙ Fmax, где Fmax — верхняя частота в спектре.

  1. Если максимальная частота в сигнале превышает половину частоты прерывания, то способа восстановить сигнал из дискретного в аналоговый без искажений не существует.

 

Частота равная половине частоты дискретизации также называется частотой Найквиста. К примеру, в аудио компакт-дисках используется частота дискретизации 44100 герц. Частота Найквиста для них — 22050 герц, она ограничивает верхнюю полосу частот, до которой звук может быть воспроизведён без искажений. Но это - теоретический предел. На практике, как говорится, есть нюансы. При оцифровке аналогового сигнала с широким спектром необходимо обеспечить срез спектра аналогового сигнала на частоте Найквиста при помощи фильтра очень высокого порядка, чтобы избежать зеркального отражения спектра для частот, лежащих выше частоты Найквиста. Практическая реализация такого фильтра весьма сложна, так как амплитудно-частотные характеристики фильтров имеют не прямоугольную, а колоколообразную форму и образуется некоторая полоса "затухания". Поэтому максимальную частоту спектра дискретизуемого сигнала принимают несколько ниже частоты Найквиста. Обычно на 10-20 %.

При дискретизации мы получаем большое количество выборок сигнала с произвольными значениями. Т.е. бесконечное число возможных значений мгновенной амплитуды сигнала. Для представления в цифровой форме, необходимо ограничить число возможных значений амплитуды – провести процедуру квантования сигнала.

 

Общепризнанные методы сжатия данных, такие, как RLE, статистические и словарные методы, могут быть использованы для компрессии звуковых файлов без потерь, но результат существенно зависит от конкретных аудиоданных. Некоторые звуки будут хорошо сжиматься с помощью RLE, но плохо - статистическими алгоритмами. Другим звукам больше подходит статистическое сжатие, а при словарном подходе, наоборот, может произойти расширение. Приведем краткую характеристику эффективности этих трех методов при сжатии звуковых файлов.

 

RLE хорошо работает со звуками, которые содержат длинные серии повторяющихся звуковых фрагментов - сэмплов. При 8-битном сэмплировании это может происходить довольно часто. Напомним, что разность электрического напряжения между двумя 8-битовыми сэмплами и составляет около 4 мВ. Несколько секунд однородной музыки, в которой звуковая волна будет меняться менее чем на 4 мВ, породят последовательность из тысяч тождественных сэмплов. При 16-битном сэмплировании, очевидно, длинные повторы встречаются реже, и, следовательно, алгоритм RLE будет менее эффективен.

 

Статистические методы присваивают коды переменной длины звуковым сэмплам в соответствии с их частотностью. При 8-битном сэмплировании имеется всего 256 различных сэмплов, поэтому в большом звуковом файле сэмплу могут быть распределены равномерно. Такой файл не удастся хорошо сжать методом Хаффмана. При 16-битном сэмплировании допускается более 65000 звуковых фрагментов. В этом случае, возможно, что некоторые сэмплы будут встречаться чаще, а другие - реже. При сильной асимметрии вероятностей хороших результатов можно добиться с помощью арифметического кодирования.

 

Методы, основанные на словарном подходе, предполагают, что некоторые фразы будут встречаться часто на протяжении всего файла. Это происходит в текстовом файле, в котором отдельные слова или их последовательности повторяются многократно. Звук, однако, является аналоговым сигналом и значения конкретных сгенерированных сэмплов в большой степени зависит от работа АЦП. Например, при 8-битном сэмплировании, волна в 8 мВ становится числовым сэмплом, равным 2, но близкая ей волна, скажем, в 7.6 мВ или 8.5 мВ может стать другим числом. По этой причине, речевые фрагменты, содержащие совпадающие фразы и звучащие для нас одинаково, могут слегка отличаться при их оцифровывании. Тогда они попадут в словарь в виде разных фраз, что не даст ожидаемого сжатия. Таким образом, словарные методы не очень подходят для сжатия звука.

 

Можно добиться лучших результатов при сжатии звука с потерей части аудиоинформации, развивая методы компрессии, которые учитывают особенности восприятия звука. Они удаляют ту часть данных, которая остается неслышимой для органов слуха. Это похоже на сжатие изображений с отбрасыванием информации, незаметной для глаза. В обоих случаях мы исходим из того факта, что исходная информация (изображение или звук) является аналоговым, то есть, часть информации уже потеряно при квантовании и оцифровывании. Если допустить еще некоторую потерю, сделав это аккуратно, то это не повлияет на качество воспроизведения разжатого звука, который не будет сильно отличаться от оригинала. Мы кратко опишем два подхода, которые называются подавлением пауз и уплотнением.




Поделиться с друзьями:


Дата добавления: 2014-12-16; Просмотров: 639; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.