КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Итак, рассмотрим интересный и все чаще используемый на практике процесс кодирования звуковой информации подробнее
Кодирование звуковой информации. Форматы звуковых файлов. Ввод и обработка звуковых файлов. Использование инструментов специального программного обеспечения и цифрового оборудования для создания и преобразования звуковых файлов. Компьютерные способы хранения и обработки звуковой информации получают в последнее время все большее распространение1. Звукооператоры увидели в компьютере мощное средство для более комфортной реализации своих традиционных функций и, самое главное, множество принципиально новых, ранее неизвестных возможностей. Действительно, современный компьютер может служить хорошей аппаратной основой для обработки звуковой информации: характерная (тактовая) частота последних процессоров превышает максимальные звуковые частоты не менее чем на 5 порядков2, так что при такой скорости можно организовать весьма сложную обработку данных, включая автоматические преобразования в масштабе реального времени. Из курса физики известно, что звук есть колебания среды. В повседневной жизни средой чаще всего является воздух, но это совсем не обязательно. Например, звук прекрасно распространяется по поверхности земли: именно поэтому в приключенческих фильмах герои, стараясь услышать шум погони, прикладывают ухо к земле. Напротив, существует весьма эффектный школьный физический опыт, который показывает, что при откачивании воздуха мы перестаем слышать звук находящегося под герметичным колпаком звонка. “Не может быть никакого звука в вакууме и на поверхности Луны — в космосе царит тишина, вопреки попыткам группы специальных эффектов Голливуда убедить нас в обратном путем имитирования грохота космических кораблей и взрывов, от которых вы подпрыгиваете на стуле” [1]. Чаще всего звуковые колебания с помощью микрофона легко преобразуются в электрические. Сигнал от микрофона очень слаб и нуждается в усилении, что на современном уровне развития техники проблемы также не представляет. Форму полученных колебаний, т.е. зависимость интенсивности сигнала от времени, можно наблюдать на экране осциллографа (к сожалению, для получения наглядной устойчивой картины сигнал должен быть периодическим!). Примечание. Некоторое представление о форме звукового сигнала можно легко получить, настроив соответствующим образом Windows MediaPlayer. Для наблюдения лучше использовать максимально простые периодические звуки, например, старые записи соло электромузыкальных инструментов (см. рис. 1).
Рис. 1 Раньше, в эпоху аналоговой записи звука, для сохранения полученного электрического сигнала его преобразовывали в ту или иную форму другой физической природы, которая зависела от применяемого носителя. Например, при изготовлении грампластинок сигнал вызывал механические изменения размеров звуковой дорожки, а для старых киноаппаратов звук на пленку наносился оптическим методом; наибольшее распространение в быту получил процесс магнитной звукозаписи. Во всех случаях интенсивность звука была строго пропорциональна какой-либо величине, например, ширине оптической звуковой дорожки, причем эта величина имела непрерывный диапазон значений. Переход к записи звука в компьютерном виде потребовал принципиально новых подходов. Дело в том, что при цифровой записи зависимости интенсивности звука от времени возникает принципиальная трудность: исходный сигнал непрерывен, а компьютер способен хранить в памяти только дискретные величины (подробнее об этом см. билет № 2). Отсюда следует, что в процессе сохранения звуковой информации она должна быть “оцифрована”, т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Данную функцию выполняет специальный блок, входящий в состав звуковой карты компьютера, который называется АЦП — аналого-цифровой преобразователь. Каковы основные принципы работы АЦП? Примечание. Советую обратить на этот материал особое внимание, поскольку в большинстве школьных учебников он отсутствует; из тех, что мне известны, могу порекомендовать [2, 3]. Во-первых, АЦП производит дискретизацию записываемого звукового сигнала по времени. Это означает, что измерение уровня интенсивности звука ведется не непрерывно, а, напротив, в определенные фиксированные моменты времени (удобнее, разумеется, через равные временныRе промежутки). Частоту, характеризующую периодичность измерения звукового сигнала, принято называть частотой дискретизации. Вопрос о ее выборе не праздный, и ответ в значительной степени зависит от частотного спектра сохраняемого сигнала: существует специальная теорема Найквиста, согласно которой частота оцифровки звука должна как минимум в 2 раза превышать максимальную частоту, входящую в состав спектра сигнала. Считается, что редкий человек слышит звук частотой более 20 000 Гц = 20 кГц; поэтому для высококачественного воспроизведения звука верхнюю границу обычно с некоторым запасом принимают равной 22 кГц. Отсюда немедленно следует, что частота при таких требованиях должна быть не ниже 44 кГц3. Названная частота используется, в частности, при записи музыкальных компакт-дисков. Однако часто такое высокое качество не требуется, и частоту дискретизации можно значительно снизить. Например, при записи речи вполне достаточно частоты 8 кГц. Результат при этом получается хотя и не блестящий, но вполне разборчивый4 — вспомните, как вы легко различаете голоса своих друзей по телефону. Хотя качество воспроизведения тем лучше, чем выше частота дискретизации, но и объем звуковых данных при этом тоже возрастает, так что оптимального “на все случаи” значения частоты не существует. Во-вторых, АЦП производит дискретизацию амплитуды звукового сигнала. Это следует понимать так, что при измерении имеется “сетка” стандартных уровней (например, 256 или 65 536 — это количество характеризует глубину кодирования), и текущий уровень измеряемого сигнала округляется до ближайшего из них. Напрашивается линейная зависимость между величиной входного сигнала и номером уровня. Иными словами, если громкость возрастает в 2 раза, то интуитивно ожидается, что и соответствующее ему число возрастет вдвое. В простейших случаях так и делается, но, как показывает более детальное рассмотрение, это не самое лучшее решение. Проблема в том, что в широком диапазоне громкости звука человеческое ухо не является линейным. Например, при очень громких звуках (когда “уши закладывает”) увеличение или уменьшение интенсивности звука почти не дает эффекта, в то время как при восприятии шепота очень незначительное падение уровня может приводить к полной потере разборчивости. Поэтому при записи цифрового звука, особенно при 8-битном кодировании, часто используют различные неравномерные распределения уровней громкости, в основе которых лежит логарифмический закон (m-law, A-law и другие; впечатляющие формулы для них можно посмотреть в книге [4]). В качестве практической иллюстрации к проблеме выбора параметров цифровой записи звука можно заглянуть в списки форматов и атрибутов программы “Звукозапись”, входящей в состав Windows (для получения изображенного на рис. 2 диалогового окна необходимо в меню Файл программы выбрать пункт Свойства).
Рис. 2 Итак, в ходе оцифровки звука мы получаем поток целых чисел, причем “величина числа соответствует силе звука в данный момент” [1]. На рис. 3 приведенное выше описание процесса дискретизации проиллюстрировано графически:
Рис. 3 На рисунке представлен процесс оцифровки зависимости интенсивности звукового сигнала I от времени t. Отчетливо видна дискретизация по времени (равномерные отсчеты на горизонтальной оси) и по интенсивности (требуемое при этом округление схематически изображено “изломами” горизонтальных линий разметки). Подчеркнем, что на рисунке степень дискретизации для наглядности сознательно утрирована: реально различие между соседними значениями по обеим осям значительно меньше и, следовательно, форма сигнала передается гораздо точнее. Мы рассмотрели лишь наиболее общие принципы записи цифрового звука. На практике для получения качественных звуковых файлов используется целый ряд дополнительных технических приемов. Их интересное и подробное описание дается, в частности, в серии популярных статей в журнале “Компьютерра” [5]. Изложенный метод преобразования звуковой информации с целью хранения в памяти компьютера в очередной раз подтверждает уже неоднократно обсуждавшийся ранее тезис: любая информация в компьютере приводится к числовой форме и затем переводится в двоичную систему. Теперь мы знаем, что и звуковая информация не является исключением из этого фундаментального правила. При воспроизведении записанного в компьютерный файл звука производится преобразование в противоположном направлении — из дискретной цифровой формы представления сигнала в непрерывную аналоговую, поэтому вполне естественно соответствующий узел компьютерного устройства называется ЦАП — цифроаналоговый преобразователь. Процесс реконструкции первоначального аналогового сигнала по имеющимся дискретным данным нетривиален, поскольку никакой информации о форме сигнала между соседними отсчетами не сохранилось. В разных звуковых картах для восстановления звукового сигнала могут использоваться различные способы. Наиболее наглядный и понятный из них состоит в том, что по имеющимся соседним точкам рассчитывается некоторая гладкая функция, проходящая через заданные точки, которая и принимается в качестве формы аналогового сигнала. Технические возможности современных микросхем позволяют для реконструкции формы сигнала производить весьма сложные вычисления. Выпускаются даже специализированные микропроцессоры, для которых в технической литературе принято название DSP (Digital Signal Processor) — процессоры цифровой обработки сигналов. Результаты дискретизации звуковой информации, как и все остальные компьютерные данные, сохраняются на внешних носителях в виде файлов. Звуковые файлы могут иметь различные форматы; опираясь на данные замечательной книги [4], рассмотрим наиболее распространенные из них.
Дата добавления: 2015-04-23; Просмотров: 692; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |