Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Обратимость сжатия

Теоретические основы сжатия данных

Приемы и методы работы со сжатыми данными

 

Как хранение, так и передача информации обходятся участникам информационного процесса недешево. Зная стоимость носителя и его емкость (Мбайт, Гбайт), нетрудно подсчитать, во что обходится хранение единицы информации, а зная пропускную способность канала связи (Мбит/с) и стоимость его аренды, можно определить затраты на передачу единицы информации. Полученные результаты обычно составляют вполне значимые величины как для корпоративных пользователей, так и для индивидуальных. В связи с этим, регулярно возникает необходимость сжимать данные перед тем, как размещать их в архивах или передавать по каналам связи. Соответственно, существует и обратная необходимость восстановления данных из предварительно уплотненных архивов.

 

Характерной особенностью большинства "классических" типов данных, с которыми традиционно работают люди, является определенная избыточность. Степень избыточности зависит от типа данных. Например, у видеоданных степень избыточности обычно в несколько раз больше, чем у графических данных, а степень избыточности графических данных в несколько раз больше, чем текстовых. Кроме того, степень избыточности данных зависит от принятой системы кодирования. Так, например, можно сказать, что кодирование текстовой информации средствами русского языка (с использованием русской азбуки) дает в среднем избыточность на 20-30% больше, чем кодирование адекватной информации средствами английского языка. Для человека избыточность информации нередко связана с представлением о ее качестве, поскольку избыточность, как правило, улучшает восприятие, особенно в неблагоприятных условиях (просмотр телепередач при наличии помех, восстановление поврежденного графического материала и т. п.). При хранении готовых документов или их передаче, избыточность можно уменьшить, что дает эффект сжатия данных. Нередко термин сжатие данных подменяют термином архивация данных, а программные средства, выполняющие эти операции, называют архиваторами.

 

Несмотря на изобилие алгоритмов сжатия данных, теоретически есть только три способа уменьшения их избыточности. Это либо изменение содержания данных, либо изменение их структуры, либо и то и другое вместе.

Если при сжатии данных происходит изменение их содержания, метод сжатия необратим и при восстановлении данных из сжатого файла не происходит полного восстановления исходной последовательности. Такие методы называют также методами сжатия с регулируемой потерей информации. Они применимы только для тех типов данных, для которых формальная утрата части содержания не приводит к значительному снижению потребительских свойств. В первую очередь, это относится к мультимедийным данным: видеорядам, музыкальным записям, звукозаписям и рисункам. Методы сжатия с потерей информации обычно обеспечивают гораздо более высокую степень сжатия, чем обратимые методы, но их нельзя применять к текстовым документам, базам данных и, тем более, к программному коду. Характерными форматами сжатия с потерей информации являются:

- JPG для графических данных;

- МPG для видеоданных;

- МРЗ для звуковых данных.

Если при сжатии данных происходит только изменение их структуры, то метод сжатия обратим. Из результирующего кода можно восстановить исходный массив путем применения обратного метода. Обратимые методы применяют для сжатия любых типов данных. Характерными форматами сжатия без потери информации являются:

-.GIF,.TIP,.PCX и многие другие для графических данных;

-.AVI для видеоданных;

-.ZIP,.ARJ,.RAR,.LZH,.LH,.CAB и многие другие для любых типов данных.

 

МР3 (аббревиатура от MPEG-1, Layer 3) – это стандарт сжатия, благодаря которому становится возможным получение звуковых файлов небольшого размера, обеспечивающих высокое качество звучания при воспроизведении на компьютере или портативном музыкальном плеере.

Объем типичного файла, сохраненного в формате.wav, составляет около 10Мбайт; при этом обеспечивается качество звучания на уровне записи на компакт-диске. При использовании формата МР3 со сжатием 128 Кбит/с объем файла уменьшается в 10 раз.

При кодировании МР3 малый объем файла достигается благодаря отбрасыванию всех ненужных сведений. В частности, это касается всех сигналов, частота которых выходит за пределы стандартного диапазона, который слышит человеческое ухо; теоретически никакой разницы не должно быть слышно, хотя некоторые ценители звука утверждают, что они замечают отсутствие частот, которые человеческое ухо не должно слышать, что сказывается на восприятии звука.

Как бы то ни было, поскольку определенные данные отбрасываются, формат МР3 считается форматом, в котором применяется сжатие с потерей качества.

Для файлов МР3 можно задавать несколько значений сжатия. Большинство файлов кодируется с битовым потоком 128 Кбит/с. При 96 Кбит/с размер файлов становится меньше, однако при этом часто возникает дополнительный шум; сжатие 160 Кбит/с позволяет получить качество, практически неотличимое от качества записи на компакт-диске. Будущие версии МР3 возможно, будут базироваться на алгоритме сжатия MPEG-2 Advanced Audio Coding, который позволяет получать очень высокое качество звучания всего при 96 Кбит/с.

JPEG. Члены Объединенной группы экспертов в области фотографии (Joint Photographic Experts Group) создали формат JPEG для решения специфических проблем, связанных с отображением изображений в Интернет. При пересылке фотографических изображений по Интернет основная проблема состоит в больших размерах файла каждой фотографии. Размеры несжатых графических файлов обычно превышают 1 Мб. Поэтому Web-браузерам, подключенным к Интернет через модем 28,8 Кбод, потребовалось бы несколько минут на то, чтобы загрузить и отобразить одну-единственную картинку.

Формат JPEG разрешает эту проблему, существенно снижая размеры файлов фотоизображений. Уменьшение размеров файлов достигается путем выборочного удаления цветов из изображения и заменой недостающей цветовой информации смешиванием оставшихся цветов по шаблону растрирования. Шаблон растрирования использует два или более из оставшихся цветов графического изображения для получения третьего цвета. Процесс растрирования позволяет программе, сохраняющей изображение, сохранить три цвета, используя два пикселя вместо трех, что уменьшает размер файл изображения. Благодаря сокращению количества пикселей файлы, сохраненные с использованием формата JPEG, имеют намного меньшие размеры. Собственно говоря, размеры файлов JPEG-изображений обычно составляют 1/100 размера исходного файла.

Использование сокращения цветности для сохранения файла в формате JPEG называется сжатием с потерей информации. При публикации фотографий на Web-странице формат JPEG помогает поддерживать равновесие между качеством изображения и временем ожидания, необходимым для загрузки изображений с высоким разрешением.

GIF. Формат GIF (Graphic Interchange Format – формат графического обмена) представляет собой ещё один формат, который можно использовать для сжатия графических файлов, предназначенных для публикации в Интернет. Формат GIF наиболее эффективен при работе с аппликациями, логотипами и изображениями, содержащими много резких границ и мало цветов, - прямой противоположностью тем типам изображений, для которых наилучшее сжатие обеспечивает формат JPEG.

При сохранении цветного графического изображения с помощью формата GIF процесс сжатия снижает число битов, разрешенное для описания цвета в каждом пикселе в файле, с 24 бит до 8 бит. Следовательно, GIF-сжатие уменьшает максимальное количество цветов в файле с 16,7 млн. до 256. Если исходное цветное изображение содержит более 256 цветов, формат GIF сохраняет представительную выборку основных цветовых областей в таблице цветов исходного изображения и использует эту выборку для создания GIF-изображения. Поскольку фотографии обычно содержат тысячи, если не миллионы цветов, визуальный результат попытки сохранить фотографию в GIF-файле будет неудовлетворительным, равно как и приведет к созданию изображения с огромным размером файла.

Кроме того, что формат GIF делает файлы изображений меньше за счет уменьшения числа битов для описания каждого цвета в файле, он ещё использует специальную схему сжатия, при которой идентифицируются большие блоки сплошного цвета и фиксируется местоположение этих участков. При сохранении файла блоки сплошного цвета удаляются из изображения и заменяются координатами, или местоположением, исходного цвета. Загружая файл, Web-браузер восстанавливает блоки сплошного цвета с помощью ранее зафиксированных координат. Поскольку аппликации, логотипы и текст содержат большие области одного и того же цвета, формат GIF идеально подходит для сжатия файлов упомянутых типов изображений.

 

<== предыдущая лекция | следующая лекция ==>
Публикация Web-документов | Базовые требования к диспетчерам архивов
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 1485; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.02 сек.