Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Понятие архивации




С того момента, как информация стала переводиться в электронную форму, технология породила процесс почти неконтролируемого роста объема электронных файлов. Причем увеличился объем не только операционной системы или пользовательских приложений, но также выросли и создаваемые этими программами рабочие файлы. Для решения этой проблемы были созданы специализированные программы для упаковки данных. Эти программы получили название программ архивации файлов.

Принцип работы архиватора состоит в следующем. Любой файл состоит из набора нулей и единиц. Предположим, есть некоторый набор данных: 1101101101110. Здесь наблюдается определенная закономерность: последовательность «110» повторяется четыре раза подряд. Значит, появляется возможность заменить вышеуказанный фрагмент следующей последовательностью: КЛЮЧ\повтор\повтор\повтор\. Где ключом обозначается 110, а символ повтора означает, что на его месте должен находиться ключ. Если условно считать, что повтор обозначается как 1, то исходный фрагмент преобразуется в 110111, и в результате из последовательности длиной двенадцать бит получится последовательность длиной в шесть бит. То есть применение кодирования позволило сжать исходный файл в два раза.

Таким образом техника сжатия (компрессии, упаковки) данных основана на замене повторяющихся последовательностей более короткими кодами и составлении таблицы соответствия, используемой в последующем для восстановления данных в первоначальном виде, то есть для их распаковки (декомпрессии) и архив делится на два компонента – таблицу соответствия и сжатые данные. В действительности архив еще содержит заголовок со служебной информацией, в том числе со справочником, описывающим сжатые файлы.

Дополнительный выигрыш памяти достигается еще и благодаря устранению пустот в «хвостовых» кластерах сжимаемых файлов, поскольку все их содержимое помещается в единственный файл.

Очевидно, что одни файлы сжимаются лучше, другие – хуже. В частности, текстовые файлы упаковываются намного лучше программных, так как в текстовых файлах часто встречаются одинаковые слова и в тексте много пустот.

Сжатие компонентов файловых структур и их распаковка выполняется специальными программами, называемыми соответственно архиваторами и разархиваторами. Поэтому процессы сжатия и распаковки файлов часто называют архивацией и разархивацией. Типовые функции программ архиваторов следующие:

1. помещение исходных файлов в архив,

2. извлечение файлов из архива,

3. удаление файлов из архива,

4. просмотр оглавления архива,

5. проверка архива.

Поскольку назначение программ-архиваторов – экономить место на диске за счет сжатия одного или нескольких исходных файлов в архивный файл, то программы-архиваторы используются в случаях:

1. наличия на дисках компьютера больших объемов информации, которая понадобится только в будущем;

2. переноса между компьютерами наборов данных с помощью дискет;

3. создания резервных копий файлов в сжатом виде.

В результате работы программ-архиваторов создаются архивные файлы (архивы).

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве. В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:

1. имя файла,

2. сведения о папке, в которой содержится файл,

3. дата и время последней модификации файла;

4. размер файла на диске и в архиве,

5. код циклического контроля для каждого файла, используемый для проверки целостности архива.

Хранение информации в архиве более надежно, чем в исходном виде: из-за того, что данные хранятся в сжатом виде, меньше вероятность их случайного повреждения. Более того, свой архив пользователь может защитить с помощью пароля. Это обеспечивает более надежное хранение информации пользователя.

В архив обычно помещают несколько файлов и даже несколько поддеревьев файловой структуры. Выигрыш во внешней памяти при этом может составить 100% и более. Но отмеченное обстоятельство – не единственное преимущество архивации. По крайней мере еще одно заключается в том, что в результате архивации с группой взаимосвязанных файлов можно будет работать как с единым целым.

В настоящее время при характеристике программ-архиваторов используются такие показатели эффективности как; плотность упаковки, время упаковки и др.

Один из самых важных параметров – плотность упаковки. Иными словами, один и тот же объем одних и тех же неупакованных файлов различными архиваторами сжимается в разной степени. Алгоритм должен не только найти закономерности в потоке бит, но и выделить все возможные варианты исходя из подхода к выбору минимальной длины ключа.

Вторым важнейшим показателем эффективности архиватора является время упаковки или распаковки. Любой самый эффективный алгоритм зависит от того, какие данные он будет упаковывать. Текстовые файлы сжимаются значительно сильнее, чем, например, фотография или музыкальная запись.

По мере совершенствования алгоритмов сжатия среди всего многообразия применявшихся программ-архиваторов сформировался список лидеров. Среди них оказались архиваторы: ZIP, RAR, ARJ и др.

Достаточно сложно определять, какая из программ-архиваторов является самой лучшей. Во-первых, различия в эффективности их применения заметно проявляются лишь при архивации больших объемов, порядка нескольких сотен мегабайт, однородных файлов. На практике же гораздо чаще архивации подвергаются разнородные данные.

При выборе архиватора прежде всего следует руководствоваться следующими критериями.

· Какой тип архивов уже существует в рамках той рабочей группы, в которой вам предстоит взаимодействовать.

· Какие объемы информации предполагается сжимать.

· Какой тип данных среди архивируемой информации преобладает.

· И последним элементом, по которому следует оценить архиватор перед выбором, это удобство его интерфейса, поскольку именно вам придется постоянно общаться с этой программой.

 




Поделиться с друзьями:


Дата добавления: 2015-07-13; Просмотров: 1436; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.