Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Сведения о программной оболочке Norton Commander

8.4.

8.3.

Архивирование файлов

Понятие об архивировании информации появилось тогда, когда появился первый жесткий диск объемом 10 мегабайт. При перепадах напряжения в сети питания, работе над отладкой программ, любительских «экспериментах» с компьютером возникали логические ошибки файловой структуры диска, и вся содержащаяся на нем информация безвозвратно терялась. Поэтому вполне естественным было желание пользователей хоть как-то застраховать себя от потерь информации. Тогда появились первые программы резервного копирования (архивирования) информации на гибкие диски - дискеты.

И сразу же проявилась одна небольшая, но очень важная деталь: объем жесткого диска (10M) был в 30 раз больше, чем объем дискеты (360K). А учитывая, что чтение или запись дискеты занимает чуть больше полутора минут, то на копирование даже такого маленького винчестера уходил целый час. А ведь объемы жестких дисков стремительно росли - 20, 30, 40 мегабайт... Тогда в программы резервного копирования, помимо их основной функции - переписывания информации с жесткого на гибкие диски и обратно, стали встраивать сервисные функции по сжатию, уплотнению информации и последующей ее распаковке. Такая программа называлась «архиватор-упаковщик», а затем - просто архиватор.

Сегодня архиваторы - обычно отдельные программы, которые работают по тем или иным алгоритмам и очень эффективно сжимают (уплотняют, упаковывают) информацию, записанную в различных файлах. Каков же принцип их работы?

Сжатие информации представляет собой процесс обработки потока символов некоторого сообщения и перевода этих символов в некоторые коды. Если этот процесс организован эффективно, то полученное в результате кодированное сообщение занимает меньше места, чем исходное.

При просмотре обрабатываемого сообщения алгоритм сжатия реализует два независимых друг от друга процесса:

  • поддерживает модель обрабатываемого сообщения;
  • на основании модели кодирует очередной фрагмент сообщения.

Обычно весь процесс сжатия ошибочно отождествляется только с процессом кодирования, тогда как используя один и тот же метод кодирования и разные методы моделирования можно добиться различных результатов.

Немногие знают, что самому первому алгоритму сжатия передаваемой информации в 1987 году исполнилось 150 лет. Этот алгоритм обычно называют «азбука Морзе». При создании алфавита кодирования знаков препинания и букв английского алфавита перед Сэмюэлем Морзе стояла задача как можно более сократить время, необходимое на передачу сообщений по телеграфу - таким было главное условие конкурса, объявленного Департаментом почтовых служб США. Он поступил очень просто и в то же время гениально, подсчитав в типографии количество литер в наборных кассах для каждой буквы, цифры и знака препинания. Тем буквам, для которых в типографии было отведено больше литер - а значит, эти буквы встречались в словах чаще других,- он присвоил короткие коды своей азбуки (одна-две точки или тире), а редким - длинные (до шести). Задача сокращения времени была решена, а доказательством тому служит тот факт, что мы до сих пор пользуемся его телеграфной азбукой, а имена других конкурсантов сейчас уже никто и не помнит.

Теория кодирования и упаковки информации появилась сравнительно недавно - в конце сороковых годов, одновременно с зарождением самой теории информации. Тогда исследователи занимались вопросами энтропии, содержимого информации и избыточности (интересно, что эти первоначальные работы в области обработки информации велись еще до появления цифровых компьютеров). Сегодня теория информации развивается параллельно с программированием, но в то время идея разработки алгоритмов, использующих двоичную арифметику для кодирования символов, была значительным шагом вперед.

Первая работа в этой области -»Передача информации» - была опубликована еще в 1950 году. Ее написал Клод Шеннон, считающийся родоначальником современой теории обработки информации. В ней были затронуты вопросы создания алфавитов кодирования и алгоритмов кодирования информации. Вскоре после нее стали появляться все новые и новые публикации. В одной из них -»Передача информации. Статистическая теория связи», - написанной американским математиком Р. Фано, был опубликован первый математически исследованный и обоснованный алгоритм сжатия информации. Это был так называемый код Фано - модифицированный и обобщенный код Морзе. Этот код является простейшим из известных на сегодняшний день, но применяется крайне редко из-за невысокой эффективности.

Следующим этапом в развитии алгоритмов эффективного кодирования стал алгоритм, предложенный Д.А. Хаффменом в 1952 году. Идея алгоритма та же - символам с большей вероятностью встречаемости присваиваются более короткие коды,- но принцип построения иной.

Классический алгоритм Хаффмена на входе получает таблицу частот встречаемости символов в сообщении. Далее на основании этой таблицы строится дерево кодирования Хаффмена - Н-дерево (здесь и далее используются термины теории графов).

Кодирование Хаффмена используется во множестве программ - в коммерческих программах-архиваторах PKZIP, LHA, LHARC, ARJ, встроено в телефаксы (стандарта V32bis) и даже используется в алгоритме сжатия графической информации с потерями JPEG.

Развитие идей архивирования связано с исправлением того недостатка существовавших алгоритмов, что программы-архиваторы типа PKZIP, LHA, ARJ и т. д. предназначены для архивного сжатия, т.е. упакованными данными невозможно воспользоваться сразу же, их нужно сначала распаковать.

Первой ласточкой была версия архиватора PKZIP 2.15 (1987 год), позволившая создавать так называемые «самораспаковывающиеся архивы» (self-extracting archives). Файл архива имел расширение.ЕХЕ и состоял из двух частей - собственно сжатых данных и небольшого участка выполняемого кода, реализующего алгоритм распаковки данных на жесткий диск.

В последнее время в связи с появлением высокоскоростных процессоров все большее распространение получают так называемые дисковые компрессоры - драйверы устройств, сжимающие и разжимающие информацию при обращении к диску «на лету». Примером таких драйверов может служить программа DoubleSpace фирмы Microsoft или Stacker производства Stack Electronics.

Дальнейший путь развития программ сжатия информации - встраивание их в контроллеры дисков и изобретение новых высокоэффективных алгоритмов упаковки.

Сведения об архиваторе ARJ. Архиватор является одним из самым распространенных и отличается следующими положительными качествами:

  • отлично сокращает файлы, особенно базы данных, несжатые графические файлы и большие документы;
  • дает возможность создавать многотомные архивы, не требуя дополнительного места на жестком диске;
  • может создавать саморазархивируемые модули;
  • обеспечивает возможность сохранения пустых каталогов внутри архива, что позволяет делать полные резервные копии программного обеспечения, которые должны содержать пустые каталоги;
  • позволяет проверить архив в процессе его создания.

В качестве основных ограничений по использованию архиватора ARJ обычно называют:

  • для процесса сжатия ARJ требует не менее 290 Кбайт оперативной памяти;
  • для разархивирования файлов ARJ требует не менее 166 Кбайт оперативной памяти.

Примеры команд по использованию архиватора ARJ:

  • arj a ИМЯ - создание архива ИМЯ, содержащего все файлы текущего каталога. Команда «а» (от англ. add) означает «добавить» в архив. Расширение.arj добавляется к имени автоматически;
  • arj a ИМЯ *.doc - создание архива ИМЯ, содержащего все файлы с расширением.doc из текущего каталога;
  • arj a -r ИМЯ КАТАЛОГ*.* - создание архива, содержащего все файлы и подкаталоги из указанного каталога КАТАЛОГ;
  • arj y -je ИМЯ ИМЯ.exe - преобразование архива ИМЯ в полномасштабный саморазархивируемый модуль. В некоторых операционных системах может понадобиться для нормальной работы переименовать модуль ИМЯ.exe в ARJSFX.exe;
  • arj a a:ИМЯ *.* -b -r -v1440 - создание многотомного архива на дискетах емкостью 1440 Кбайт с автоматическим добавлением к имени каждого тома расширения соответственно его номеру, а именно.А01,.А02 и т. д. Здесь команда «b» позволяет выполнить по отношению к любому файлу архива команды DOS, команда «r» обеспечивает при архивировании просмотр всех подкаталогов, команда «v» (от англ. volum) задает режим многотомного архивирования;
  • arj d ИМЯ (или шаблон) - удаление файла с именем ИМЯ из архива. Команда «d» (от англ. delete) означает «удалить»;
  • arj e ИМЯ.arj - восстановление первоначального вида файла с именем ИМЯ, помещенного в архив. Здесь команда «e» (от англ. extend) означает «расширить»;
  • arj e ИМЯ КАТАЛОГ - извлечение всех файлов из архива ИМЯ в указанном каталоге;
  • arj e ИМЯ *.doc - извлечение из архива ИМЯ в текущий каталог всех файлов с расширением.doc;
  • arj x ИМЯ КАТАЛОГ - разархивирование всех файлов из архива ИМЯ с восстановлением первоначальной структуры КАТАЛОГа;
  • Rearj *.zip, *.arc, *.izh - преобразование всех архивов текущего каталога, созданных архиваторами zip, arc и izh, в формате arj.

В качестве других средств архивирования файлов при обработке издательской продукции следует назвать также программы типа WinZip, которые используют в графической среде Windows. У таких программ интерфейс пользователя значительно нагляднее и удобнее, чем в операционной системе MS DOS или программной оболочке Norton Commander. Это обеспечивается, в основном, достоинствами графических сред Windows 3.1 и Windows 95.

Например, следует отметить такие возможности программы WinZip, как:

  • просмотр любого файла, сохраненного в архиве, после его вызова в связанном приложении (обеспечивается двойным щелчком мыши по имени файла в архиве);
  • добавление, извлечение и удаление файлов из существующего архива с помощью пиктограмм.

Более подробно особенности работы в программе WinZip рассмотрены в данном учебном пособии в соответствующем разделе.

<== предыдущая лекция | следующая лекция ==>
Основные команды MS-DOS | Общие сведения. Norton Commander является интерактивной расширенной оболочкой дисковой операционной системы (DOS)
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 414; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.019 сек.