Кто же такой Сисадмин

Тема 2.1 Работа с файлами

1. Архиваторы и архивация.

2. Просмотр архивного файла в формате ZIP .

Проблема сжатия данных существует давно, с момента появления компьютеров. Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа. Эти и другие вопросы решаемы при помощи мощных и функциональных программ-архиваторов, разработчики которых предлагают пользователям различные методы для обработки данных. Причем, архиваторы могут быть как бесплатными, так и коммерческими, а их выбор зависит от требований, которые пользователь предъявляет к программе по работе с заданными файлами. Из числа наиболее популярных программ можно выделить: WinRAR (коммерческая версия) и 7-Zip (бесплатная программа).

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.


Архиваторы - это программы, реализующие процесс архивации, позволяющие создавать и распаковывать архивы
Архивация - это сжатие, уплотнение, упаковка информации.
Разархивация - процесс восстановления фай лов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помеща ются на диск.
Степень сжатия файла характеризуется коэффициентом сжатия K c , который определяется как отношение объема сжатого файла V c к объему исходного файла V o , выраженное в %:

Научимся создавать архивы с помощью программы WinRar.


После загрузки программы мы видим стандартное окно с понятным интерфейсом.

Добавить – позволяет как заархивировать выбранные файлы, так и добавить их в уже существующий архив.

Просмотр – показывает содержимое файла.

Удалить – удаляет выбранный файл / группу файлов.

Исправить – восстанавливает испорченный архив.

Оценить – даёт приближенную оценку к архивации выбранного файла /группы файлов.

Извлечь в – позволяет указать путь разархивации.

Тест – тестирует выбранный архив на наличие ошибок.

Для архивации файла или группы файлов, выделяем их и щелкаем по кнопке добавить.


При создании архива необходимо задать имя архива, если архив создаётся в текущей папке


или место его сохранения.


При создании архива можно выбрать формат архивации RAR или ZIP

При создании архива можно выбрать метод сжатия

Максимальный метод обеспечивает наиболее высокую степень сжатия, но с наименьшей скоростью. Напротив, скоростной сжимает плохо, но быстро. Метод без сжатия помещает файлы в архив без их упаковки. Для передачи по компьютерным сетям или для долговременного хранения, имеет смысл выбрать метод максимальный для получения наилучшего сжатия. Для ежедневной резервной копии чаще всего используется обычный метод.

Многотомные архивы.

Е сли исходный файл, предназначенный для передачи через Интернет, имеет очень большой размер, то передать его через сеть по этой причине, бывает просто невозможно. Чтобы это стало возможным, такой файл во время сжатия «нарезается» на фрагменты, каждый из которых называется архивным томом. В итоге, получается, допустим,10 томов, которые закачиваются по очереди. Такой архив называется многотомным. При распаковке первого фрагмента все остальные распаковываются автоматически, и пользователь получает исходный файл в своём первоначальном виде.


Самораспаковывающийся архив.

Для разархивации такого архива не нужна специальная программа, достаточно запустить файл архива на выполнение, так как он является исполняемым файлом.


Есть возможность установить пароль.

Для извлечения файлов из архива воспользуемся кнопкой «извлечь», укажем путь и параметры для извлечения.


Практическая работа:

1. Откройте папку Мой архив.

2. Заархивируйте каждый файл

3. Определите степень сжатия

4. Исследуйте изменение объема исходных файлов и полученных архивов.

5. Запишите результаты в таблицу.

№ п/п

Имя файла

Тип файла

Исходный размер

Размер архивного файла

Степень сжатия

Вывод о степени сжатия файлов разного типа --__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

  • Перевод

Часть первая – историческая .

Введение

Существующие алгоритмы сжатия данных можно разделить на два больших класса – с потерями, и без. Алгоритмы с потерями обычно применяются для сжатия изображений и аудио. Эти алгоритмы позволяют достичь больших степеней сжатия благодаря избирательной потере качества. Однако, по определению, восстановить первоначальные данные из сжатого результата невозможно.
Алгоритмы сжатия без потерь применяются для уменьшения размера данных, и работают таким образом, что возможно восстановить данные в точности такими, какие они были до сжатия. Они применяются в коммуникациях, архиваторах и некоторых алгоритмах сжатии аудио и графической информации. Далее мы рассмотрим только алгоритмы сжатия без потерь.
Основной принцип алгоритмов сжатия базируется на том, что в любом файле, содержащем неслучайные данные, информация частично повторяется. Используя статистические математические модели можно определить вероятность повторения определённой комбинации символов. После этого можно создать коды, обозначающие выбранные фразы, и назначить самым часто повторяющимся фразам самые короткие коды. Для этого используются разные техники, например: энтропийное кодирование, кодирование повторов, и сжатие при помощи словаря. С их помощью 8-битный символ, или целая строка, могут быть заменены всего лишь несколькими битами, устраняя таким образом излишнюю информацию.

История

Иерархия алгоритмов:

Хотя сжатие данных получило широкое распространение вместе с интернетом и после изобретения алгоритмов Лемпелем и Зивом (алгоритмы LZ), можно привести несколько более ранних примеров сжатия. Морзе, изобретая свой код в 1838 году, разумно назначил самым часто используемым буквам в английском языке, “e” и “t”, самые короткие последовательности (точка и тире соотв.). Вскоре после появления мейнфреймов в 1949 году был придуман алгоритм Шеннона - Фано, который назначал символам в блоке данных коды, основываясь на вероятности их появления в блоке. Вероятность появления символа в блоке была обратно пропорциональна длине кода, что позволяло сжать представление данных.
Дэвид Хаффман был студентом в классе у Роберта Фано и в качестве учебной работы выбрал поиск улучшенного метода бинарного кодирования данных. В результате ему удалось улучшить алгоритм Шеннона-Фано.
Ранние версии алгоритмов Шеннона-Фано и Хаффмана использовали заранее определённые коды. Позже для этого стали использовать коды, созданные динамически на основе данных, предназначаемых для сжатия. В 1977 году Лемпель и Зив опубликовали свой алгоритм LZ77, основанный на использования динамически создаваемого словаря (его ещё называют «скользящим окном»). В 78 году они опубликовали алгоритм LZ78, который сначала парсит данные и создаёт словарь, вместо того, чтобы создавать его динамически.

Проблемы с правами

Алгоритмы LZ77 и LZ78 получили большую популярность и вызвали волну улучшателей, из которых до наших дней дожили DEFLATE, LZMA и LZX. Большинство популярных алгоритмов основаны на LZ77, потому что производный от LZ78 алгоритм LZW был запатентован компанией Unisys в 1984 году, после чего они начали троллить всех и каждого, включая даже случаи использования изображений в формате GIF. В это время на UNIX использовали вариацию алгоритма LZW под названием LZC, и из-за проблем с правами их использование пришлось сворачивать. Предпочтение отдали алгоритму DEFLATE (gzip) и преобразованию Барроуза - Уилера, BWT (bzip2). Что было и к лучшему, так как эти алгоритмы почти всегда превосходят по сжатию LZW.
К 2003 году срок патента истёк, но поезд уже ушёл и алгоритм LZW сохранился, пожалуй, только в файлах GIF. Доминирующими являются алгоритмы на основе LZ77.
В 1993 году была ещё одна битва патентов – когда компания Stac Electronics обнаружила, что разработанный ею алгоритм LZS используется компанией Microsoft в программе для сжатия дисков, поставлявшейся с MS-DOS 6.0. Stac Electronics подала в суд и им удалось выиграть дело, в результате чего они получили более $100 миллионов.

Рост популярности Deflate

Большие корпорации использовали алгоритмы сжатия для хранения всё увеличивавшихся массивов данных, но истинное распространение алгоритмов произошло с рождением интернета в конце 80-х. Пропускная способность каналов была чрезвычайно узкой. Для сжатия данных, передаваемых по сети, были придуманы форматы ZIP, GIF и PNG.
Том Хендерсон придумал и выпустил первый коммерчески успешный архиватор ARC в 1985 году (компания System Enhancement Associates). ARC была популярной среди пользователей BBS, т.к. она одна из первых могла сжимать несколько файлов в архив, к тому же исходники её были открыты. ARC использовала модифицированный алгоритм LZW.
Фил Катц, вдохновлённый популярностью ARC, выпустил программу PKARC в формате shareware, в которой улучшил алгоритмы сжатия, переписав их на Ассемблере. Однако, был засужен Хендерсоном и был признан виновным. PKARC настолько открыто копировала ARC, что иногда даже повторялись опечатки в комментариях к исходному коду.
Но Фил Катц не растерялся, и в 1989 году сильно изменил архиватор и выпустил PKZIP. После того, как его атаковали уже в связи с патентом на алгоритм LZW, он изменил и базовый алгоритм на новый, под названием IMPLODE. Вновь формат был заменён в 1993 году с выходом PKZIP 2.0, и заменой стал DEFLATE. Среди новых возможностей была функция разбиения архива на тома. Эта версия до сих пор повсеместно используется, несмотря на почтенный возраст.
Формат изображений GIF (Graphics Interchange Format) был создан компанией CompuServe в 1987. Как известно, формат поддерживает сжатие изображения без потерь, и ограничен палитрой в 256 цветов. Несмотря на все потуги Unisys, ей не удалось остановить распространение этого формата. Он до сих пор популярен, особенно в связи с поддержкой анимации.
Слегка взволнованная патентными проблемами, компания CompuServe в 1994 году выпустила формат Portable Network Graphics (PNG). Как и ZIP, она использовала новый модный алгоритм DEFLATE. Хотя DEFLATE был запатентован Катцем, он не стал предъявлять никаких претензий.
Сейчас это самый популярный алгоритм сжатия. Кроме PNG и ZIP он используется в gzip, HTTP, SSL и других технологиях передачи данных.

К сожалению Фил Катц не дожил до триумфа DEFLATE, он умер от алкоголизма в 2000 году в возрасте 37 лет. Граждане – чрезмерное употребление алкоголя опасно для вашего здоровья! Вы можете не дожить до своего триумфа!

Современные архиваторы

ZIP царствовал безраздельно до середины 90-х, однако в 1993 году простой русский гений Евгений Рошал придумал свой формат и алгоритм RAR. Последние его версии основаны на алгоритмах PPM и LZSS. Сейчас ZIP, пожалуй, самый распространённый из форматов, RAR – до недавнего времени был стандартом для распространения различного малолегального контента через интернет (благодаря увеличению пропускной способности всё чаще файлы распространяются без архивации), а 7zip используется как формат с наилучшим сжатием при приемлемом времени работы. В мире UNIX используется связка tar + gzip (gzip - архиватор, а tar объединяет несколько файлов в один, т.к. gzip этого не умеет).

Прим. перев. Лично я, кроме перечисленных, сталкивался ещё с архиватором ARJ (Archived by Robert Jung), который был популярен в 90-х в эру BBS. Он поддерживал многотомные архивы, и так же, как после него RAR, использовался для распространения игр и прочего вареза. Ещё был архиватор HA от Harri Hirvola, который использовал сжатие HSC (не нашёл внятных объяснений - только «модель ограниченного контекста и арифметическое кодирование»), который хорошо справлялся со сжатием длинных текстовых файлов.

В 1996 году появился вариант алгоритма BWT с открытыми исходниками bzip2, и быстро приобрёл популярность. В 1999 году появилась программа 7-zip с форматом 7z. По сжатию она соперничает с RAR, её преимуществом является открытость, а также возможность выбора между алгоритмами bzip2, LZMA, LZMA2 и PPMd.
В 2002 году появился ещё один архиватор, PAQ. Автор Мэтт Махоуни использовал улучшенную версию алгоритма PPM с использованием техники под названием «контекстное смешивание». Она позволяет использовать больше одной статистической модели, чтобы улучшить предсказание по частоте появления символов.

Будущее алгоритмов сжатия

Конечно, бог его знает, но судя по всему, алгоритм PAQ набирает популярность благодаря очень хорошей степени сжатия (хотя и работает он очень медленно). Но благодаря увеличению быстродействия компьютеров скорость работы становится менее критичной.
С другой стороны, алгоритм Лемпеля-Зива –Маркова LZMA представляет собой компромисс между скоростью и степенью сжатия и может породить много интересных ответвлений.
Ещё одна интересная технология «substring enumeration» или CSE, которая пока мало используется в программах.

В следующей части мы рассмотрим техническую сторону упомянутых алгоритмов и принципы их работы.

Как все начиналосьКогда компакт-диски еще не получили такого распространения и единственными носителями информации с одного компьютера на другой, а также для резервного копирования, были дискеты, возникла потребность в программах, которые бы сжимали информацию, чтобы она занимала меньше места и сохраняли бы ее в одном или нескольких файлах для переноса на дискетах. Так возникли архиваторы.
Как уже было отмечено, архиваторы в основном использовались для резервного копирования и переноса информации. При хранении копий файлов в сжатом виде они занимают меньше места, к тому же удобнее оперировать с одним или несколькими файлами, чем с большим количеством файлов и директорий. Не потеряли архиваторы актуальности и теперь, однако требования, предъявляемые пользователям к этой категории программных продуктов, существенно изменились. Если раньше едва ли не самым важным было требование по максимальному сжатию информации, хотя бы в силу дороговизны на тот момент носителей информации - в первую очередь распространялись архиваторы, удовлетворяющие именно этому требованию, то теперь ситуация значительно изменилась и на первое место встают простота и удобство в использовании.
Еще одним немаловажным требованием, предъявляемым к архиваторам при переносе информации, была его распространенность, т. е. чтобы при передаче информации не приходилось в придачу передавать и сам архиватор.
За годы с момента возникновения первой программы данного типа написаны сотни различных архиваторов, поддерживающих различные форматы архивов. На момент становления и развития архиваторов самым распространенным форматом был ARJ, на втором месте почти сразу за ним ZIP, с некоторым отрывом следовали такие архиваторы, как ARC, ACE, LZH. На данный момент ситуация значительно изменилась. Первое место среди форматов архиваторов занимает ZIP, отвоевав его у ARJ, который отошел теперь на задний план, на втором месте RAR и со значительным отрывом следуют ACE, ARJ и другие менее популярные форматы.
Таким образом, в нашем обзоре нас интересуют в первую очередь архиваторы самых распространенных форматов:


ZIP - формат был разработан PKWARE .

RAR - формат был разработан Евгением Рошалем, автором одноименного архиватора и благодаря удобному интерфейсу архиватора одновременно с хорошим сжатием завоевал популярность.

Описания архиваторов

WinZip

Последняя финальная версия WinZip 8.1

WinZip - наверное, самый популярный архиватор, имеет встроенную поддержку разархивирования.CAB-файлов и файлов популярных "интернет-форматов", таких как TAR, GZip, UUencode, BinHex и MIME. Разархивирование файлов ARJ, LZH и ARC поддерживается через соответствующие архиваторы. WinZip прост и удобен в работе, имеет интуитивно понятный интерфейс, позволяющий даже начинающим пользователям работать с ним без подготовки. К программе можно подключить внешний антивирус для проверки файлов архивов на вирусы. Архиватор может работать в двух стилях: Wizard (мастер, помощник) Classic (стандартный, классический). Стиль Wizard - для тех, кто еще не освоился с архиватором или любит работать пошагово, отвечая на соответствующие вопросы программы.


Поддержка перетаскивания файлов в/из архива, а также интеграция с проводником, делают WinZip очень удобным в работе архиватором. По нажатию правой кнопки мыши в проводнике вызывается контекстно-зависимое меню, настраиваемое в опциях. Пункты меню позволяют добавить файлы в архив, создать новый архив, разархивировать файлы из архива, создать самораспаковывающийся архив, заархивировать файлы и отправить по электронной почте, использую установленный по умолчанию почтовый клиент.


Если файл, на котором нажимают кнопку, является ZIP-архивом, то меню в проводнике будет выглядеть так:


По умолчанию WinZip ассоциирует себя со следующими расширениями файлов:


WinZip поддерживает создание многотомных архивов.

К программе можно скачать дополнения:

WinZip Command Line Support Add-On - для работы с архивами из командной строки.

WinZip Internet Browser Support Add-On - для упрощения скачивания архивов из Интернет, их распаковки и инсталляции программ. Архив автоматически скачивается в указанную в настройках директорию и по окончании открывается в WinZip"е.

WinZip Self-Extractor - для создания самораспаковывающихся архивов. WinZip Self-Extractor, хотя и может работать как дополнение к WinZip, является самостоятельным программным продуктом. Начиная с версии 8.0 в WinZip для создания самораспаковывающихся архивов встроен WinZip Self-Extractor Personal Edition с несколько ограниченными, по сравнению с WinZip Self-Extractor возможностями.

Наверное, второй по популярности архиватор после WinZip, а в России наверняка даже его опережает. Последняя финальная версия - WinRAR 2.90


WinRAR работает в Windows 9x/ME/NT/2000/XP. Существует консольная версия Rar, а также версии для Linux, BeOS, DOS, OS/2 и различных платформ Unix. WinRAR доступен на многих языках, в том числе на русском. Автор программы - Евгений Рошал из Челябинска.
В программе реализован оригинальный алгоритм компрессии, позволяющий хорошо сжимать файлы, особенно выполняемые, библиотеки и большие текстовые файлы, а также специальный алгоритм для сжатия мультимедиа-файлов.
Полностью поддерживается формат ZIP, а также основные операции (просмотр содержимого, распаковка, показ комментариев и информации об архивах) для файлов CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2 и JAR.


Поддерживается возможность создания непрерывных (solid) архивов, с увеличением степени сжатия на 10-50%, особенно для большого количества файлов; создания многотомных и самораспаковывающихся архивов. WinRAR интегрируется в проводник, при нажатии правой кнопкой мыши на поддерживаемом типе архива возникает контекстное меню:


А при выделении других файлов (и директорий) - меню для добавления файлов в архив (для запуска WinRAR и уточнения параметров) и меню для создания из выбранных файлов и директорий архива RAR.
WinRAR также позволяет защищать архивы от повреждений, путем сохранения избыточной информации, закрывать архивы от изменений, архивировать с паролем, а также добавлять в архивы комментарий (с поддержкой ESC-последовательностей ANSI) и запись о создателе (только для зарегистрированных пользователей).

PowerArchiver 2001

Последняя версия - PowerArchiver 2001 7.02.08


Встроенная полная поддержка файлов ZIP, CAB, LHA (LZH), TAR, TAR.GZ, TAR.BZ2 и BH (BlakHole), а также XXE и UUE файлов. Встроенная поддержка для разархивации файлов RAR, ARJ, ARC, ACE, ZOO, GZ и BZIP2. Встроенное внутреннее средство просмотра файлов TXT, RTF, BMP, ICO, WMF, EMF, GIF и JPG. Поддержка скинов . Возможность печати списка файлов в архиве или экспорта списка в файлы формата TXT или HTML. Поддержка перетаскивания файлов в/из архивов. Имеются полезные возможности по выполнению резервного копирования с использованием собственных скриптов, возможность разархивации сразу нескольких архивов, починка поврежденного архива (только для ZIP), создание многотомного ZIP-архива из целого архива и наоборот, встроенная функция определения типа архива. Возможность подключения внешнего антивируса. Две модели просмотра архивов - классическая и по типу проводника, с двумя разделенными горизонтально окошками и показом древовидной структуры. По количеству встроенных возможностей программа опережает своих конкурентов, за счет чего она довольно быстро завоевала популярность среди пользователей.

Интеграция в проводник с настраиваемым меню:


На архивных файлах всплывающее по нажатию правой кнопки мыши меню выглядит следующим образом.


А такой вид оно имеет при нажатии и выделении на файлах других форматов.


Дополнения к программе:

Поддержка параметров командной строки - PowerArchiver Command Line Support Add-On или PowerArchiver Command Line .

Для создания самораспаковывающихся архивов - PowerArchiver SFX Maker Add-On , автор Давид Корниш.

Тем, кто хочет сам создавать скины, поможет PowerArchiver Toolbar-ImageList Creator .

WinAce

На данный момент последней является версия WinAce 2.11


Архивация в следующие форматы: ACE, ZIP, LHA, MS-CAB, JAVA JAR.


Разархивация форматов ACE, ZIP, LHA, MS-CAB, RAR, ARC, ARJ, GZip, TAR, ZOO, JAR. Поддержка многотомных архивов для файлов форматов ACE, ZIP, CAB. Создание самораспаковывающихся архивов, а также восстановление архивов для файлов ACE и ZIP. Доступ из командной строки. Встроенное средство просмотра документов Word, HTML, текстовых файлов и основных графических форматов: TIFF (*.tif; *.tiff), Photoshop (*.psd, *.pdd), Paintshop Pro (*.psp), *.png (Portable network graphic), GIF, BMP, Standard Windows bitmap (*.bmp, *.rle, *.dib), *.ico, SGI (*.bw, *.rgb, *.rgba, *.sgi), Autodesk (*.cel; *.pic), Truevision (*.tga; *.vst; *.icb; *.vda; *.win), ZSoft Paintbrush (*.pcx, *.pcc), копии экрана Word 5.x (*.scr), Kodak Photo-CD (*.pcd), Portable pixel/gray map (*.ppm, *.pgm, *.pbm), Dr. Halo (*.cut, *.pal), SGI Wavefront (*.rla, *.rpf) и GFI факс (*.fax). Функция оптимизации существующих архивов. Интеграция с проводником: наличие всплывающих контекстных меню по нажатию правой кнопки мыши и дополнительная закладка при просмотре свойств файлов (только для архивов ACE и ZIP).



Формат ACE часто используется при обменами файлов на ряде каналов IRC-серверов.

7-Zip

Последняя доступная на данный момент версия - 7-Zip 2.30 Beta 12 .


Это сравнительно мало известный архиватор, обеспечивающий довольно высокую степень сжатия для формата ZIP и имеющий также свой формат 7z с высокой степенью сжатия. Ко всему прочему, 7-Zip является бесплатным. В данный обзор он попал для того, чтобы показать, что наиболее популярные архиваторы, перечисленные выше, не всегда являются лидерами по максимальному сжатию.
Итак, архиватор полностью поддерживает форматы ZIP, GZIP, BZIP2, TAR, 7z, обеспечивает разархивацию файлов формата RAR, CAB. Возможна работа из командной строки. Интегрируется в проводник, добавляя простое меню из трех пунктов:

Сравнение функциональных возможностей

Поддержка форматов и другие возможности

Формат, функция WinZIP 8.1 WinRAR 2.90 PowerArchiver 2001 7.02.08 WinAce Archiver 2.04 7-Zip 2.30 Beta 12
ZIP Полная Полная Полная Полная Полная
RAR Нет Полная Распаковка Распаковка Распаковка
ACE Нет Распаковка Распаковка Полная Нет
Gzip Распаковка Распаковка Распаковка Распаковка Полная
CAB Распаковка Распаковка Полная Полная Распаковка
TAR Распаковка Распаковка Полная Распаковка Полная
LZH Внешняя Распаковка Полная Полная Нет
ARJ Внешняя Распаковка Распаковка Нет Нет
BZ2 Нет Распаковка Распаковка Нет Полная
JAR Нет Распаковка Нет Распаковка Нет
BH Нет Нет Полная Нет Нет
ARC Нет Нет Нет Распаковка Нет
ZOO Нет Нет Нет Распаковка Нет
UUE Распаковка Распаковка Полная Нет Нет
Другие XXe, BinHex, MIME - XXE - 7z
Поддержка многотомных архивов ZIP RAR ZIP ACE, ZIP, CAB Нет
Поддержка создания Solid архивов Нет RAR Нет ACE 7z
Поддержка AV-записи Нет RAR Нет ACE Нет
Встроенная Windows Windows и DOS Windows Windows и DOS Windows
Поддержка внешнего антивируса Да Нет Да Да Нет
Поддержка Drag&Drop Да Да Да Да Нет
Поддержка работы в командной строке через WinZip Command Line Support Add-On Полная Основные операции. Полная - через PowerArchiver Command Line Support Add-On Полная Полная
Поддержка комментариев в архивах ASCII для ZIP ASCII и ANSI для RAR и ZIP ASCII для ZIP ASCII, ANSI и HTML Нет

Тестирование

Целью данного тестирования было получение не абсолютного значения времени сжатия, а относительное сравнение скорости степени сжатия участвовавших в тестировании архиваторов. Степень сжатия: размер исходного файла (набора файлов) принимался за 100%, в таблице в процентах указан объём получившегося поле компрессии архива по отношению к исходному файлу (набору файлов).

Тестирование проводилось на системе следующей конфигурации:

Процесор Intel Celeron 450MHz
HDD Fujitsu 20Gb
256Mb RAM
Windows 98 SE

2017 .EXE и.DLL-файлов, объём 462,326,078 байт

Программа архивации Опции Метод сжатия Формат архива Время архивации, мин:сек Размер архива, байт Степень сжатия
WinRAR 2.90 Dictionary size 1024KB Best RAR 16:57 185,829,854 40.19 %
WinRAR 2.90 Best RAR 32:40:00 174,505,219 37.75 %
WinRAR 2.90 Best ZIP 12:29 201,984,371 43.69 %
WinZIP 8.1 Maximum ZIP 16:10 202,072,691 43.71 %
7-Zip 2.30 Beta 12 Maximum ZIP 29:37:00 196,345,086 42.47 %
7-Zip 2.30 Beta 12 Maximum 7Z 29:10:00 169,185,782 36.59 %
WinAce Archiver 2.04 Maximum ZIP 15:21 196,345,096 42.47 %
WinAce Archiver 2.04 Solid, Maximum ACE 2.0 20:34 160,158,266 34.65 %
WinAce Archiver 2.04 Dictionary size 4096KB, optimized exe compression Maximum ACE 2.0 18:32 176,050,278 38.08 %
WinAce Archiver 2.04 Dictionary size 4096KB Maximum ACE 18:21 183,747,786 39.74 %
PowerArchiver 2001 7.02.08 Maximum ZIP 14:13 201,838,065 43.66 %

521 файл в формате Word, объём 32,175,596 байт

Программа архивации Опции Метод сжатия Формат архива Время архивации, мин:сек Размер архива, байт Степень сжатия
WinRAR 2.90 Dictionary size 1024KB Best RAR 1:14 8,068,122 25.08 %
WinRAR 2.90 Solid, Dictionary size 1024KB Best RAR 1:30 5,538,095 17.21 %
WinRAR 2.90 Best ZIP 1:03 9,462,371 29.43 %
WinZIP 8.1 Maximum ZIP 1:29 9,470,530 29.43 %
7-Zip 2.30 Beta 12 Maximum ZIP 2:22 9,087,254 28.24 %
7-Zip 2.30 Beta 12 Maximum 7Z 2:05 7,302,364 22.70 %
7-Zip 2.30 Beta 12 Solid Maximum 7Z 2:04 4,717,281 14.66 %
WinAce Archiver 2.04 Maximum ZIP 1:11 9,470,116 29.43 %
WinAce Archiver 2.04 Maximum ACE 2.0 1:28 5,245,381 16.30 %
WinAce Archiver 2.04 Dictionary size 4096KB, optimized exe compression Maximum ACE 2.0 1:21 7,963,681 24.75 %
WinAce Archiver 2.04 Dictionary size 4096KB Maximum ACE 1:17 8,060,489 25.05 %
WinAce Archiver 2.04 Maximum ACE 1:24 5,309,725 16.50 %
PowerArchiver 2001 7.02.08 Maximum ZIP 1:01 9,458,970 29.40 %

ZIP 1:53 48,639,712 97.28 %
7-Zip 2.30 Beta 12 Maximum 7Z 3:57 48,555,679 97.11 %
WinAce Archiver 2.04 Maximum ZIP 1:11 48,452,915 96.90 %
WinAce Archiver 2.04 Dictionary size 4096KB,optimized exe compression Maximum ACE 2.0 3:08 48,571,875 97.14 %
WinAce Archiver 2.04 Dictionary size 4096KB Maximum ACE 3:08 48,571,875 97.14 %
PowerArchiver 2001 7.02.08 Maximum ZIP 0:51 48,452,892 WinZIP 8.1 Maximum ZIP 5:42 7,056,986 21.93 %
7-Zip 2.30 Beta 12 Maximum ZIP 4:36 7,041,872 21.89 %
7-Zip 2.30 Beta 12 Maximum 7Z 9:59 5,824,793 18.10 %
7-Zip 2.30 Beta 12 Solid Maximum 7Z 4:17 4,227,902 13.14 %
WinAce Archiver 2.04 Maximum ZIP 5:32 7,098,841 22.06 %
WinAce Archiver 2.04 Solid, Dictionary size 4096KB, delta compression Maximum ACE 2.0 7:14 5,152,231 16.01 %
WinAce Archiver 2.04 Dictionary size 4096KB, optimized exe compression Maximum ACE 2.0 16:55 6,353,898 19.75 %
WinAce Archiver 2.04 Dictionary size 4096KB Maximum ACE 16:53 6,388,514 19.86 %
WinAce Archiver 2.04 Solid, Dictionary size 4096KB, optimized exe compression Maximum ACE 7:15 5,164,797 16.05 %
PowerArchiver 2001 7.02.08 Maximum ZIP 5:26 7,089,947 22.04 %

Выводы

По результатам обзора:



Самыми распространенными на сегодняшний день форматами архивов являются ZIP, RAR, Gzip, TAR. Следовательно, архиватор, желающий стать популярным должен по возможности поддерживать эти форматы.

Самыми распространенными на сегодняшний день являются архиваторы, которые предоставляют пользователю максимальное удобство и легкость в работе и обеспечивают выполнение необходимых пользователю функций. Степень сжатия информации на сегодняшний день отошла для пользователей на второй план.

По результатам тестирования:



Если брать только популярные форматы, то при архивации в формат ZIP для достижения наименьшего времени архивации рекомендуется использовать архиваторы WinRAR и PowerArchiver, для создания наименьшего архива - 7-Zip; исполняемые файлы лучше всего сжимает WinAce; документы Word лучше всего сжимать WinAce и WinRAR; с большим количеством маленьких файлов лучше всего справился WinRAR.

Опция Solid для создания непрерывных архивов, доступная в некоторых архиваторах помогает при сжатии большого количества файлов, уменьшая объем архивов и значительно уменьшая время сжатия (хотя при небольшом количестве файлов время архивации с использованием этой опции увеличивается).
Кроме известных архиваторов и форматов архивов существует большое количество менее известных архиваторов, поддерживающих свои форматы, которые в некоторых случаях по своим характеристикам, в частности по степени сжатия могут превосходить своих известных собратьев. Примером этому может служить архиватор 7-Zip со своим форматом 7z, который выиграл по степени сжатия почти все тесты.

Архивация файлов, назначение, виды и основные возможности архиваторов.

Алгоритмы и методы архивации

Существуют различные алгоритмы архивации данных без потери информации, при которых при разархивации данные будут восстановлены в исходном виде.

Самый простой алгоритм сжатия данных (running) основан на замене повторяющихся битов (в тексте может иметься последовательность одинаковых символов, в графическом файле − закрашенная одним цветом область и так далее). Например , в тексте подряд идут 10 пробелов, которые кодируются 10-ю байтами. При архивации они заменяются 3-мя байтами (первый байт − кодирует заменяемый символ; второй байт − специальный байт «флажка» архивации, который указывает на необходимость развернуть первый байт в последовательность байтов; третий байт указывает количество повторяющихся байтов).

Алгоритм кодирования одинаковых последовательностей символов (LZW) ищет в текстовых файлах одинаковые слова, а в графических − одинаковые «узоры». Каждый такой фрагмент файла представляется определенным кодом (последовательностью бит) и в процессе архивации при повторных появлениях заменяется ссылкой на первичный код.

Существуют различные методы архивации файлов (ZIP, RAR, ARJ и др.), которые используют вышеописанные и другие алгоритмы архивации.

Методы архивации различаются степенью сжатия файлов, скоростью выполнения и другими параметрами. Лучше всего сжимаются текстовые и графические файлы и практически не сжимаются файлы архивов.


Программы-архиваторы.

Зачем нужны архиваторы; \

Какой архиватор лучше;

Архиватор ZIP:

Архивирование в Total Commander;

Архиватор WinRar;

Архиватор 7-Zip.

Назначение архиваторов - сжатие (архивирование) информации – приведение ее к виду, при котором уменьшается избыточность ее представления. В чем суть?
Если мы напишем текст, в котором 10 раз упоминаются слова "торт " или "компьютер ", то можно создать такой файл , в котором эти слова будет присутствовать один раз, но будет и точная информация, в каких местах текста они упоминались. Такой файл получится гораздо меньшим по занимаемому на диске месту, т.е. он будет как бы сжатым по отношению к исходному.
В общем случае архивный файл – это специальным образом организованный файл, в котором присутствуют данные о типовых или повторяющихся символах или кодах, а также данные о структуре их исходного размещения.

Причем в архивный файл могут быть сгруппированы как один, так и несколько исходных файлов. При разархивации происходит востановление файла (файлов) в их исходном виде.
Архивные файлы удобнее хранить, передавать по сети, в почтовых рассылках.

Часто задают вопрос: Какой архиватор лучше? Существует достаточно большое количество программ-архиваторов, наиболее популярные из них ARJ, ZIP, RAR, 7-Zip (произносится севэн зип). Если говорить о двух архиваторах - лидерах сервиса - из их большого семейства, то это на мой взгляд

WinRar - платная рограмма, вернее 30 дней бесплатно на тестирование, а потом надо покупать ключ)


7-Zip
- бесплатное программное обеспечение.

У программы WinRar по моему мнению, большое преимущество в том, что она появилась раньше, народ ее освоил и переучиваться особого резона нет.
И это действительно так, если особых требований к сжатию файлов нет. Но если нужно максимально сжать файлы, то эксперимент показывает, что лучше это сделает 7-Zip , причем это касается и загрузочных файлов и музыки и видио,

Архиватор ZIP , пожалуй, самый распространенный, он поддерживается в Windows, без использования специального программного обеспечения, достаточно щелкнуть по выбранному файлу правой кнопкоймыши и в выбранном пункте «Отправить» выбрать следующий пункт «Сжатая ZIP-папка». Естественно, надо проследить, какой путь был указан, т.е. куда вы отправили архив. Ваш файл окажется в сжатом виде в папке с тем же названием, что и сам файл.

Для извлечения файла из архива необходимо щелкнуть правой клавишей по архиву и в контекстном меню выбрать последовательно «Извлечь все» и для конкретного файла «Извлечь». Вы получите папку с файлом в исходном виде.
Так работают архиваторы, которые называют файловыми. Есть еще и программные архиваторы. Они также создают сжатые архивы, с той разницей, что для извлечения исходных файлов не требуется предварительная распаковка, при запуске архивы распаковываются автоматически. Поскольку это уже исполняемые (программные) файлы, они имеют расширение *.exe.

Если на вашем компьютере установлен файл-менеджер Total Commander, то вы приобретаете достаточно широкие возможности по выбору архиваторов и их настроек, что показано на рисунках ниже:


Допустим, мы хотим сделать архив файла с названием «Заявление». Выбрав этот файл на правой панели (выделен синим цветом), в верхнем меню окна выбираем вкладку «Файл», затем опцию «Упаковать».

Появляется окно «Упаковка файлов» с предложением целого ряда архиваторов, их настроек, выбора опций при архивировании.
При распаковке (извлечении) файла в той же вкладке «Файл» выбираем опцию «Распаковать».

Появляется окно «Распаковка файлов» с предложением пути, куда будет помещен распакованный файл и настроек при осуществлении операции.


Если согласны с предлагаемым размещением программы, жмем "Install". Если нет - выбираем путь, по которому она будет размещена после установки. В конце установки появляется окно, в котором выберем опцию "Finish".


Теперь можем пользоваться архиватором. Для запуска найдем папку с программой и кликнем по значку программы-менеджера:

Впрочем, значок может иметь и другой вид, например:

Возможно это зависит от версии исходного файла.

После запуска открывается основное окно программы. Выберем папку \Temp\ на локальном диске D: и проделаем процедуры разархивации и архивации файла "Заявление". (Кстати, в предлагаемом программой интерфейсе выбор диска производится значком "стрелка вверх", на рисунке слева от поля, в котором указан путь D:\Temp\).

Для того, чтобы извлечь файл из архива, выберем файл (в нашем примере "Заявление.zip"), затем выберем опцию "Извлечь" (синий минус) из меню предложенных в верхней части инструментов. Появится окно с предлагаемыми опциями извлечения

Если мы согласны с предложенными опциями и путем размещения файла, жмем ОК, если нет - выбираем нужные опции и путь.

Чтобы положить какой-либо файл в архив, в предложенном выше рабочем окне архиватора необходимо выбрать опцию "Добавить" (зеленый плюс).
Тогда появится окно с выбором опций архивирования. Также выбираем файл, который хотим положить в архив и выбираем путь, где мы хотим его видеть. В нашем случае мы опять тренируемся с файлом "Заявление". Для начала оставим предлагаемые опции таковыми, какими их предлагает архиватор. Ну а потом, с опытом - выбираем свои, если что-то не устраивает.


Архивация файлов, назначение, виды и основные возможности архиваторов.

Характерной особенностью большинства «классических» типов данных, с которыми традиционно работают люди, является определенная избыточность. Степень избыточности зависит от типа данных. Кроме того, степень избыточности данных зависит от принятой системы кодирования. Так, например, можно сказать, что кодирование текстовой информации средствами русского языка (с использованием русской азбуки) дает в среднем избыточность на 20-30% больше, чем кодирование адекватной информации средствами английского языка.

При обработке информации избыточность также играет важную роль. Однако, когда речь заходит не об обработке, а о хранении готовых документов или их передаче, то избыточность можно уменьшить, что дает эффект сжатия данных.

Если методы сжатия информации применяют к готовым документам, то нередко термин сжатие данных подменяют термином архивация данных, а программные средства, выполняющие эти операции, называют архиваторами.

В зависимости от того, в каком объекте размещены данные, подвергаемые сжатию, различают :

Уплотнение (архивацию) файлов;

Уплотнение (архивацию) папок;

Уплотнение дисков.

Если при сжатии данных происходит изменение их содержания, метод сжатия необратим и при восстановлении данных из сжатого файла не происходит полного восстановления исходной последовательности. Такие методы называют также методами сжатия с регулируемой потерей информации. Они применимы только для тех типов данных, для которых формальная утрата части содержания не приводит к значительному снижению потребительских свойств. В первую очередь, это относится к мультимедийным данным: видеорядам, музыкальным записям, звукозаписям и рисункам. Методы сжатия с потерей информации обычно обеспечивают гораздо более высокую степень сжатия, чем обратимые методы, но их нельзя применять к текстовым документам, базам данных и, тем более, к программному коду.

Характерными форматами сжатия с потерей информации являются:

JPG для графических данных;

MPG для видеоданных;

М РЗ для звуковых данных.

Если при сжатии данных происходит только изменение их структуры, то метод сжатия обратим. Из результирующего кода можно восстановить исходный массив путем применения обратного метода. Обратимые методы применяют для сжатия любых типов данных.

Характерными форматами сжатия без потери информации являютс я:

GIF, TIP,. PCX и многие другие для графических данных;

AVI для видеоданных;

ZIP, .ARJ, .BAR, .LZH, .LH, .CAB и многие другие для любых типов данных.

«Классическими» форматами сжатия данных, широко используемыми в повседневной работе с компьютером, являются форматы.ZIP и.ARJ. В последнее время к ним добавился популярный формат.RAR.

К базовым функциям, которые выполняют большинство современных диспетчеров архивов, относятс я:

Извлечение файлов из архивов;

Создание новых архивов;

Добавление файлов в имеющийся архив;

Создание самораспаковывающихся архивов;

Создание распределенных архивов на носителях малой емкости;

Тестирование целостности структуры архивов;

Полное или частичное восстановление поврежденных архивов;

Защита архивов от просмотра и несанкционированной модификации.

Самораспаковывающиеся архивы

Самораспаковывающийся архив готовится на базе обычного архива путем присоединения к нему небольшого программного модуля. Сам архив получает расширение имени.ЕХЕ, характерное для исполнимых файлов.

Распределенные архивы.

Некоторые диспетчеры (например WinZip) выполняют разбиение сразу на гибкие диски, а некоторые (например WinRAR и WinArj) позволяют выполнить предварительное разбиение архива на фрагменты заданного размера на жестком диске. Впоследствии их можно перенести на внешние носители путем копирования.

При создании распределенных архивов диспетчер WinZip обладает неприятной особенностью: каждый том несет файлы с одинаковыми именами. В результате этого нет возможности установить номера томов, хранящихся на каждом из гибких дисков, по названию файла Диспетчеры архивов WinArj и WinRAR маркируют все файлы распределенного архива разными именами и потому не создают подобных проблем.

Защита архивов. В большинстве случаев защиту архивов выполняют с помощью пароля, который запрашивается при попытке просмотреть, распаковать или изменить архив.

К дополнительным функциям диспетчеров архивов относятся сервисные функции, делающие работу более удобной. Они часто реализуются внешним подключением дополнительных служебных программ и обеспечивают:

Просмотр файлов различных форматов без извлечения их из архива;

Поиск файлов и данных внутри архивов;

Установку программ из архивов без предварительной распаковки;

Проверку отсутствия компьютерных вирусов в архиве до его распаковки;

Криптографическую защиту архивной информации;

Декодирование сообщений электронной почты;

- «прозрачное» уплотнение исполнимых файлов.ЕХЕ и.DLL;

Создание самораспаковывающихся многотомных архивов;

Выбор или настройку коэффициента сжатия информации.

Сисадмин (он же на английском языке sysadmin , system administrator ) - сокращенное наименование профессии, полное название которой на русском языке звучит как системный администратор . Данная профессия в последнее время стала очень популярной для большинства молодых, и не очень, людей, ей обучают, по ней работают, за неё получают хорошие деньги. Связано это с бурным развитием различных компьютерных технологий и их проникновением во все сферы человеческой жизни. Слово сисадмин часто используется в разговорной речи, в вакансиях и резюме при поиске работы, одним словом - везде. Ниже пойдет речь о том, что же представляет из себя профессия системного администратора.

В современных реалиях, системным администратором может называться фактически любой человек, который занимается обслуживанием и поддержанием работы определенной компьютерной сети, включая все её аппаратные и/или программные компоненты, в которую могут входить:

  • Персональные компьютеры, как рабочие станции, так и сервера;
  • Сетевое оборудование, такое как коммутаторы, маршрутизаторы, фаерволлы и многое другое;
  • Веб-сервера, почтовые сервера, сервера баз данных, и прочие.

Так же в определенных случаях, на плечи системного администратора могут лечь обязанности по обеспечению должной информационной безопасности.

В зависимости от своей специализации, системный администратор может заниматься следующими видами деятельности:

  • Администратор рабочих станций и серверов чаще всего занимается починкой как аппаратных (вышедшие из строя материнские платы, погоревшие блоки питания), так и программных (не загружается Windows, не печатаются запятые в Word"e...).
  • Администратор корпоративной сети на основе домена Active Directory. Очень популярное занятие, учитывая распространенность операционных систем Windows, а так же необходимость их как-то централизованно контролировать. Такой специалист должен уметь создавать, распределять по группам, редактировать пользователей, выдавать им соответствующие права в домене AD, а так же уметь управлять групповыми политиками для пользователей, их компьютеров и групп, в которых они все состоят.
  • Администрирование сетей и сетевого оборудования. В его обязанности входит знание топологии сетей, умение работать как с не настраиваемым, так и с настраиваемым сетевым оборудованием, планирование локальной вычислительной сети, а так же возможность объединения в одну сеть нескольких отдаленных друг от друга рабочих мест, путем настройки NAT"ов и VPN"ов. Не стоит так же забывать и контроле доступа в рамках этой сети, и за её пределами - настройка прокси.
  • Администратор веб-сервера, который должен как минимум уметь устанавливать, настраивать и обслуживать один из следующих веб-серверов - Apache, IIS, Nginx, следить за хостингом (который может располагаться как внутри сети организации, так и вне её). Кроме того, хороший администратор должен уметь настроить нормальное распределение ресурсов при высоких нагрузках, кластеризацию и много других специфичных вещей.
  • Администрирование почтового сервера так-же является распространенной задачей для сисадмина, в его задачи входит работа с такими популярными решениями как Exim, Microsoft Exchange, Postfix, Sendmail, или корпоративными почтовыми решениями от Google или, например, Yandex. Кроме очевидного контроля за учетными записями (создание, удаление, настройка), так же обязательно уметь настроить антиспам систему и прочее.
  • Администратор сайта. В эти обязанности может входить как просто какое-то наполнение содержимым сайта, но раз речь идет о системном администраторе, то по идее он должен уметь и настроить хостинг (в том числе и веб-сервер, о чем уже говорилось выше), установить и настроить нужный сайт, например какую-либо систему управления содержимым (CMS).
  • Совсем редко под обязанности системного администратора может попасть задача создания или обслуживания системы видеонаблюдления. В задачах установка и настройка камер, реагирования на различные события, сохранение и воспроизведение записей. Относится к системному администрированию слабо, и часто попадает в его обязанности по совместительству к каким-нибудь другим обязанностям.

За бортом описанных выше занятий системного администратора остались такие возможные вещи, как администрирование баз данных (Microsoft SQL, MySQL и его множественные ответвления, Oracle и т. д.), администрирование 1C (не путать с "программист 1C"), АТС и многое другое.