Толик Панков
hex_laden
............ .................. ................
Толик Панков [userpic]
PRESS Неизвестный уральский архиватор.

Разгребая старые архивы обнаружил неизвестный архиватор производства СКБ "Контур", г. Екатеринбург. Написано, что 1995 года. Довольно продвинутый для того времени (RAR, насколько понимаю, тогда еще не существовал). Неплохо сжимает, во всяком случае тот же RAR не смог (на максимуме) сжать архивы PRESS (с расширением .PRS) с каким-либо выигрышем.

Умеет в многотомность, сжатие с подкаталогами, можно включить псевдографический интерфейс (правда, управление все равно с командной строки).

Что прикольно - формат архива PRS абсолютно неизвестен никаким антивирусам, и за архив они его не считают. Вот бы разобрать формат, да сделать свой современный упаковщик, на базе сурового уральского изделия. Интересно, что контора до сих пор существует, делает бухгалтерские проги, и даже успешно конкурирует с великим и ужасным 1С.

Единственное что, расковыривание формата задача скорее не для меня, а для [info]ketmar, но может когда-нибудь и расковыряю.

Впрочем, кому интересно, может поковыряться сам:

Примеры архивов PRS
Архиватор
Файлы, добавленные в архивы

Архивы сделаны в двух экземплярах: с обычной и максимальной (имя архива заканчивается на m) степенью сжатия.

Содержимое архивов:

VIM-LNT.PRS, VIM-LNTM.PRS - "Война и мир" в TXT в UTF-8
SMALL-EN.PRS, SMALLENM.PRS - текстовый файл с английским алфавитом строчными буквами (одна строка).
ENX10.PRS, ENX10M.PRS - английский алфавит повторенный 10 раз (10 строк)
ALLFILEM.PRS, ALLFILES.PRS - все из предыдущих архивов + несколько картинок в разных форматах.

Это репост с сайта http://tolik-punkoff.com
Оригинал: http://tolik-punkoff.com/2019/10/03/press-neizvestnyj-uralskij-arhivator/

Comments
(Anonymous)
Notice! This user has turned on the option that logs IP addresses of anonymous posters.

>RAR, насколько понимаю, тогда еще не существовал

>Initial release 22 April 1995

Ну нужно вас как-то различать, да и откуда посмотреть и

Ну у Press это не первый релиз (у меня версия 1.10m), так что тут хз кто раньше появился.

"во всяком случае тот же RAR не смог (на максимуме) сжать архивы PRESS (с расширением .PRS) с каким-либо выигрышем."

Ну это, как бы, не совсем корректное сравнение.

А нужен ли он, если есть LZMA?

Алсо, совершенно внезапно наткнулся (где-то на лоре, кажется) на упоминание чувака, который принципиально не уважает XZ, считая его (и вроде даже обосновывая) перегруженным и ненадежным.

>Ну это, как бы, не совсем корректное сравнение.
Ну да. Надо было зажать одинаковые файлы Прессом и Раром и сравнить, но мне почему-то было влом :)
>А нужен ли он, если есть LZMA?
Ну интересно же, и плюс да - антивирусы не видят, т.е. можно использовать для всяких пакостей.
>который принципиально не уважает XZ
ну мало ли кто что не уважает...

"антивирусы не видят, т.е. можно использовать для всяких пакостей"
Ну, пакости, ради которых надо скачать себе редкий, почти неизвестный архиватор, это странно)

"ну мало ли кто что не уважает..."
https://www.nongnu.org/lzip/xz_inadequate.html

Я ж говорю, шутки ради и прикола для...

Ой, смысла не вижу читать какой-то срач, еще и на ангнидском.

этот «срач» называется: «инженер как боженька поясняет, почему не надо дизайнить форматы жопой», вообще-то.

а, ок, теперь есть смысл читать.

и большой. там вся статья не только о том, как не надо, что — это намного более важно — ещё и о том, как надо. как и полагается хорошей статье — вынесеный опыт правильного мышления универсальный.

Ну я так примерно просмотрел. Не, я дебил, на такой матан меня даже на русском не хватит. Точнее хватит, но Кондратий.

А формат архива PRESS ты сможешь расковырять? Ну на досуге прикола для?

могу, но не буду. у меня не так много сил и энергии сейчас, чтобы тратить на — в принципе — бесполезное и не шибко интересное.

Ну ладно, рано или поздно сам расковыряю.

А вот алгоритм для дерева я внезапно вспомнил (он есть в моей дипломке, которая так и не стала кандидатской)- смысл такой. строим строковый ключ, например от 111 до ZZZ, а уровень дерева кодируем в длину, например 1111 у нас уже ветка, 11111 - подветка и т.д.

для причин смерти в судмедэкспертизе подошло. и я даже бабло получил за инновацию.

PRS это Paul Reed Smith

Хто цэ такой?

там в архиве разгребанном не завалялось парсера грабера веб контента универсального?

(Anonymous)

попадался такой вот для Node.js: https://github.com/ageitgey/node-unfluff

Берешь xidel и пишешь скрипт вот как-то так. Оно?

Впрочем, всегда можем обсудить подробнее. Пиши в Телеграм, обсудим что тебе надо, сделаем примерное ТЗ, и я даже тебе напишу, если справлюсь и мне будет интересно... А если еще задонатишь 10$ так совсем хорошо будет.

>тот же RAR не смог (на максимуме) сжать архивы PRESS (с расширением .PRS) с
>каким-либо выигрышем.

это вообще не является индикатором чего-либо кроме того, что софт способен на выходе производить более-менее высокоэнтропийный поток. что является необходимым свойством любого компрессора (а также PRNG). собственно, любой шифр производит такой же поток, и выхлоп шифра несжимаем. значит ли это, что шифрование — отличная компрессия?

Да я уже понял, что надо было те же файлы сжать RAR'ом и посмотреть разницу в размерах.