Вернуться к разделу "Материалы по сканированию и оцифровке бумажных книг".


Знакомство с Secure DjVu


Введение

Официально считается, что одним из недостатков формата DjVu является отсутствие возможности разграничения прав доступа к содержимому. Например, в Pdf-файлах можно защитить паролем возможность копировать текст, сохранять изображения, извлекать страницы и т.д. В DjVu-файлах всё это невозможно - и эта одна из причин, почему на Западе тормозится коммерческое распространение этого формата.

В июле 2007 года компания LizardTech - владелец прав на формат DjVu - объявила о создании так называемого "Secure DjVu" (SDjVu 1.0). Это новый стандарт, точнее поправка к спецификации формата DjVu, которая вводит понятие "защита доступа" применительно к DjVu-файлам.

Secure DjVu предоставляет следующие базовые возможности:

Защита на просмотр реализована на уровне спецификации SDjVu-файла. То есть, без знания соответствующей пары логин/пароль пользователь не сможет открыть файл на чтение.

Остальные ограничения реализуются приложением, при помощи которого просматриваются SDjVu-файлы.

Защита доступа обеспечивается посредством 32-битного шифрования содержимого по алгоритму Blowfish.

Программное обеспечение SDjVu

В настоящее время, поддержка SDjVu включена только в броузерном DjVu-плагине версий 6.1 или выше. Инструментом создания SDjVu-файлов служит консольная утилита SDjVuAdmin. Она умеет "превращать" обычные DjVu-файлы в соответствующие им SDjVu-файлы, а также полностью управлять их уровнями доступа - назначать/менять логины-пароли, наборы прав доступа, и т.п. Каждой паре логин-пароль можно назначить свой отдельный набор прав доступа. Дополнительно, можно назначить SDjVu-файлу "дату истечения", по окончании которой SDjVu-файл будет становиться нечитаемым, или же будет просто выдаваться некое предупреждение.

Вот как выглядит окно этой программы:

sd01.gif (13686 bytes)

Скриншот взят с сайта GB Soft - официального реселлера LizardTech в Польше.

В настоящее время утилита SDjVuAdmin доступна только авторизованным партнёрам и дистрибьюторам фирмы, но примерно в феврале 2008 года ожидается официальный выпуск новой версии пакета Document Express Enterprise - 6-ой или 7-ой - в составе которого будет включен SDjVuAdmin.

Пример SDjVu-файла

Летом 2007 года на странице DjVu Flipper 2.5 Demo Examples был доступен пример SDjVu-файла. Сейчас он уже там недоступен, и поэтому я выкладываю его заново:

Secure DjVu Sample  (61 КБ)

Давайте установим последнюю версию броузерного DjVu-плагина (6.1.1) и попробуем рассмотреть поближе этот пример.

Для начала попробуем открыть этот файл при помощи WinDjView v0.5. Программа выдаёт нам такое предупреждение:

sd02.gif (8130 bytes)

Если нажать на кнопку "ОК" - то WinDjView откроется - но в его окне будет пустой белый фон.

Пробуем открыть этот файл в броузерного DjVu-плагина версии 6.1.1. Сначала мы видим такое окно:

sd03.gif (6281 bytes)

Вводим такие авторизационные данные:

User ID:  UserAdmin

Password:  iadmin

Нажимаем кнопку "ОК" и открывается DjVu Viewer:

sd04.gif (26476 bytes)

Всё в порядке - файл открылся. Смотрим свойства страницы:

sd05.gif (8163 bytes)

Здесь видно, что появился новый chunk - Shared_SINF.iff. Быть может, это он отвечает за "безопасность".

Теперь смотрим свойства документа:

sd06.gif (10657 bytes)

Здесь мы видим, что это - многостраничный SDjVu-файл, содержащий 5 страниц, разделённый словарь и "чанк безопасности" SHARED_SINF. Все 5 страниц - это стандартизованные комитетом CCIT эталонные образцы кодирования, имеющие условные названия "CCIT1", "CCIT2", и т.д. - до 5-ти.

Также мы видим, что файл имеет наначенную "дату истечения" - и она уже прошла. Также тут показано действие, которое должно происходить после этой даты - "Fail". Что это именно такое за действие - понять пока не удалось.

К сожалению, этот файл не содержит встроенного OCR-слоя - так что попробовать сделать Copy-Paste не получилось. При попытке сохранить отдельно одну DjVu-страницу этого файла всё получается - но новый одностраничный файл при открытии также требует ту же самую пару логин-пароль.

Зато BMP-файлы извлеклись на пробу без малейших проблем.

Выводы

На первый взгляд, появление стандарта SDjVu выглядит неплохо. Авторы книг и прочих текстовых произведений получают возможность сохранять плоды своего труда в формате SDjVu и защищать их содержимое паролем от несанкционированного просмотра/копирования/извлечения текста.

Но что несёт стандарт SDjVu для русскоязычных DjVu-книгосканировщиков?

Несомненно, стандарт SDjVu - это новая опасность и немалая угроза для всех нас.

Найдётся немало людей, которые по недомыслию или злому умыслу начнут закрывать паролем возможность редактирования DjVu-файлов. Например, некоторые сетевые библиотеки уже сейчас берут чужую Pdf-книгу, вставляют туда новую первую страницу с рекламой самой себя, и ставят пароль на редактирование такого Pdf-файла. Аналогичные желания публично заявляют единичные DjVu-книгосканировщики, которые хотят таким образом "защитить своё скан-авторство".

Поэтому необходимо предпринять максимум усилий, чтобы попытаться как можно скорее нейтрализовать эту нечисть - имя которой "SDjVu". Идеальный вариант - сделать так, чтобы появилась программа, способная взламывать SDjVu-файлы и превращать их в обычные DjVu-файлы.Т.е. аналогично тому, что делается нередко с защищёнными Pdf-файлами. Или же, как минимум, исследовать броузерный DjVu-плагин на предмет того - нельзя ли его взломать - чтобы некоторые ограничения прав, реализованные на уровне приложения, перестали в нём работать.

Для этого необходимо искать квалифицированных хакеров и просить их о помощи в этом вопросе, а также обращаться с запросами в софтверные фирмы, которые в своё время создали программы для взлома паролей Pdf-файлов и т.п. Для них можно уже сейчас предложить 2 информативных примера:

1. Secure DjVu Sample  (61 КБ)

2. Secure DjVu specification (92 КБ, формат DjVu)

(Плюс все прочие спецификации формата DjVu - см. ссылки в конце статьи).

В районе февраля 2008 года станет доступен SDjVuAdmin и с ним появится возможность более полноценно исследовать SDjVu.

Электронные книги в формате DjVu должны распространяться на принципах полной свободы - и нужно стараться по-максимуму противостоять любым попыткам ограничить эту свободу - под какими бы "благородными" лозунгами это ни осуществлялось.


Technical Papers on DjVu Technology - самая свежая и полная информация о спецификациях формата DjVu.

Secure DjVu specification (92 КБ, формат DjVu)

SDJVU Example - LT/Celartem abandons format versioning - PlanetDjVu Forum

Security Settings in DjVu - PlanetDjVu Forum

DjVu Flipper 2.5 Demo Examples

LizardTales Newsletter - Q2 2007

Oprogramowanie do tworzenia dokumentow w formacie DjVu

DjVu Browser Plug-in Release Notes

Ликбез по DjVu


Автор: monday2000.

31 декабря 2007 г.

E-Mail  (monday2000 [at] yandex.ru)

Hosted by uCoz