Ver.2 от 10 июля 2003 года
FAQ: Как быстро и без проблем перевести книгу в электронный
формат djvu.
Составлено на основе документа:
http://hamradio.online.ru/m2_solo.htm
1. Что необходимо:
- сканер (желательно "быстрый", так как на 99% скорость
сканирования определяет скорость всего процесса)
- программа ABBYY Finereader (5-я или 6-я версии)
- программа Djvu Solo версии 3.1
- программа Irfan View версии 3.80 (скачать с сайта производителя)
- свободное место на диске
2. Порядок действий:
а) Пакетное сканирование. Используем Finereader как пакетный
сканировщик ввиду его удобства для сканирования документов, книг и
т.д..
- в Finereader создать новый Batch, указав каталог.
- в tools -> optons -> scan/open image выделить "use finerader
interface", "despeckle image", "split dual pages"
- в tools -> optons -> scan/open image -> scanner settings указать
режим "black and white", 300 DPI, яркость пусть файнридер выбирает
сам (в редких случаях, например, при сканировании страниц с
чертежами на миллиметровой сетке лучше пользоваться "ручной"
яркостью).
- положить книгу "разворотом" (где-то посередине книги) на сканер и
путем пробных "сканов" определить настройки сканирования (tools ->
optons -> scan/open image -> scanner settings), такие как
положение, отступы (indents) и ширина - высота. Критерий -
отсутствие черных полос и мусора (слева-справа-снизу) на уже
"разбитых" файнридером страницах; чтобы потом не подчищать дефекты
вручную. Это значительно сэкономит время.
- После вышеуказанной настройки запускаем пакетное сканирование
(shift+control+K), начиная с _первой_ страницы (названия книги) и
далее подряд без пропуска. Перенумеровывать страницы при
необходимости можно в меню batch -> renumber pages.
Можно в настройках выставить паузу в секундах для того чтобы успеть
перевернуть страницу или выставить режим, при котором всплывающим
окошком файнридер спрашивает "остсканировать следующую?"
В случае "мусора" и полос в отсканенном имидже можно пользоваться
"ластиком" в окошке обработки имиджей.
Предпочтительно сканировать так, чтобы номера страниц в файнридере
всегда совпадали с номерами страниц в книге (чтобы отслеживать
ошибки, да и выходной документ будет удобочитаем - соответствовать
"бумажной" книге).
В случае "мусора" и полос в отсканенном имидже удобно пользоваться
"ластиком" в окошке обработке имиджей.
сканирование завершено.
Файлы .tiff лежат в каталоге Batch файнридера.
б) Подготовка с сжатию:
- с помощью Irfan View делаем batch-преобразование tiff -> bmp
(black and white). Дело в том, что Djvu Solo 3.1 имеет свойство
иногда "вылетать" на тиффах, созданных файнридером. С bmp проблем
нет вообще.
в) Сжатие:
- С помошью Solo открываем первый bmp, потом на его иконке щелчком
правой кнопки мыши добавляем через открывшееся меню остальные
bmp, причем обязательно в последовательности _с последнего по
второй_ (это важно).
процесс открытия файлов может занимать достаточно долго, до 10-15 минут.
- сохраняем как файл.djvu с параметрами Bundled, 300 DPI,
Bitonal в какой-либо каталог.
(900-страничная книга кодируется минут 20-30 (при процессоре
Celeron 1700 MHz).
- в меню edit -> document startup mode выставить black & white
- еще раз сохранить.
- всё :)
3. Возможные проблемы.
При вышеуказанной последовательности проблем не замечено.
Среднестатистическая страница занимает в среднем от 8 до 20
Кбайт.
4. Нюансы.
а) В конфигурационных файлах Solo (каталог profiles) можно изменять
(только осторожно :) ) некоторые параметры, которые могут влиять на
качество выходных файлов, их размер, и т.д.
в частности, в documenttodjvu.conf можно выставить кол-во страниц,
на которые генерируется т.н. словарь. По дефолту оно равно 10
страницам. Лучше выставить его побольше, при этом можно сэкономить
до 30-40 процентов размера выходного файла.
например, выставить его в 1000 страниц:
----cut------
##############################################################
## BITONAL PROFILES
### Bitonal (it is preferable to use bitonaltodjvu)
##
bitonal:
tobitonal=true
bitonal600: bitonal
dpi=-600
aggressive=true
bitonal500: bitonal
dpi=-500
aggressive=true
bitonal400: bitonal
dpi=-400
bitonal300: bitonal
pages-per-dict=1000
dpi=-300
---------------cut----------------------------
б) Если вы решили выложить в Сеть книгу большого обьема (десятки
мегабайт, например "толстый" справочник с обилием чертежей на
"миллиметровке"), и (или) хостер не позволяет "класть" на сервер
большие файлы, то может иметь смысл ее "выкладывать" ее для
_онлайнового_ просмотра в indirect-формате (то есть "постранично", а
не "бандлом"; для этого в диалоге перед сохранением файла поставьте
флажок "indirect"). Браузер при просмотре будет загружать только ту
страницу, которую укажет читатель в окошке номера страницы либо
"кнопками" навигации.
Если вы выкладываете книгу на сервер именно в таком формате, то
попросите администратора прописать в MIME-типы вэб-сервера следующую
строку
image/x-djvu djvu djv djbz
(важно указать последнюю опцию (djbz))
Roman Efimov
http://www.farlep.net/~roman
