Ver.2 от 10 июля 2003 года

FAQ:    Как быстро и без проблем перевести книгу в электронный
формат djvu.


Составлено на основе документа:
http://hamradio.online.ru/m2_solo.htm


1. Что необходимо:

    -   сканер   (желательно   "быстрый",  так  как  на 99%  скорость
    сканирования определяет скорость всего процесса)

    - программа ABBYY Finereader (5-я или 6-я версии)

    - программа Djvu Solo версии 3.1

    - программа Irfan View версии 3.80 (скачать с сайта производителя)

    - свободное место на диске
    
2. Порядок действий:

    а) Пакетное   сканирование.   Используем   Finereader  как  пакетный
       сканировщик  ввиду  его  удобства  для сканирования документов, книг и
       т.д..

       - в Finereader создать новый Batch, указав каталог.

       -  в  tools  ->  optons  -> scan/open image выделить "use finerader
       interface", "despeckle image", "split dual pages"
       
       -  в tools -> optons -> scan/open image -> scanner settings указать
       режим  "black and white", 300 DPI, яркость пусть файнридер выбирает
       сам  (в  редких  случаях,  например,  при  сканировании  страниц  с
       чертежами  на  миллиметровой  сетке  лучше  пользоваться  "ручной"
       яркостью).

       - положить книгу "разворотом" (где-то посередине книги) на сканер и
       путем  пробных "сканов" определить настройки сканирования (tools ->
       optons   ->   scan/open  image  ->  scanner  settings),  такие  как
       положение,  отступы  (indents)  и  ширина  -  высота.  Критерий   -
       отсутствие  черных  полос  и  мусора  (слева-справа-снизу)  на  уже
       "разбитых"  файнридером страницах; чтобы потом не подчищать дефекты
       вручную. Это значительно сэкономит время.

       -  После  вышеуказанной  настройки  запускаем пакетное сканирование
       (shift+control+K),  начиная  с _первой_ страницы (названия книги) и
       далее   подряд   без   пропуска.   Перенумеровывать   страницы  при
       необходимости можно в меню batch -> renumber pages.
       
       Можно в настройках выставить паузу в секундах для того чтобы успеть
       перевернуть  страницу  или выставить режим, при котором всплывающим
       окошком файнридер спрашивает "остсканировать следующую?"

       В  случае "мусора" и полос в отсканенном имидже можно пользоваться
       "ластиком" в окошке обработки имиджей.
       
       Предпочтительно  сканировать так, чтобы номера страниц в файнридере
       всегда  совпадали  с  номерами  страниц  в книге (чтобы отслеживать
       ошибки, да и выходной документ будет удобочитаем - соответствовать
       "бумажной" книге).

       В  случае "мусора" и полос в отсканенном имидже удобно пользоваться
       "ластиком" в окошке обработке имиджей.

       сканирование завершено.

       Файлы .tiff лежат в каталоге Batch файнридера.
       

    б) Подготовка с сжатию:

       -  с  помощью  Irfan  View  делаем batch-преобразование tiff -> bmp
       (black  and  white).  Дело  в том, что Djvu Solo 3.1 имеет свойство
       иногда  "вылетать"  на  тиффах, созданных файнридером. С bmp проблем
       нет вообще.
       

    в) Сжатие:

        - С  помошью Solo открываем первый bmp, потом на его иконке щелчком
        правой  кнопки  мыши  добавляем  через  открывшееся меню остальные
        bmp,  причем  обязательно  в последовательности _с последнего по
        второй_ (это важно).

        процесс открытия файлов может занимать достаточно долго, до 10-15 минут.
        
        -  сохраняем  как  файл.djvu   с  параметрами   Bundled,  300 DPI,
        Bitonal в какой-либо каталог.

            (900-страничная  книга  кодируется  минут  20-30 (при процессоре
            Celeron 1700 MHz).

        - в меню  edit -> document startup mode выставить black & white

        - еще раз сохранить.

        - всё :)

 3. Возможные проблемы.

         При   вышеуказанной   последовательности   проблем  не  замечено.
         Среднестатистическая  страница  занимает  в  среднем  от  8 до 20
         Кбайт.

 4. Нюансы.

    а)  В  конфигурационных  файлах Solo (каталог profiles) можно изменять
    (только  осторожно  :)  ) некоторые параметры, которые могут влиять на
    качество выходных файлов, их размер, и т.д. 

        в частности, в documenttodjvu.conf можно выставить кол-во страниц,
        на  которые  генерируется  т.н.  словарь.  По дефолту оно равно 10
        страницам. Лучше выставить его побольше, при этом можно сэкономить
        до 30-40 процентов размера выходного файла.

        например, выставить его в 1000 страниц:

         ----cut------

         ##############################################################
         ## BITONAL PROFILES


         ### Bitonal (it is preferable to use bitonaltodjvu)
         ##
         
         bitonal:
         tobitonal=true

         bitonal600: bitonal
         dpi=-600
         aggressive=true

         bitonal500: bitonal
         dpi=-500
         aggressive=true

         bitonal400: bitonal
         dpi=-400

         bitonal300: bitonal
         pages-per-dict=1000
         dpi=-300
        
        ---------------cut----------------------------

     б)  Если  вы  решили  выложить  в Сеть книгу большого обьема (десятки
     мегабайт,   например  "толстый"  справочник  с  обилием  чертежей  на
     "миллиметровке"),  и  (или)  хостер  не  позволяет "класть" на сервер
     большие   файлы,  то  может  иметь  смысл  ее  "выкладывать"  ее  для
     _онлайнового_  просмотра в indirect-формате (то есть "постранично", а
     не  "бандлом";  для этого в диалоге перед сохранением файла поставьте
     флажок  "indirect").  Браузер при просмотре будет загружать только ту
     страницу,  которую  укажет  читатель  в окошке номера страницы либо
     "кнопками" навигации.
     
     Если  вы  выкладываете  книгу  на  сервер  именно в таком формате, то
     попросите  администратора прописать в MIME-типы вэб-сервера следующую
     строку
         
     image/x-djvu djvu djv djbz

     (важно указать последнюю опцию (djbz))
     

   Roman Efimov
   http://www.farlep.net/~roman
Hosted by uCoz