Создание книг в электронном виде из бумажных книг
(в формате DjVu)

(Сайт постоянно дорабатывается)

Обратите внимание: У моего сайта имеется собственный форум.

Все новости сайта публикуются на форуме здесь.

Я не только не возражаю против любого рода использования материалов этого сайта, но даже и призываю это cделать всех желающих. Этот сайт появился на свет и развивается в результате коллективных усилий и поэтому его материалы должны принадлежать всем.


Чем открыть DjVu-файл?    ( Чем прочитать DjVu-файл? )

Вариант для "чайников":         Скачать инсталлятор WinDjView 1.0 noyb (885 КБ)

Примечание: Программу DjVu Reader не следует использовать для чтения DjVu-файлов - т.к. она являтся сильно устаревшей и неадекватной.


Как самому сделать DjVu-книгу?     ( Как отсканировать книгу? )

Вариант для "чайников":         Краткая схема


Часто Задаваемые Вопросы о формате DjVu (FAQ)

Краткая информация:         Читать тут


На этом сайте находится общая информация о создании электронных версий бумажных книг в формате DjVu. Здесь рассматриваются с этой точки зрения графические форматы DjVu и PDF.



Перейти в главный раздел:

DjVu-программы

 


Смотрите также другие разделы и статьи по этой тематике:

  1. Итоги по DjVu-программам - моя статья - подведение итогов по результатам поиска и выкладывания DjVu-ссылок на этом сайте. Статья поможет новичкам сориентироваться во всём многообразии DjVu-софта, подскажет, какие DjVu-программы нужны в первую очередь, для чего они используются и т.п.
  2. Материалы по сканированию и оцифровке бумажных книг - моя подборка ссылок на материалы по первичному этапу создания электронных версий бумажных книг.
  3. Проект BookScanLib - открытый проект. Цель - создание библиотеки алгоритмов для обработки сканов бумажных книг. К участию в проекте приглашаются все желающие (но только те, кто имеет хотя бы минимальные навыки программирования).
  4. Концепции самодельного робосканера. Присоединяйтесь к обсуждению идей.
  5. DjVu-аптека (220 КБ). Набор первой помощи для DjVu. Прошу добровольцев отзеркалировать этот файлик на своём хостинге и прислать мне ссылку.

Scan Tailor - программа, альтернативная СканКромсатору (Автор - Иосиф Арцимович).

Официальная документация к программе

Особенность: на мой взгляд, годится только для обработки достаточно качественных сканов (в силу особенностей архитектуры).

Программа бесплатная и с открытыми исходными кодами. Просим программистов оказать посильную помощь проекту.


Новый проект обработки сканов - artscan. Автор - ukpyr (русскоязычный). Топик по проекту artscan на англоязычном форуме.


OpenOCR - открытый проект по улучшению российской свободно-бесплатной OCR-программы CuneiForm.
CuneiDjVu - программа для распознавания DjVu на базе CuneiForm.

Мой главный дочерний сайт со сделанными лично мною электронными книгами в формате DjVu:

Материалы по инженерной экологии - http://www.eng-ecology.narod.ru/

Содержит книги по тематике: теплогазоснабжение, отопление, вентиляция, холодоснабжение, кондиционирование, водоснабжение, канализация, пылеулавливание, котельные установки.


1. DJVU - статьи

Technical Papers on DjVu Technology - самая свежая и полная информация о спецификациях формата DjVu.

Зеркало (на официальном сайте Сelartem)

Secure DjVu specification (92 КБ, формат DjVu)

DjVu - Википедия (Rus)         DjVu - Википедия (Eng)

What is DjVu  -  Что такое DjVu  (перевод этой статьи на русский язык)

DjVu FAQ      Журнал «Радио» FAQ DjVu

Сведения о DjVu формате     Диканев Тарас, 2003)

Формат DjVu    (© Алексей Федорчук, 22.08.2004)

DJVU - формат для электронных библиотек    (© Игумнов)
Скачать эту и подчинённые статьи в архиве (13 КБ).

DjVu: Краткое техническое введение   (© Иван Зенков, 2004)

Новые форматы изображений: требование времени    (© Михаил Борисов, 24.02.2001)

Статьи с сервера кубанских радиолюбителей (СКР):
Статьи с описанием программ, необходимых для работы с файлами в формате djvu:
DjVu - всё уже было   Что такое DJVU и как с ним бороться   (Обсуждение этой статьи)   Комментарий к формату DjVu   OCR в DjVu файлах - новый подход к старым возможностям   Советы по подготовке материалов в электронном и бумажном виде   Немного о PDF софте   (Обсуждение этой статьи)   Некоторые рекомендации по работе с DjVu Solo 3.1

Сервер кубанских радиолюбителей  Скачать архив с этими статьями (230 КБ)

Сравнение DjVu-кодеров  (очень устарело)    (© Форум "Иродов")

Графический формат DjVu  (Лабораторная работа - Томск)

DjVu - формат для создания радиолюбительских электронных библиотек

Использование формата DjVu в радиолюбительской практике

DjVu Solo 3.1     Часто задаваемые вопросы по DjVu Solo     (© Юрий Лащёнов )

Сервер Содержимого LizardTech     Часто Задаваемые Вопросы по Серверу Содержимого

Цветной текст в DjVu

Формат DjVu  (© Арсений Чеботарев, 2005 г.)

Tехнология сжатия файлов изображений DjVu  (© Михаил Азаров)

Чтение и создание DjVu-документов   (© Надежда Баловсяк, 26.05.2005)

Ликбез по DjVu  (© Алексей Семёнов)

DjVu.org:

DjVu.org - основной неофициальный англоязычный сайт о DjVu

PlanetDjVu Forum - заслуживающий внимания англоязычный DjVu-форум

PlanetDjvu Archive - частичный архив закрывшегося сайта PlanetDjVu.org
(Бывший сайт James (Jim) Rile - автора коммерческой DjVu-программы JRA Publish)

Некоторые важные статьи оттуда:

New DjVuVersion Utility Fixes Compatibility Issues

Creating OCRed Text in DjVu

Evince - DjVu-просмотрщик для Linux (GPL-лицензия)

Okular - DjVu-просмотрщик для Linux (GPL-лицензия)

Создание документов DJVU в Linux

Linux-программа ocrodjvu (Автор: Jakub Wilk, лицензия: GPL). Это оболочка, позволяющая OCRopus'у делать OCR для DjVu-файлов (с внедрением результата в DjVu).
Является перспективной моделью создания OCR в DjVu посредством CuneiForm (нужны разработчики).

Обсуждение возможности добавить DjVu в OpenOffice


2. Российские DjVu-проекты:

WinDjView (Андрей Жежерун) - один из самых лучших и удачных DjVu-просмотрщиков.

OpenDjVu (Дмитрий Гарькаев) - старейший российский DjVu-просмотрщик.

Илья Межиров:  (разработки в области улучшения свободного алгоритма DjVu-кодирования).

Персональный сайт

Проект "minidjvu"

Курсовая работа на тему «Алгоритмы сжатия данных» Также в формате DOC (21 КБ) (RUS) (Вошла в состав DjVuLibre v3.5.14.3)

Василий Ефименко:  Gener View Djvu - программа для автоматизированного создания системы навигации по DjVu-файлу.

Евгений Шуников:  DjVu Hyperlinks Editor - программа для автоматического создания гиперссылочного оглавления в DjVu-файле.

Дмитрий Викторович Хмелёв:   (DjVu-программы под Unix)

Программа pdftodjvu версия 0.1.3

Программа img2djvu версия 0.1.4

Герасим Троеглазов: BeOS DjVu Viewer v1.04 - DjVu-просмотрщик под ОС BeOS. Версия 1.1.0

Дмитрий В. Горбачев Домашняя Страничка - Djvu  (заброшено)

Олег Мотыгин:   (DjVu-программы под Linux, GPL-лицензия)

Scan to DjVu - Скрипт для сканирования документов и сохранения их в формат DjVu.

Print to DjVu through KPrinter - Виртуальный DjVu-принтер для KDE (Linux)

Print Dialog and Toolkit - Интерактивный спулер печати (Linux); в частности, позволяет из любого приложения печатать в DjVu.

Sdjvu - DjVu-просмотрщик для Symbian OS.  Автор: Алексей Семёнов

SmartDjVu - DjVu-просмотрщик для PocketPC. Автор: Inscenic

PocketDjVu - Бесплатный DjVu-просмотрщик для PocketPC. Автор: Игорь Соловьёв

Handy Djvu - DjVu-просмотрщик для ОС Symbian. Автор: Novosoft

DjVuCE - Бесплатный DjVu-просмотрщик для КПК под MS Windows Mobile. Автор: Кальянов Дмитрий

Djvu Reader for Symbian 9.x v1.0a. Автор: Алексей Зарянов.

Разное:

История DjVu

Yann's DjVu Page   (один из 2 разработчиков формата DjVu)

DjVu и не только:

Опыт математического журнала в Интернет

Средства создания изображений    Сетевая графика под Linux    (© Алексей Федорчук)

Compression of bi-level images    Adolf Knoll, National Library of the Czech Republic, Prague)

Can Newgen revolutionize document compression?  (статья о возможности альтернативы для DjVu)

Электронная бумага:   (Будущий перспективный способ чтения электронных книг)

Описание:
Бумага будущего

Электронная бумага появится в 2006 году

Электронная книга (устройство) - Википедия

Аппараты для чтения е-книг

Документация сайта the-ebook.org

Samsung разработала цветную "электронную бумагу" на базе углеродных нанотрубок

Популярные в России модели:
Обзор Sony Book Reader PRS-505 (Алекс Экслер)

Обзор LBook eReader V3: тысяча книг в одной обложке

Обзор электронной книги lBook eReader V3

Перспективы хранения и распространения электронных книг:
80 гигабит записали на один квадратный сантиметр

Сверхъёмкий диск

Сто в одном

GE изобрела терабайтные Blu-ray диски


3. Основные проекты:

1. Основной коммерческий DjVu-проект:

Caminova (официальный сайт DjVu)

Document Express Product Comparison

http://dev.caminova.jp/download/

2. Основной бесплатный DjVu-проект:

DjVuLibre

См. также: DjVuLibre v3.5.21 API и MiniExp v3.5.21 API - справочное пособие по программированию DjVuLibre 3.5.21.

DjVuLibre v3.5.21. What's new

Примечание: Эти бесплатные DjVu-компрессоры (по их словам) работают медленнее, делают файлы большего размера (и иногда хуже качеством), чем коммерческие компрессоры.

3. Бесплатный проект Java DjVu Viewer:

Java DjVu Viewer Project   (независимый от платформы Java DjVu-просмотрщик).

4. Бесплатный Web-сервер для конвертации файлов-документов любого формата в DjVu:

Any2DjVu Server  (Обеспечивает, возможно, самое высокое качество конвертации из всех вариантов).

5. Бесплатный проект pdf2djvu:

pdf2djvu   (Прямой конвертер PDF -> DjVu, есть версии под Linux и Windows).



4. Описание формата DjVu

DjVu - это круто! Это просто революция в деле создания электронных книг. Формат DjVu - это как бы "новый PDF", только в несколько раз более ёмкий при почти том же качестве. Причём, можно сказать, что качество для прочтения вроде бы даже лучше, ведь PDF-файл не больно-то почитаешь, он всё же довольно размытый, глаза устают, а вот DjVu-файл читается довольно бодро.

Формат DjVu, как никакой другой графический формат, позволяет очень сильно сжимать сканы книг почти без потерь качества. Ведь он и был СПЕЦИАЛЬНО создан для оптимального кодирования сканированных изображений текста, перемежающегося с графикой. Такой своеобразный MP3 в графике.

Формат DjVu разделяет сканированное изображение на разнородные по качеству отдельные фрагменты (автоматически или вручную) - сжимая их впоследствии противоположными по смыслу алгоритмами, достигая за счёт этого оптимума. Наиболее эффективно это работает для сканированных изображений текста.

Теперь для создания электронной версии книги достаточно просто отсканировать её, облагородить результат и закодировать в формат DjVu. Долой мучения с распознаванием сканов! Отныне почти любую бумажную книгу можно превратить в электронную всего за пару дней! И, что принципиально важно, размеры получающихся DjVu-файлов достаточно малы, чтобы такими файлами можно было обмениваться даже через Интернет. При этом не теряется возможность впоследствии распознать такую электронную книгу - формат DjVu легко экспортируется в BMP, TIF, JPG  и т.п. А последние выпуски программы ABBYY FineReader 9.0 PE уже умеют напрямую распознавать формат DjVu (хочется надеяться, что скоро и остальные OCR-программы научатся).

На сегодняшний день применение формата DjVu - это наиболее приемлемый способ "электронизации" ТЕХНИЧЕСКОЙ бумажной литературы и документации - т.е. такой, которая содержит большое количество нераспознаваемой информации - формул, графиков, рисунков, схем и т.п.

Формат DjVu - это во многом шедевр инженерной мысли, оптимально воплотивший в себе несколько революционных идей по работе с "графическим текстом". На этом фоне формат PDF выглядит тупым, огромным и неуклюжим монстром - ибо таков результат жадности плохо согласованной группы западных корпораций, стремящихся "отхватить всё сразу". В качестве примера можно упомянуть проект GNUpdf - попытку создать наиболее универсальную бесплатную программную библиотеку для работы с форматом PDF. Она существует пока только лишь в состоянии разработки - ни один её релиз ещё не был выпущен. Вероятно, слишком уж сложно оказалось реализовать все "заморочки" формата PDF.

Как известно, формат DjVu не находит применения на Западе (несмотря на то, что он был создан известнейшей американской фирмой AT&T - примерно в 1996 году). Можно даже сказать, что на Западе формат DjVu практически неизвестен широкой публике, а фирма-владелец формата DjVu - Caminova - почему-то слишком вяло и неэффективно продвигает его на рынок. Причина, думается, ясна - формат DjVu слишком революционен, его повсеместное внедрение грозит нарушить сложившийся баланс сил на западном книгоиздательском рынке. Поэтому DjVu чуть ли не искусственно ("рефлекторно" и "инстинктивно") замалчивается на Западе.

К счастью, в русскоязычном Интернете сложилась диаметрально противоположная ситуация. В последние годы использование формата DjVu в Рунете переживает бурный рост и развитие. Массовое книгосканирование в формат DjVu становится своеобразным общественно-политическим явлением. Причины этого, скорее всего, следует искать в разнице между русскоязычной и западной общественной психологией и моралью: сказывается положительная часть советского воспитательного наследия - фактор, никогда не существовавший на Западе.

Формат DjVu также тесно переплетается по смыслу с другой новейшей технологией, известной как "электронная бумага" (E-Ink). Недавно появившись, эта технология уже делает первые шаги на рынке. Всё чаще и чаще новые модели E-Ink-"читалок" появляются с поддержкой формата DjVu.

Развитие E-Ink, в сочетании с использованием DjVu, сулит и вовсе невиданные перспективы: становится реальностью домашняя библиотека, состоящая из десятков и сотен тысяч книг, которые можно читать практически также, как и обыкновенные бумажные книги! (точнее, ненамного хуже). И всё это - с весьма небольшими издержками - физический объём (носителей) DjVu-книг и стоимость E-Ink-"читалок" - относительно небольшие величины (по сравнению с традиционными библиотеками бумажных книг).

Оглянитесь вокруг себя - дома, на работе, на учёбе и т.д. Вы увидите рядом с собой множество книг, журналов, газет - многие из которых до сих пор не оцифрованы. Попробуйте сами изготовить хотя бы одну электронную DjVu-книгу (журнал, газету) и выложить её в Интернет - и Вы увидите сами, насколько это просто, интересно, здорово и захватывающе. Полное описание технологии самостоятельного создания DjVu-книги имеется тут:

Как самому сделать DjVu-книгу (краткая схема)


Иванов Виктор.

Декабрь 2004.

Мой E-Mail  (monday2000 [at] yandex.ru)

Hosted by uCoz