Вернуться к разделу "Программа DjvuOCR".
- уже можно редактировать тексть после распознавания в FineReader! Добавлен алгоритм востановления вероятних позициях редактированних символов.
Для коректной работы алгоритма надо:
а) при редактирование сохранять некоторые символы оригиналного текста (например интервалы), т.е. не сносить большие блоки и писать их снова;
б) желательно сохранять количество строк в параграфе (т.е. не стирать знаки конца строки);
Можно работать и без ети правила, тогда алгоритм будеть угадывать позиция символов через интерполяция с помощью близких строк, но тогда будут видны некоторые несоответствия при маркировке текста на екране (что в общем несуществено).
- Устранен проблемм с папки и имена файлов с кирилскими буквами.
- Коректно обрабатываются таблицы, клетки которых содержат pictures.
- Скоректирован перенос слов если выбрана опциа "Normal hyphenation". До етого терялось первое полуслово.
- замечен проблем програмы DJVUSED.EXE. Когда через нее получается количество страниц в DJVU-файл (команда djvused -e n filename.djvu) то при одностраничних файлов остается один рабочий файл в корень диска, где находится програма djvused.exe.
- замечен баг, при обработка объекта, распознанного как bar-code. Моя программа не обрабатывает такие объекти. Чтобы запретит FineReader-а тоже их распознавать, надо в меню Tools/Options/General/Legacy options/ убрать опция Look for barcodes. Потом надо сохранит опции как default.
Есть новое мыло: djvuocr [почтознак] mail2world.com
Автор: gencho. djvuocr [почтознак] mail2world.com
Подготовил: monday2000.
9 марта 2007 г.
E-Mail (monday2000 [at] yandex.ru)