Вернуться к разделу "Создание книг в электронном виде из бумажных книг".
Неофициальная версия. Составил monday2000 ( http://www.djvu-soft.narod.ru/ ) на основании объяснений автора программы, собранных на известных форумах (c неоценимой помощью Arcand и других), и на основании опыта использования программы.Вследствие всего этого возможны ошибки и неточности.
Автор программы ScanKromsator: bolega ( bolega@hotmail.ru ). Домашняя страница: www.bolega.hotmail.ru.
ВАЖНО: В Пособии даётся описание только таких элементов управления программы, про которые точно известно, для чего они и как они работают. В основном приводится описание наиболее необходимых и популярных возможностей программы. В отдельных случаях некоторые возможности программы не описаны умышленно - если они плохо работают, или же малопопулярны, и т.п.
Актуального и официального хелпа к программе СканКромсатор от автора программы (bolega) пока не существует и ожидается в будущей (6-ой) версии программы. Скачать разные версии программы СканКромсатор можно в разделе "DjVu-программы".
Смотрите также:
ScanAndShare v1.061 (Также и в формате Pdf - Здесь (541 КБ) и на Зеркале ) - Мини-инструкция в картинках, описывающая полный цикл создания электронной версии книги в формате DjVu. Автор: VadimirTT. (наиболее простая и популярная инструкция).
Ужирнение трудночитаемого текста в СканКромсаторе. (Исследование одного важнейшего приёма).
СканКромсатор v5.6A. Что нового (What's new). (Автор: bolega).
О возможности альтернативы СканКромсатору. (Аналитическая статья-размышление).
Материалы по сканированию и оцифровке бумажных книг. (Подборка тематических Интернет-ссылок).
Настройки picture-зон для цветного текста или line-art. (ScanKromsator v5.91). (Автор: Melirius).
Использование ScanKromsator’а (ScanKromsator v5.91) (Автор: Melirius).
Архив устаревшей информации:
СканКромсатор v5.6A. Пособие по программе. Старая версия
СканКромсатор v1.0b. Руководство пользователя. (Вариант в формате PDF 368 КБ). (Автор: bolega). (Сильно устаревший официальный хелп к первой версии программы).
Полезные советы от bolega по работе с Кромсатором. (Материалы из форумов, не вошедшие в Пособие. Моя разработка).
Три способа получить нужную тебе научно-техническую книгу в электронном виде с минимальными затратами. (Старая статья об использовании Кромсатора. Автор: VadimirTT).
1.1.1. Вкладка Pages
1.1.2. Вкладка Book
1.1.3. Вкладка Files
1.1.4. Вкладка Options
1.1.5. Вкладка Options 2
1.1.6. Вкладка Convert
1.2.1. Элементы управления списка файлов
1.2.2. Виды выделений файлов в списке:
1.2.3. Групповое изменение опций
1.2.4. Управление списком файлов
1.2.4.1. Перемещение файлов:
1.2.4.2. Навигация по списку файлов:
1.2.4.3. Многостраничные TIF-файлы:
1.2.4.4. Разное:
1.2.5. Панель свойств загруженных файлов
1.2.6. Кнопки панели управления
1.2.7. Схема расположения резаков
1.2.8. Панель управления резаками
1.2.9. Управление резаками
1.2.10. Контекстное меню ПОЛЗУНКА любого резака
1.2.11. Пункты контекстного меню (главного окна)
1.3.1. Пункт меню File
1.3.1.1. Подпункт Task option settings
1.3.2. Пункт меню Edit
1.3.3. Пункт меню Result
2.2.1. Общее контекстное меню
2.2.2. Очистка сканов от грязи при помощи мыши
2.2.3. Окно поворота выделенного фрагмента
2.2.4. Контекстное подменю опций
Элемент | Описание | |
Split | Разделить страницу - Эта опция включает/выключает действие резака "Set internal margin or split line". Применяется для разрезания сдвоенных разворотов, или же для отрезания вертикальной полосы - ошмётка соседней страницы - в случае одиночного скана. | |
Deskew | Автоматическое устранение перекоса. Рекомендуется всегда использовать этот режим при самой первой обработке сканов. Алгоритм - Hough transform с точностью 0.1. | |
Despeckle | Автоматическое удаление соринок. Работает только на чёрно-белых сканах - а на серых и цветных не даёт никакого эффекта - это особенность самого алгоритма. Не рекомендуется к использованию на ч.б. сканах плохого качества - может удалить участки букв или грамматические точки. | |
Art | Доп. режим работы Deskew
- для страниц со сложными
художественными рисунками, таблицами и сильно
разреженных cтраниц. Применяйте в случаях, когда
обычный Deskew неправильно определяет
угол перекоса страницы. Если же и при включённом Art угол перекоса страницы определяется неправильно - тогда нужно заключить присутствующие на скане картинки или таблицы в Exclude-зону - чтобы исключить их из расчёта угла перекоса. Art имеет один недостаток - выполняется в два-три раза медленнее стандартного алгоритма. Поэтому не стоит применять его для всех страниц подряд. |
|
Orhto | Доп. режим работы Deskew - для страниц, содержимое которых расположено перпендикулярно, т.е. развёрнуто на 90 градусов. Допускается использовать одновременно с Art. | |
Automargins | Распознавающий режим резаков Эта опция должна быть всегда включена. Точное её назначение неизвестно. | |
Page h.align | Горизонтальное автоматическое выравнивание текста по площади скана. Может принимать значения: A (Auto) - в действительности это Лево; L (Left) - Лево; C (Center) - Центр; R (Right) - Право. | |
Page v.align | Вертикальное автоматическое выравнивание текста по площади скана. Может принимать значения: A (Auto) - в действительности это Верх; T (Top) - Верх; C (Center) - Центр; B (Bottom) - Низ. |
Если приглядеться, то видно, что на этом рисунке все пронумерованные элементы управления построены (автором программы) в 2 колонки - обозначенные буквами L и R. Это подопции левой (L) и правой (R) страниц. Понятия "левая" и "правая" страницы имеют смысл только при обработке сдвоенного разворота - когда одновременно с разрезанием обрабатываются образовавшиеся левая и правая половинки разворота. Активностью элементов в колонке R управляет галка Split - когда она включена, то все элементы в колонке R становятся активными - и наоборот. В случае одиночного разворота (т.е. когда ничего не нужно разрезать) этот одиночный разворот условно считается левой страницей. Итак, в колонке L находятся элементы с номерами 1,3,5,7,8,11,12,15,17; а колонке R - элементы с номерами 2,4,6,9,10,13,14,16,18. | |
Элемент № 7 | Вкл./выкл режима распознавания контура текста у резака "Cut left margin". |
Элемент № 8 | Вкл./выкл режима распознавания контура текста у резака "Cut right margin". |
Элемент № 11 (T) (Top) | Вкл./выкл режима распознавания контура текста у резака "Cut top margin". |
Элемент № 12 (B) (Bottom) | Вкл./выкл режима распознавания контура текста у резака "Cut bottom margin". |
Обычно галки 7,8,11,12 должны быть включены. Они
управляют т.н. "режимом распознавания
контура текста" у соответствующих резаков -
верхнего, нижнего, левого и правого (при
наведении мыши на ползунок каждого резака
выдаётся контекстная подсказка с его названием).
При включении этих галок соотвествующие резаки
принимают синий цвет, а при
выключении - малиновый. При синем резаке соответствующая сторона (левая, правая, верхняя, нижняя) контура текста на скане определяется автоматически - при последующей обработке по кнопке Process!. При малиновом резаке эта сторона задаётся вручную - самим положением резака. Т.е. малиновый резак режет "там, где стоит", а синий - лишь примерно задаёт границу области распознавания контура текста, а программа потом сама при обработке определит истинную линию реза. Сначала существовали только синие резаки. Но из-за неизбежных погрешностей алгоритма распознавания пришлось ввести малиновые резаки - чтобы устанавливать линию реза просто вручную - в сложных случаях, когда синие резаки неправильно срабатывают - отрезают полезные элементы текста. Наиболее часто это отдельно стоящие номера страниц и т.п. |
Элемент | Описание | |
Units | Используйте всегда значение Pixels. | |
H.Gap value | Размеры левого и правого полей, которые будут автоматически добавлены к контуру текста, определяемого программой (всё это происходит при обработке по кнопке Process!). Очень важный параметр, различный для разных dpi. Для 300 dpi следует задавать 70, для 400 dpi - 100, для 600 dpi - от 120 до 150. | |
V.Gap value | Аналогично - здесь ширина верхнего/нижнего полей страницы. | |
vert.gap = hor.gap | Вкл./выкл. режим равенства вертикальных и горизонтальных полей. Рекомендуется всегда включать. | |
Page width | Способ определения ширины страниц при
обработке по кнопке Process!. - Auto: Автоматическое определение средней ширины - самой обработкой по кнопке Process!. Рекомендованное значение. - Fixed: Обрезанная страница будет иметь заданные размеры, которые можно задавать вручную через предусмотренные справа поля. - None: Обрезанная страница не будет иметь полей - т.е. мы получим после обработки по кнопке Process! "голый текст" в чистом виде. Примечание: После обработки по кнопке Process!, если было задано Auto, программа автоматически подставляет вычисленные средние размеры страниц в поля H.Gap value и V.Gap value, и тогда нужно обязательно сменить Auto на Fixed, чтобы при повторной переделке каких-то отдельных страниц (Process current file) их размер выдерживался равным вычисленному. |
|
Page height | Аналогично - способ определения высоты страниц. |
Элемент | Описание | |
Output dir: | Папка, в которую будут сохраняться результирующие файлы. Если папка не существует, программа попытается создать её. |
|
Default | Использовать папку по умолчанию для результирующих файлов. Эта папка будет называться "out" и автоматически создастся внутри папки с исходными файлами. | |
Output prefix | Произвольный префикс,
который будет добавляться к именам выходных
файлов. |
|
Start from / step | Start from (1) - числовое
значение в имени файла, с которого начнется
нумерация выходных страниц. |
|
Name length | Длина имени выходных файлов | |
Output format: | Формат выходных изображений. |
|
DPI | Значение DPI выходных файлов. |
|
Color | Режим цветности выходных файлов. | |
Input DPI | Входное dpi. Вводится только в том случае, если обрабатываемые файлы либо не содержат значение dpi, либо оно у них неправильное. |
Элемент | Описание | |
Deskew method | Выбор алгоритма поворота скана при Deskew.
Рекомендуемый метод - Auto(shear). Fast: Стандартный поворот. Именно этот режим используется в большинстве граф. программ. Это lossless-поворот, т.е. буквы не утолщаются. Но он приводит к артефактам: сдвигу одной части буквы относительно другой и появлению эффекта "обратного italic" (для сканов <= 300 dpi). Кстати, в BookRestorer эти артефакты налицо. Fast хорош для сканов с dpi > 500 - тогда искажения практически незаметны и его можно спокойно применять - к тому же он намного быстрее всех остальных режимов поворота. Начиная с версии 5.9, Fast больше не нужен. Antialias (англ. "сглаживание, устранение контурных неровностей"): Для grey/color-сканов. Имеет интерполяцию для предотвращения артефактов (например, "ступеньки" в строках текста). Слегка неравномерно уширяет буквы. Для серых/цветных Antialias полностью идентичен Interpolate, когда-то он был придуман именно для b/w чтобы нейтрализовать артефакты. Interpolate: Для grey/color-сканов. Это Fast с билинейной интерполяцией - для предотвращения артефактов (например, "ступеньки" в строках текста). Хорош для gray и color, для b/w ничего особого не дает. На толщину повёрнутого текста влияет значение параметра convert to b/w threshold (закладка Convert). Если выбрать Interpolate и задать Сonvert = LowLight, то уширение практически исчезает, при том, что текст поворачивается так же хорошо (т.е. не деформируется ступеньками), как и при Antialias-повороте. Начиная с версии 5.9, метод Interpolate переписан на Ассемблере, поэтому работает быстрее, чем Fast. Shear (англ. "сдвиг ( фрагмента изображения )"): Метод для b/w-сканов. Auto(shear): Метод для b/w-сканов. Shear с автоматической компенсацией артефактов. Это не-интерполяционный метод. Данный метод - самый рекомендуемый. В отличие от Antialias, без побочных эффектов. Начиная с этой версии, при этом режиме grey/color-сканы поворачиваются с помощью метода Interpolate (наилучшее качество), а b/w - как и раньше, с помощью Shear-метода. Вообщем, следует использовать только Auto(Shear), который в зависимости от цветности скана сам выбирает нужный, наиболее оптимальный метод, т.е. Interpolate для серых-цветных, Shear c автокомпенсацией артефактов - для b/w. |
|
Antialias threshold | Порог сглаживания. Регулирует работу режима Antialias (см. выше). Чем этот порог меньше, тем меньше утолщение, но тем больше проявление искажения. Рекомендуемое значение - 150 - тогда буквы практически не утолщаются. | |
Resample filter | Фильтр при изменении разрешения (т.н. ресемплинг). Используйте всегда значение Bicubic. | |
Despeckle | Выбор алгоритма поворота скана при Despeckle.
Рекомендуемый метод - Normal. Примечание: любой из алгоритмов Despeckle предназначен только для ч.б. сканов - на grey/color-сканах он не производит никакого эффекта. ВАЖНО: Иногда Despeckle вообще не следует применять - на бледных или низкокачественных сканах - чтобы не удалить кусочки букв или грамматические точки. Fine:
Это "геометрический" алгоритм. Удаляются
все спеклы, меньшие определённого размера
(размер выбирается Кромсатором самостоятельно),
и даже спеклы чуть большего размера, но имеющую
определённую форму, явно указывающую на
"мусорное" происхождение. Normal: Это классический простейший алгоритм Despeckle (фильтр по среднему с апертурой 3х3 и с пропуском белых точек). Fine+Normal: Интеллектуальный метод очистки. Например, он не вычищает точки над i и j. Safe: Метод для бледных сканов, с разорванными буквами. В этом случае в процессе обработки области, занимаемые буквами, чиститься не будут. Суть его - в предварительной кластеризации текста, т.е. выделении букв, и удалении мусора только в области, не принадлежащей букве. Метод не идеальный, но буквы страдают гораздо меньше. |
|
Sand despeckle | Эта опция хоть как-то соединяет точки "песочно-образных" букв (т.е. состоящих из разрозненных точек). | |
Strong con. speckles | Это strong connected pixels (4-connected pixels). В
противоположность 8-connected pixels. Т.е. если эту опцию
включить, то пикселы, касающиеся друг друга
только по диагонали, будут интерпретироваться
как два разных, т. е. изолированных. Эта опция влияет на чистку. По умолчанию выключена, что означает: если пиксел касается другого только по диагонали, то они все равно считаются принадлежащими одному спеклу, и размер его получается больше, и вероятность его удаления понизится. Поэтому лучше не включать этот флаг. |
Элемент | Описание | |
Cutters state: | Управление режимом очистки резаков. Значение
по-умолчанию - cut&clear t/b, но
рекомендуемое значение - only cut. Влияет
также на вид галок панели управления резаками:
cut&clear t/b: выключён/включён и
засерен/включён (только резаки "верх-низ"). Засерен означает, что область за резаком будет не отрезаться при кромсании, а только очищаться. При включённом Automargins это даёт в итоге один и тот же результат. Если же юзер взял весь контроль за размерами страниц на выходе на себя (Automargins = off), то это имеет смысл. |
|
Text vert. sensivity | Вертикальная регулировка точности работы
алгоритма, распознавающего контур текста (т.е.
алгоритм по кнопке Process!) Изменять этот
параметр НЕ рекомендуется никогда. При автоматическом определении программой контура текста могут возникать неточности. Так, могут быть проигнорированы одинокие, далеко отстоящие от основного текста символы ("одиночные выступающие символы" (термин bolega) - ОВ-символы), напр. номера страниц, состоящие из одной цифры. Или последние 1-2 символа выступающей строки текста. Это известная и пока не решённая проблема. В результате эти символы могут быть потеряны (если их не перекроет задаваемое поле H.Gap Value или V.Gap Value). Рекомендуемый способ регулировки: после проработки Draft kromsate переключить в Automargins соответствующий резак с синего на малиновый и выставить его вручную сразу за ОВ-символом, который некорректно отрезается алгоритмом по кнопке Process!. |
|
Text horiz. sensivity | То же самое, что и строкою выше, только по горизонтали. |
Элемент | Описание | |
Convert to b/w threshold: | Порог конвертации в ч./б. Рекомендуемое
значение - Normal. Влияет на процедуру
конвертации grey->b/w Параметр определяет порог
grey-цвета, ниже которого точка становится черной,
а выше - белой. Диапазон 0-255. Для удобства ряд
ходовых порогов имеют имена (см. ниже). Это
странично-ориентированный параметр, т.е. для
каждой страницы его можно задавать различным. Влияет на результат, как это ни странно, при обработке цветных сканов (без перевода в b/w). Можно его поварьировать (сделать более dark, если скан бледный, и light, если наоборот). |
|
The same for left & right | Одно и то же для левого и правого (Вкл./Выкл.) Имеет смысл только при работе со сдвоенными разворотами. | |
Left page: |
Значение порога конвертации для левой
страницы. Подбирается экспериментально в
зависимости от степени бледности скана.
Неправильно выбранный порог приводит либо к
потере деталей, либо к излишнему замусорению
скана. Normal, LowDark, MiddleDark, LowLight, MiddleLight,
HighLight: обычные ходовые пороги. Smooth очень хорошо работает на
чрезвычайно блёклых сканах или сканах поганого
качества (например, с очень низким dpi). User: Значение порога задаётся
пользователем. При выборе User появляются
окошки выбора значения порога: |
|
Right page: | Значение порога конвертации для правой
страницы Аналогично - для правой страницы. |
Элемент | Описание |
Жирная зелёная галочка (другое
название - "marked"-файл). Её смысл: 1. Пометка на обработку (по кнопке Process!) данного файла - это сейчас основной смысл. Только те файлы, напротив которых стоит эта галка, будут обработаны после нажатия кнопки Process!. 2. Запоминание (для последующей обработки по кнопке Process!) текущих изменённых индивидуальных настроек файла - уже устаревший смысл (из-за кнопки "Auto-accept options is on/off"). Когда-то после изменения опций (например, подвинули резак) необходимо было "перещёлкнуть" эту галочку - т.е. снять её и вновь поставить - иначе изменённые опции не запоминались, но в последних версиях Кромсатора появилась специальная (для этой проблемы) кнопка "Auto-accept options is on/off" - когда она включена, "перещёлкивать" галочки (после изменения опций) уже не надо. Эта кнопка теперь включена по умолчанию. |
|
Щёлкнуть мышкой на любой (обычно последний) файл в списке, нажать эту кнопку - автоматически проставятся жирные зелёные галочки на всех файлах в списке, предшествующих ему. | |
Щёлкнуть мышкой на любой файл в списке, нажать эту кнопку - на нём проставится жирная зелёная галочка. | |
Щёлкнуть мышкой на любой (обычно (пред)последний) файл в списке, нажать эту кнопку - автоматически проставятся жирные зелёные галочки на всех alternate ("чередующихся", т.е. одинаковой чётности) файлах в списке, предшествующих ему. Т.е. если стоим на чётном файле - пометятся все предыдущие ему чётные файлы, если стоим на нечётном - то пометятся все нечётные. |
Название | Описание | Способ выделения | Групповое изменение |
Marked | С жирной зелёной галочкой | Левая кнопка мыши | Клавиша Ctrl |
Selected | Выделенные красным цветом. | Клавиша Пробел (или Insert)
(при активном списке файлов). Чтобы выделить группу, нужно пробелом отметить первый файл в группе, затем стать на последний файл и нажать Shift + Пробел. |
Клавиша Shift |
Bold selected | Выделенные чёрным жирным. | Клавиша Ctrl + Пробел. |
Из таблицы видно, что, чтобы поменять опцию у группы файлов, то нужно (при изменении опции):
- Для marked-файлов держать нажатым Ctrl.
- Для selected-файлов держать нажатым Shift.
Выделение Marked (как это указано чуть выше) используется, чтобы пометить файлы, которые будут обрабатываться обработкой по кнопке Process!
Выделение Selected - это пользовательское выделение, используемое в случаях, когда нужно выделить группу файлов в списке и проделать над ней некую операцию.
Выделение Bold selected используется обработкой Draft kromsate - для того, чтобы обозначить те файлы, где хотя бы один из резаков (после Draft kromsate) установился малиновым, а не синим.
Любую опцию можно установить/сбросить/изменить у любой группы файлов. Для этого нужно при изменении опции держать нажатым Alt. Кромсатор предложит на выбор, к какой группе применить изменение (в любом случае, выдав сначала такое предупреждение):
а. Единственный файл - нажимаем на него левой кнопкой мыши и перетаскиваемо на другую позицию в списке.
б. Группа файлов:
- Команда Move selected: перемещает все выделенные (selected) файлы (выделение может быть не обязательно сплошным, а, например, через один) в определённую позицию в списке файлов. Например, можно выделить все чётные страницы и переместить их в конец списка, где они расположатся уже последовательно.
- Команда Shift selected: все выделенные файлы сдвигаются на заданное количество строк вверх или вниз, сохраняя при этом расстояние между друг другом.
- Команда Paste interliev ("вставлять файлы через один"): вставляет в список (скопированные в буфер файлы) через один, т.е. на место только чётных или только нечётных.
Если изменение порядка (как для единственного файла, так и для группы) выполняется уже после обработки по кнопке Process! (т.е. когда уже получены выходные файлы), то программа будет автоматически переименовывать и выходные файлы так, чтобы сквозная нумерация на выходе не нарушалась.
ВАЖНО: Для перемещения по списку файлов (в главном окне, а также в окне просмотра результатов), можно использовать "горячие клавиши": "q" или "[" (предыдущий) и "]" или "w" (следующий).
В списке исходных файлов нажатие стрелок, Home, End при нажатом Shift перемещают курсор на следующий selected, предыдущий selected, первый selected, последний selected соответственно.
Если открывать много TIF-файлов скопом, программа считает их одностраничными.
Если к первому открытому одностраничному TIF-файлу добавить многостраничные, она их тоже считает одностраничными.
Если первый многостраничный - то все нормально, т.е. программа распознаёт корректно все последующие добавленные файлы, какие бы (одно- или много- страничные) они ни были.
Для того, чтобы открыть несколько (не один) TIF-файлов как многостраничные, нужно при выборе команды меню (или при щелчке на кнопке открытия файлов) держать нажатым Shift. Такое явное указание было введено из-за чрезмерной длительности автоматического определения "многостраничности" открываемых TIF-файлов.
Начиная с 4-й версии, Кромсатор поддерживает полуавтоматическое добавление файлов в задание. Например, вы сканируете книгу, и файлы попадают в папку MyScan. Вы загружаете сколько есть файлов в задание. В дальнейшем, если в этой папке будут появляться от сканера новые изображения, можно просто нажимать в кромсаторе "H" (раньше для этого нужно было вызывать пункт меню add files) и они добавятся в конец задания (при условии, что сканирующая программма нумерует их).
В уже существующее задание можно добавлять новые файлы (с возможностью пересортировки, если необходимо), при этом допускаются одинаковые имена файлов (при условии, что папки у них все-таки разные).
Теперь в задании можно использовать любую смесь форматов файлов. (Ранее к multi-page-тифам, например, нельзя было добавить bmp или jpg).
Элемент | Описание | |
1. | <горизонтальный размер изображения в пикселях> х <вертикальный размер изображения в пикселях> | |
2. | <разрешение изображения в DPI> <количество цветов изображения> | |
3. | <Вид сжатия изображения> |
При запуске Кромсатора эта панель ВСЕГДА не видна. Чтобы её увидеть, надо "растянуть вверх" панель списка файлов.
- Общий вид основной панели управления.
Элемент | Описание |
Load image files - загрузить графические файлы. | |
Save current task - cохранить текущее задание. | |
Fit image - растянуть изображение по ширине окна. | |
Draft kromsate - т.е. запустить процедуру автоматической предварительной расстановки резаков - по всем загруженным сырым сканам. | |
Запустить обработку marked-файлов (т.е. помеченных жирными зелёными галочками). | |
Process current file - обработать текущий файл. | |
Process left page - обработать текущую левую страницу. Имеет смысл только при обработке сдвоенных разворотов. | |
Process right page - аналогично для текущей правой страницы. | |
(Выкл.) (Вкл.) |
Auto-accept changings option - Автопринятие
изменения опций Включена по умолчанию. Рекомендуется иметь эту кнопку всегда включённой. Выключать её имеет смысл только при использовании кнопки Preview на вкладке Quality - т.к. при смене dpi кромсатор не корректирует положения резаков. |
Image zoom - масштаб изображения. | |
Rotate image - поворот изображения. Можно держать Ctrl или Alt при изменении значения в этом комбобоксе. Ctrl - повернет для всех, Alt - спросит, для каких. |
(Изображение уменьшено) |
Элемент | Описание |
1. - (Set internal margin) | ? | |
2. - (Set internal margin or split line) | Резак для разрезания сдвоенных разворотов | |
3. - (Cut top margin) | Верхний резак | |
4. - (Cut left margin) | Левый резак | |
5. - (Cut bottom margin) | Нижний резак | |
6. - (Cut right margin) | Правый резак |
- Общий вид панели управления резаками.
При запуске Кромсатора эта панель ВСЕГДА не видна полностью. Чтобы её увидеть, надо "заузить" панель списка файлов.
Элемент | Описание |
1. (Cut left margin) | Вкл./выкл. левый резак |
2. (Cut right margin) | Вкл./выкл. правый резак |
3. | ? (Возможно, это ранее было управление резаком для разрезания сдвоенных разворотов, который теперь не отключается, а просто его действенность включается/выключается галкой Split) |
4. (Cut internal2 margin) | Вкл./выкл. резак Set internal margin (?) |
5. (left cutter position) | Координата левого резака |
6. (first internal cutter position) | Координата резака для разрезания сдвоенных разворотов |
7. (right cutter position) | Координата правого резака |
8. (second internal cutter position) | Координата резака Set internal margin (?) |
9. (Cut/clear top margin) | Вкл./выкл. верхний резак |
10. (Cut/clear bottom margin) | Вкл./выкл. нижний резак |
11. (top cutter position) | Координата верхнего резака |
12. (bottom cutter position) | Координата нижнего резака |
13. (left page width) | Расстояние между левым и правым резаком (при выкл. Split) или между левым резаком и резаком для разрезания сдвоенных разворотов (при вкл. Split) |
14. (left page height) | Расстояние между верхним и нижним резаком |
15. (right page width) | Расстояние между резаком для разрезания сдвоенных разворотов и правым резаком (при вкл. Split) |
16. (right page height) | Расстояние между верхним и нижним резаком |
Чтобы двигать сразу два резака синхронно (например, верхний и нижний), нужно держать нажатым Ctrl.
Резаки можно наклонять (чтобы лучше отсекать грязь и полосы на перекошенных сканах). Для этого нужно двигать ползунок резака правой клавишей мыши, либо левой, но с нажатым Shift. Двойной щелчок на ползунке выпрямляет резак.
Если нужно убрать тень и мусор от разворота, но при этом не разрезать разворот на две части, то нужно убрать опцию Split, но оставить оба внутренних резака. В этом случае область между ними будет просто очищаться.
Резаки синхронизируются с картинкой при изменении масштаба, повороте и отражении.
Можно на панели управления резаками в контекстном меню элемента, в котором выводятся координаты резаков (Xi1=..., Xi2=..., и т.п.) выбрать команду Reset cutter position - соответствующий резак подойдет к соответствующему краю страницы и станет виден.
Отключение резаков скопом не предусмотрено (чревато). Но выход есть - нужно вывести резаки за пределы картинки.
Элемент | Описание |
Reset slope | Убрать наклон резака (т.е. "выпрямить" его). |
Copy current position to > | Распространить позицию данного резака на ... Подробнее - см. ниже таблицу |
Copy current position to | Распространить позицию данного резака на ... |
Пункт меню | Назначение |
all marked |
все файлы, отмеченные жирной зелёной галочкой. |
all down |
все нижележащие файлы |
all up |
все вышележащие файлы |
alternate down |
все нижележащие файлы той же чётности |
all selected |
все выбранные красным файлы |
Редактировать теперь можно и исходное изображение (в отличие от старых версий), хотя операций и меньше, чем для выходного. Поддерживается редактирование для многостраничных тифов.
Исходный файл можно чистить (Mouse-Up mode -> Clear selection) и сохранять (Auto save).
Для исходного изображения имеется операция быстрого удаления любой тонкой сплошной длинной чёрной линии (хорошо удалять подчёркивания ручкой). Пока только для исходного b/w-скана. Нажав Ctrl + Shift, щёлкните по любой черной точке контура. Но учтите, что если линия касается буквы, то и буква удалится.
При редактировании изображений (как исходного, так и выходного) поддерживаются не только прямоугольные выделения, но и эллиптические и произвольной формы, нарисованные мышкой.
Пункт меню | Назначение |
Zoom rectangle |
Увеличить выделенный фрагмент во весь экран |
Show selection |
По этой команде создаётся небольшое окошко (их можно создавать сколько угодно), в котором будет отображаться выделенная область. В нём можно таким образом "хранить" разные варианты обработки и визуально сравнивать их. |
Crop selection |
Вырезать выделенный фрагмент в отдельное новое изображение |
Invert selection |
Инвертировать выделение - поменять местами выделенную и не-выделенную область - т.е. выделенная область становится не-выделенной, а пространство скана за пределами этой области становится выделенным. Так можно, например, выделить на изображении области вне рисунков: выделяем картинки (множественное выделение поддерживается, держать shift), и выбираем команду invert selection - тогда выделение инвертируется, т.е. выделяется все, кроме картинок. |
Deselect |
Снять выделение |
Save image | Сохранить изображение |
Undo | Откат изменения. Глубина отката - неограниченна |
Exclude region | Зона исключения. Допускается до
20 зон на страницу. Исключает действие (внутри
зоны) следующих операций:
|
Exclude and Mark as dither region | Данная зона при обработке будет переводиться в b/w по специальному алгоритму, предназначенному для правильной передачи полутоновых или цветных изображений. |
Mark as bitonal region | Bitonal-конвертирование зон. Просто спасение для точной передачи многотоновых иллюстраций. |
Mark as change contrast region | Зона изменения контраста. Значение контраста берется из окошка Contrast, закладка Contrast, при условии, что применение изменения контраста глобально (ко всему изображению) отключено. Т.е. если на закладке Contrast стоит галка на Enabled, то contrast-zones игнорируются. |
Mark as floodfill region | FloodFill-зоны работают только для b/w. Заливается белым цветом чёрная область, начиная от центра зоны. Если окажется, что в центре зоны - белый пиксел, то кромсатор будет искать черный пиксел в пределах зоны, начиная от центра и двигаясь по спирали. Если в пределах зоны не будет чёрных пикселей, то ничего выполняться не будет. Заливка чёрной области выполняется применительно ко всей области, т.е. не ограничивается размером зоны. Т.е. зона нужна только для того, чтобы задать своим центром начальную координату, с которой будет выполняться заливка. |
Delete all regions | Удалить все выделенные участки |
Delete selected region | Удалить выделенный участок |
v Ruler | С его помощью можно мерить не только расстояния, но и одновременно угол наклона. Запись измеренного угла: включить режим измерения углов (меню Ruler), щёлкнуть на первой точке линии измерения и, не отпуская кнопку мышки, подвести её курсор к другой точке этой же линии. За мышкой будет следовать "резиновая" линия, рядом с которой будет выводиться угол наклона линии. Если затем отпустить кнопку мыши и при этом держать нажатым Ctrl (или Shift), то измеренный угол занесётся в поле Fixed deskew angle (вкладка Pages кнопка special...) с тем же знаком, что и знак, выдаваемый Ruler. На этот жёстко заданный угол кромсатор и будет поворачивать скан при обработке. Кстати, все углы в кромсаторе трактуются одинаково, т.е. + означает поворот против часовой стрелки. |
Units > | Единицы измерения |
No Zoom Filter |
Выключение фильтра отображения изображения. Это удобно при делать при работе с цветными сканами - чтобы меньше тормозило. |
• Linear Zoom Filter |
Использовать линейный фильтр отображения изображения. |
Mouse-Up mode > |
Выбор смысла прямоугольного выделения мышью см. далее подробнее |
Selection form > |
Выбор формы инструмента выделения фрагмента см. далее подробнее |
v AutoSave |
Автосохранение текущего файла при переходе к следующему. Удобно при редактировании каждой страницы. |
v Do not show save dialog |
? |
Convert to bitonal Ctrl+Y |
Преобразовать в битональное
изображение. То есть применить dithering (или
растрирование) к серому изображению - т.к. его
прямое преобразование его в ч.б. испортит его.
Dithering (дизеринг) - это имитация серого (8-битного)
изображения мелкими чёрно-белыми точками,
построенными на скане так, что dithering-изображение
издалека очень похоже на исходное серое - однако,
является уже 1-битным - т.е. чёрно-белым. Алгоритм работы с Convert to bitonal: страницы с худ.картинками сканируем в grey, преобразуем иллюстрации (т.е. отдельные фрагменты страницы) в bitonal, нажимаем Preview (при этом т.к. выходной формат задан b/w, получаем исходный файл уже как b/w), сохраняем его и в итоге на входе программа уже имеет b/w-файл, но с иллюстрациями, почти не попорченными прямым конвертированием в b/w. Надо еще чтобы use error dithering был включен, там же, в меню. |
Convert to b/w Ctrl+U |
Преобразовать в ч.б. При этом порог конвертации берется из текущего значения Convert to b/w threshold на закладке Convert). При этом формат файла не изменяется, просто заданный кусок преобразуется в b/w и возвращается на место, т.е. файл как был, так и остаётся 8-битным (серым) - а преобразованная картинка построена теперь уже только лишь из чёрного и белого цветов. |
Convert to grey |
Конвертирует выделенную область на цветном изображении в grey. Команда не является опцией обработки. |
Mouse-Up mode | Выбор смысла прямоугольного выделения мышью |
Пункт меню | Назначение |
v Set exclude region |
Установить зону исключения |
Mark as dither region |
Пометить как dithering-зону |
Mark as change contrast region |
Пометить как зону изменения контраста |
Clear selection |
Очистить выделение. Это очень удобный режим для ручной чистки от мусора. Выделяем грязь прямоугольником мышью, отпускаем левую кнопку мыши - и весь выделенный прямоугольник очищается. |
Convert to b/w |
Конвертировать в чёрно-белое |
Convert to bitonal |
Конвертировать в dithering |
ПРИМЕЧАНИЕ: В этом разделе будут рассмотрены только наиболее важные и интересные пункты меню. О смысле и значении остальных пунктов меню (которые мы не будем рассматривать) легко догадаться, исходя из прочих разделов данного Пособия.
В программе существует такое понятие, как "Задание". Задание - это информация о загруженных в программу файлах, расставленных по ним резакам, выставленным опциям и т.д. Задание можно сохранять и открывать заново. Использование задания позволяет прерывать и снова возобновлять обработку сканов
Open task | Открыть задание |
Save task | Сохранить задание |
Close task | Закрыть задание |
Task options settings | Открыть окно выбора пакета опций |
Опции программы, изменённые пользователем, можно сохранять в виде набора, и потом использовать повторно.
Для этого в окне File->Task options settings задайте нужный набор опций, присвойте этому набору любое имя и сохраните его (кнопка Save). Можно создать сколько угодно таких наборов default-опций - со своими именами. Один из таких наборов будет набором по-умолчанию (поставите в нём галку на Use as default options) - он будет автоматически загружаться при открытии Кромсатора.
Перед созданием нового задания можно загружать любой набор - тогда эти опции восстановятся. После этого можно загружать новые изображения. Например, можно сделать отдельные наборы для 300dpi, 600dpi, и т.д.
Clear all options | Очистить все опции. Эта команда сбрасывает все опции программы в нулевые значения (причём, они не совпадают со значениями по-умолчанию). Очень удобно для нестандартных обработок. |
Result | |
Пункт меню | Назначение |
View all |
Открывает редактор
постобработки, если в Кромсаторе имеются файлы,
прошедшие обработку, то есть выполняются
условия: 1. В списке файлов есть хотя бы один marked-файл. 2. Существует папка для выходных файлов. 3. В этой папке есть хотя бы один файл, соответствующий какому-либо marked-файлу (он и загрузится в редактор постообработки). Информацию о файлах, прошедших обработку, можно сохранить в файл задания (меню File -> Save task) и затем загрузить её обратно в программу (меню File -> Open task). После этого можно опять открыть редактор постобработки (выбрав View all) и продолжить там обработку выходных файлов. |
Show source files |
Возможность в окне просмотра результата редактировать исходные файлы. |
Общий вид панели управления редактора постобработки:
Обе панельки инструментов - плавающие, их можно пристыковать к бокам или превратить в окошки и закрыть (Right click - Hide) - чтобы увеличить "эффективный" размер экрана. Для того, чтобы опять включить их, надо выбрать в контекстном меню Options... -> Show navigate command's panel и/или Show edit command's panel.
Элемент | Описание |
- First page | Перейти к первой странице |
- Previous page | Перейти к предыдущей странице |
- Next page | Перейти к следующей странице |
- Last page | Перейти к последней странице |
- Fit | Сделать масштаб "по ширине страницы" |
- Sync original scan with current image | Если включить опцию “Sync”, то при навигации по выходным файлам будет производиться автоматическая смена изображений и в окне с исходными файлами. |
- Image zoom |
Регулировка масштаба |
- Page number |
Переход к странице с нужным номером |
- Panels layout |
Режим отображения страниц |
- Shift image increment value | - Можно двигать изображение клавишами "Alt + стрелка". Здесь задаётся шаг смещения. |
- Copy | Копировать |
- Cut | Вырезать |
- Paste | Вклеить |
- Undo | Отменить |
- Auto-clear mode | Режим автоочистки |
- Auto-despeckle mode | Режим автоудаления соринок |
- Eraser | Ластик |
- Crop | Вырезающий прямоугольник |
- Show stamp | Показать штамп |
- Clear options | Показать диалог с опциями очистки |
- Rotate selection | Показать диалог вращения выделенного фрмагмента |
Чтобы пометить файл (как selected, т.е. красным) в списке файлов основного окна, находясь при этом в окне редактора постобработки Result view, нужно нажать F2 или F2 и F3 (для левого и правого файла, в случае, если в окне просматриваются сразу два выходных файла). Это бывает необходимо, чтобы отметить неправильно обработанный файл. Пометив таким образом все (или один) такие файлы, можно вернуться в главное окно Кромсатора, подправить помеченные файлы и дать команду process selected.
Во окне Result view нажатие Backspace перемещает на предыдущую просмотренную страницу (например, смотрели 10-ую, потом 15-ую - нажали Backspace и вернулись к 10-ой, а не к 14-ой). Ctrl + Backspace - на страницу, с которой началось просматривание в окне Result view.
Форму выделения можно запомнить в буфер обмена (Ctrl-Insert), потом восстановить - на этом же, или на другом файле (Shift-Insert).
Может ли Кромсатор делать despeckle для белых точек на чёрном фоне? Да, но только в окне редактора постобработки Result view (т.е. в основном окне программы не может).
Для листания страниц используются следующие "горячие клавиши": вперед - w и ], назад - q и [. Листает также нажатие средней кнопки мыши. В последнем случае направление листания можно задать, выбрав соответствующую опцию в контекстном меню Options... -> Middle button click -> (Forward, Backward, None).
Ctrl-Shift-щелчок мыши на b/w работает как floodfill, на grey/color - как magic wand.
Hotkey: в случае, если zoom таков, что изображение не вмещается целиком в окно просмотра, "A" или ":" делают видимым верхнюю часть изображения, а "S" или """ - нижнюю, т.е. быстрый скролл вверх-вниз.
В версии 5.6A почти все операции редактирования доступны во всех режимах просмотра (одиночная страница/две страницы/сравнение с оригиналом). Активное окно подсвечивается.
Некоторые возможности редактора постобработки:
Пункт меню | Назначение |
Special... > |
Специальные возможности |
Clear |
Очистить выделение |
Crop |
Вырезать выделение в отдельный файл |
Rotate selection Ctrl+R |
Поворот выделения. Rotate selection нельзя пользоваться в режиме показа Two pages. Просто в этом случае не всегда понятно, к какому из двух изображений применять команду. Сейчас в принципе это можно определить по тому, где вызвано контекстное меню, но когда будет общее меню и плавающая панель инструментов - тогда проблема. |
Stamp > |
Работа со штампом |
Undo Ctrl+Z |
Безлимитный |
Save |
Сохранить |
Image info Ctrl+I |
Информация об изображении |
Options... > |
Подменю с опциями |
Zoom rectangle Ctrl+W |
Увеличить выделенный прямоугольник во всё окно |
Fit Ctrl+F |
Сделать масштаб по ширине окна |
Fit height Ctrl+H |
Сделать масштаб по высота скана окна |
Copy Ctrl+Ins |
В clipboard можно Copy не только из кромсатора, но и из любых графических программ |
Cut Ctrl+X |
Вырезать |
Move Ctrl+M |
Двигать |
Shift image |
Сместить изображение |
Paste Shift+Ins |
После Paste фрагмент можно двигать, растягивать и только потом merge. Выделяем, Copy. Paste - участок появится поверху страницы и он ещё не слит с ней, т.е. его можно таскать или изменять размеры. Если же ещё нажать клавишу T (разницу почувствуете сразу же после нажатия), то последущий merge будет выполнен с прозрачностью, т.е. белый цвет будет прозрачным. Для того, чтобы окончательно слить участок с изображением, выбираете команду merge в контекстном меню или щелкаете в любом месте за пределами участка. В новой версии добавлена ещё возможность сделать прямоугольнички по краям участка (grips) однопиксельными, а то при копировании малых участков эти грипы все заслоняли. |
Invert selection |
Обратить выделение |
Deselect |
Убрать выделение |
v AutoSave |
Автоматическое сохранение данного файла при переходе к последующему. |
v AutoClear |
После взвода AutoClear выделения мышкой будут чиститься автоматически, в момент отпускания клавиши мыши. |
Clear options |
Опции очистки |
Clean color > |
Цвет, которым будет закрашиваться очищаемая область |
Convert to bitonal |
Конвертировать в dithering |
Convert to b/w | Конвертировать в чёрно-белое |
Draw > | Вызов подменю рисования |
Restore last selections | Начиная с версии 5.05, в
Кромсаторе есть одна хитрая возможность -
предположим, что вы почистили (в режиме autoclear)
изображение и вдруг обнаружили, что по каким-то
причинам страницу нужно пере-обработать (иногда
такое бывает: обнаруживаешь, что часть страницы
была блеклая и despeckle эту часть повредил). Тогда
заключаете эту часть страницы в exclude-зону,
которую despeckle трогать не будет,
переобрабатываете страницу, и чтобы не чистить
страницу по новой, выбираете команду restore last
selections и нажимаете Delete. В результате команда
отселектирует все зоны, которые были зачищены
при предыдущей обработке, и по нажатию del очистит
их. Если же при ручной чистке использовалось despeckle-removing (с помощью Ctrl-Mouse Up), то такие зоны тоже передеспеклятся (в таком же режиме) автоматом, а на странице выделятся желтой подсветкой, аналогично и для случая, если имело место despeckle белых пятен на чёрном фоне (Ctl-Shift-MouseUp), только подсветка будет зеленой. |
Text label > | Работа с текстовой пометкой |
Любой из возможных алгоритмов Despeckle не в состоянии полностью и автоматически очистить скан от соринок, грязи, мусора, и т.п. Поэтому иногда следует вручную почистить сканы после Despeckle (а иногда и вместо Despeckle - если сканы бледные, плохо пропечатанные - и Despeckle может их попортить).
Настройка:
Чистка:
Выделяем фрагмент, в момент конца выделения, когда кнопка мышки отпускается, выделенный фрагмент полностью очищается. Цвет, которым заливается, зависит от опции Clean color (white/black). Цвет можно также быстро изменить просто двойным щелчком мышки на изображении.
б. Despeckle-очистка: (рекомендуемая)
Если при этом держать нажатым Shift, то будет не очистка, а despeckle (обращаю внимание, что despeckle применяется не ко всему изображению, а только к выделенной области). Следует увеличить (см. ниже окно Clear options) допустимый Speckle size (рекомендуемое значение - Speckle size (fine) = 20), и тогда чистка будет намного лучше, чем просто Despeckle при обработке (по кнопке Process!), но нужно следить, чтобы выделение не захватывало знаков препинания. Режим хорош тем, что не нужно точно позиционировать выделение на мусор, можно захватывать и текст, он в большинстве случаев не пострадает. Таким образом, Despeckle-очистка гораздо менее трудоёмка, чем простая очистка, только самые большие кусочки мусора надо вычищать всё-таки простой очисткой (т.е. через Shift при Despeckle-очистке).
Если при этом держать нажатым и Shift, и ещё Ctrl, то despeckle будет работать не для чёрного мусора, а для белого, т.е. закрашивать мелкие белые пятна на чёрном фоне. Если после этого остаются пятна, которые больше, чем заданный Speckle size, то делаем двойной щелчок (т.е. переключаемся на заливку чёрным), выделяем пятно, отпускаем мышку - пятно закрасилось. Снова двойной щелчок, чтобы вернуться к белой заливке. При despeckle белых пятен нужно быть осторожным с текстом - внутренние замкнутые полости ряда букв часто имеют малые размеры и могут при этом легко закраситься чёрным!
Можно сделать немного по-другому: с самого
начала в окне Clear options установить Change
mode by mouse dbl-click = Clear/despeckle (чтобы
двойным кликом быстро переключаться от чистки
полной до чистки по типу despeckle). Вообще поведение клавиш (Shift, Ctrl) можно изменять - в окне Clear Options. Т.е. можно задать, чтобы при простом отпускании мыши был despeckle, а с Shift - чистка. Кому как нравится. По умолчанию используется Clear Options -> Despeckle method -> Fine. Можно дополнительно указать использовать Fine+Normal. Но размеры допустимых спеклов для Normal (они задаются раздельно, для Fine - одни (поле Speckle size (fine)), для Normal - другие (поле Speckle size (normal)) лучше не увеличивать. Т.к. Normal не просто чистит мусор, но и убирает лохматинки с букв. |
Элемент | Описание |
Speckle size (fine) | Максимальный размер соринок, которые будут удаляться выделением мышью |
Action | MouseUp - clear, Shift+MouseUp - despeckle MouseUp - despeckle, Shift+MouseUp - clear MouseUp - clear, CapsLock=On - MouseUp - despeckle Выбор режима очистки мышью |
Там ещё есть несколько операций с magic color. Это для цветных сканов (или для цветных иллюстраций). Штука сильная. Позволяет "выравнивать" цвет, делать как бы цветовой despeckle и сlean и т.п. Как это работает, объяснять долго, это будет описано в будущей доке.
В Clear options сохраняется список цветов, использованных при magic clear (только в пределах сессии).
Rotate selection. (Поворот выделения). Работает для выделенного участка (можно всю страницу). Тут можно задать угол поворота, либо расчитать его автоматом (кнопка auto 2), потом нажать Paste (положит обратно, но не сольёт, т.е. можно будет подвигать мышкой) или Paste and merge (положит и сольёт сразу). Сброс угла - кнопка 1, выбор направления поворота - в группе Rotate direction; можно выбрать алгоритм поворота в списке 3. Можно включить режим прозрачного наложения Merge with transparency. Есть окошко предварительного просмотра 5, где можно щёлкать мышью на картинке, и она будет увеличиваться (для возврата к исходному масштабу нажмите кнопку fit image 4), а ещё можно "схватить" и "таскать" картинку мышью в окне предварительного просмотра.
Options... | |
Пункт меню | Назначение |
• Mouse Wheel -> Zoom |
Включить режим, когда вращение колёсика мыши изменяет масштаб |
Mouse Wheel -> Scroll |
Включить режим, когда вращение колёсика мыши прокручивает скан |
MouseWheel -> Navigate |
Включить режим, когда вращение колёсика мыши листает сканы |
Middle button click > |
Выбор смысла работы средней кнопки мыши |
v Auto merge |
? |
No Zoom Filter |
Отключить фильтр отображения сканов |
• Linear Zoom Filter |
Включить линейный фильтр
отображения сканов Одна страница 600dpi grey или color занимает в несжатом виде (а именно так windows работает с битмапами) от 50 до 100 МБ - именно из-за этого Кромсатор долго отображает такие сканы при включенном фильтре, ведь фильтр на каждую точку анализирует 9 соседних, т.е. умножьте объём ещё на 10. Нагрузка на кэш процессора колоссальная. |
Nonlinear Zoom Filter |
Включить нелинейный фильтр отображения сканов |
v No zoom filter for source images |
Если эта опция активна, в режиме "сравнение с оригиналом" левое изображение, т.е. оригинал, отображается без фильтра. |
v Lock undo |
Возможность блокировки undo-менеджера. |
v Remove text label after merge |
? |
v Show navigate command's panel |
Показать плавающую кнопочную панель - Панель навигации |
v Show edit command's panel |
Показать плавающую кнопочную панель - Панель редактирования |
Selection form > |
Выбор формы выбирающего инструмента - прямоугольник или полигон |
При самом первом сеансе работы с Кромсатором убедитесь, что кнопка с галкой Auto-accept changings option is on/off (в верхней панели) включена и галка на ней имеет зелёный цвет. Кнопка должна выглядеть вот так: . Это означает, что все изменения опций, которые Вы cделаете, будут фиксироваться автоматом. Иначе, как только Вы сместите фокус с файла, все выставленные Вами опции (например, позиции резаков) уйдут.
Коротко алгоритм работы со СканКромсатором:
(Это лишь концептуальное описание - для общего понимания сути работы с программой)
1. Предварительная обработка.
Загружаем сырые сканы и разрезаем вручную (для полного визуального контроля над процессом) сдвоенные развороты или же, если это одиночные сканы, отрезаем у каждого скана ошмёток соседней страницы в виде вертикальной полосы.
Это делается так: Выбираем в меню Edit -> Clear all options. Затем кликаем мышью последний файл в списке загруженных и нажимаем кнопку Apply up to current - от этого на всех файлах в списке проставятся жирные зелёные галочки. Удерживая Ctrl, выставляем на вкладке Pages галку Split (разрезать сканы) и галку Deskew (чтобы применить Deskew ко всем получаемым в процессе разрезания сканам). Позиционируем резак Set internal margin or split line над линией смыкания 2-х соседних страниц на самом первом скане. Нажимаем правой кнопкой мыши на ползунок этого резака, и в появившемся контекстном меню выбираем пункт Copy current position to -> all down. Тем самым, данная позиция резака распространится на все нижележащие сканы. Теперь нужно пройти дальше по всем сканам - при помощи клавиатурных клавиш "q" и "w" (или "[" и "]") и вручную подкорректировать позицию разрезающего резака - чтобы она проходила над линией смыкания 2-х соседних страниц на всех сканах. При необходимости повторяйте Copy current position to -> all down.
Выставляем прочие нужные опции (Output dir и т.п.) и нажимаем кнопку Process!. Ждём, пока все сканы не разрежутся.
Выходим из программы.
2. Окончательная обработка.
Загружаем в программу полуобработанные после 1-го этапа сканы. Нажимаем кнопку Draft kromsate . В открывшемся окне нажимаем OK. Запустится процедура автоматической предварительной расстановки резаков - по всем загруженным сканам.
После окончания работы Draft kromsate проходим вручную по всем сканам и корректируем неправильно выставившееся резаки. Принцип в том, что резаки не должны отсекать ничего полезного, но в то же время они должны по максимуму отсекать всю грязь от текста. Некоторые резаки после Draft kromsate будут вообще отключены - тогда их можно включить (если нужно) на панели управления резаками - вот её изображение:
На разряженных страницы, где мало текста (титульные страницы, оглавления, страницы с выступающими одинокими строками и т.д.), Draft kromsate автоматически переключит некоторые резаки с синего на малиновый - чтобы подчеркнуть место неуверенного распознавания контура текста. В списке файлов такой скан будет выделен чёрным жирным цветом. Зачастую следует вручную подкорректировать малиновые резаки (после Draft kromsate) и переключить их обратно на синий режим - для простоты.
Если нужно - можно на данном этапе сохранить задание на диск (меню File -> Save task) и возобновить работу позже.
Выставляем на вкладках программы желаемые опции обработки (Despeckle и т.п., можно повторно Deskew для надёжности).
Нажимаем кнопку Process! и ждём. Начинается автоматическая финальная обработка сканов (включая обрезку).
После обработки (по кнопке Process!), переключаемся на вкладку Book. Программа автоматически подставила вычисленные средние размеры страниц в поля H.Gap value и V.Gap value. Теперь нужно обязательно сменить там Auto на Fixed, чтобы при повторной переделке каких-то отдельных страниц (Process current file) их размер выдерживался равным среднему вычисленному.
Если нужно - можно на данном этапе сохранить задание на диск (меню File -> Save task) и возобновить работу позже.
Просматриваем полученные сканы в редакторе постобработки (меню Result -> View all). Если мы замечаем, что где-то неправильно отрезался отдельно стоящий номер страницы, или же кусочек строки - возвращаемся в главное окно программы, становимся на нужный скан, и корректируем нужный резак. Как правило, нужно при этом переключить этот резак с синего на малиновый - путём сброса соответствующей галки в группе Automargins на вкладке Pages. Откорректировав резаки, нажимаем кнопку Process current file (обработать текущий файл) - и данный скан перенарежется по-новому.
Вот и всё - таков вкратце алгоритм работы с программой.
Draft kromsate - это автоматическая расстановка резаков самой программой, т.е. автоматизация самой нудной и рутинной работы. Draft kromsate - это т.н. алгоритм автоматической сегментации, т.е. определение логических блоков, занимаемых на скане полезным текстом и грязью. Задача Draft kromsate - только расставить резаки на сканах (приблизительно), он не вычисляет размеров финальных страниц.
Основная обработка по кнопке Process! - это автоматический алгоритм распознавания контура текста на скане. В процессе этой обработки программа автоматически анализирует область внутри резаков, находит контур текста, и обрезает по нему. Попутно к скану применяются Despeckle, Deskew и т.п. Получается т.н. "голый текст", без полей. Далее рассчитываются средние ширина и высота голых текстов (и заносятся в поля Page width и Page height на вкладке Book), создаётся пустой шаблон с этими размерами, каждый голый текст копируется на копию этого шаблона (с относительным выравниванием, задаваемым в полях ввода Page h.align и Page v.align на вкладке Pages), а затем к этой копии добавляются поля заданного размера (размеры берутся из полей ввода H.Gap value и V.Gap value на вкладке Book). Так и получаются конечные обработанные сканы.
Кроме того, кнопка Process! служит для запуска более простых обработок, задание для которых составляет пользователь, выставляя свои опции в программе.
Резаки имеют 2 состояния - синий режим и малиновый режим. Резаки - это всего лишь подсказка для работы обработки по кнопке Process!. Важно понимать, что синий резак - не режет, он лишь очерчивает зону, внутри которой обработка по кнопке Process! будет полностью автоматически искать контур текста - и по нему реально и отрежет. В случае синего резака линия реального разреза будет где-то внутри (зоны, очерченной синими резаками) и она будет параллельно данному синему резаку (но есть исключение - синие Split-резаки Set internal margin и Set internal margin or split line не меняют никогда свой цвет и всегда режут скан по тому месту, над которым находятся - т.к. при разрезании сканов пополам никакое зональное распознавание не требуется).
ВАЖНО: Между синим резаком и соответствующей стороной контура текста (по которой и будет реально отрезано) может находиться произвольное количество белого пространства - это никак не влияет на правильную работу обработки по кнопке Process!. Важно лишь, чтобы там было как можно меньше грязи - иначе она будет принята Process!'ом за полезный текст, что приведёт к ненужному увеличению средних ширины и высоты голых текстов.
Иногда Draft kromsate автоматически отключает некоторые синие резаки - это означает, что Draft kromsate счёл, что с данной стороны текста никакой грязи нет и резак как подсказка не нужен. Однако, это не всегда так - в этом случае нужно вручную включить нужный синий резак (установкой соответствующей галки на панели управления резаками) и вручную выставить его.
Однако, полностью автоматическое (алгоритмическое) определение контура текста невозможно в принципе. Поэтому было введено понятие "малиновый резак". Малиновый резак - это "настоящий" резак, т.е. он режет скан именно по тому месту, над которым находится (только потом ещё к скану тоже поля навешиваюся). Малиновый резак - это средство ручной корректировки работы обработки по кнопке Process!.
Наиболее типичное применение малинового резака - это борьба с некорректным отрезанием ОВ-символов ("одиночные выступающие символы") - отстоящих далеко от основного текста номеров страниц, параграфов, кусочков строк и т.п. - которые программе трудно опознать как смысловые элементы - для этого потребовалось бы проводить полноценный OCR (т.е. распознавание текста).
Просьба ко всем желающим поддержать программу СканКромсатор: отсканируйте какую-нибудь книгу из этого списка, залейте её в Интернет, и пришлите ссылку по адресу bolega@hotmail.ru.
Автор: monday2000.
Дата создания: 27 марта 2006 г.
Изменено: 30 октября 2007 г.
E-Mail (monday2000 [at] yandex.ru)