Вернуться к разделу "Создание книг в электронном виде из бумажных книг".


СканКромсатор v5.6A

Пособие по программе


ENGLISH VERSION


Неофициальная версия. Составил monday2000 ( http://www.djvu-soft.narod.ru/ ) на основании объяснений автора программы, собранных на известных форумах (c неоценимой помощью Arcand и других), и на основании опыта использования программы.Вследствие всего этого возможны ошибки и неточности.

Автор программы ScanKromsator: bolega ( bolega@hotmail.ru ). Домашняя страница: www.bolega.hotmail.ru.

ВАЖНО: В Пособии даётся описание только таких элементов управления программы, про которые точно известно, для чего они и как они работают. В основном приводится описание наиболее необходимых и популярных возможностей программы. В отдельных случаях некоторые возможности программы не описаны умышленно - если они плохо работают, или же малопопулярны, и т.п.

Актуального и официального хелпа к программе СканКромсатор от автора программы (bolega) пока не существует и ожидается в будущей (6-ой) версии программы. Скачать разные версии программы СканКромсатор можно в разделе "DjVu-программы".


Смотрите также:

ScanAndShare v1.061 (Также и в формате Pdf - Здесь (541 КБ) и на Зеркале ) - Мини-инструкция в картинках, описывающая полный цикл создания электронной версии книги в формате DjVu. Автор: VadimirTT. (наиболее простая и популярная инструкция).

Ужирнение трудночитаемого текста в СканКромсаторе. (Исследование одного важнейшего приёма).

СканКромсатор v5.6A. Что нового (What's new). (Автор: bolega).

О возможности альтернативы СканКромсатору. (Аналитическая статья-размышление).

Материалы по сканированию и оцифровке бумажных книг. (Подборка тематических Интернет-ссылок).

Настройки picture-зон для цветного текста или line-art. (ScanKromsator v5.91). (Автор: Melirius).

Использование ScanKromsator’а (ScanKromsator v5.91) (Автор: Melirius).

Архив устаревшей информации:

СканКромсатор v5.6A. Пособие по программе. Старая версия

СканКромсатор v1.0b. Руководство пользователя.  (Вариант в формате PDF 368 КБ). (Автор: bolega).  (Сильно устаревший официальный хелп к первой версии программы).

Полезные советы от bolega по работе с Кромсатором. (Материалы из форумов, не вошедшие в Пособие. Моя разработка).

Три способа получить нужную тебе научно-техническую книгу в электронном виде с минимальными затратами. (Старая статья об использовании Кромсатора. Автор: VadimirTT).


Содержание:

1. Основной интерфейс программы

1.1 Управляющие Tab-вкладки

1.1.1. Вкладка Pages

1.1.2. Вкладка Book

1.1.3. Вкладка Files

1.1.4. Вкладка Options

1.1.5. Вкладка Options 2

1.1.6. Вкладка Convert

1.2. Общие элементы

1.2.1. Элементы управления списка файлов

1.2.2. Виды выделений файлов в списке:

1.2.3. Групповое изменение опций

1.2.4. Управление списком файлов

1.2.4.1. Перемещение файлов:

1.2.4.2. Навигация по списку файлов:

1.2.4.3. Многостраничные TIF-файлы:

1.2.4.4. Разное:

1.2.5. Панель свойств загруженных файлов

1.2.6. Кнопки панели управления

1.2.7. Схема расположения резаков

1.2.8. Панель управления резаками

1.2.9. Управление резаками

1.2.10. Контекстное меню ПОЛЗУНКА любого резака

1.2.11. Пункты контекстного меню (главного окна)

1.3. Пункты меню

1.3.1. Пункт меню File

1.3.1.1. Подпункт Task option settings

1.3.2. Пункт меню Edit

1.3.3. Пункт меню Result

2. Интерфейс редактора постобработки

2.1. Общие элементы

2.2. Пункты контекстного меню

2.2.1. Общее контекстное меню

2.2.2. Очистка сканов от грязи при помощи мыши

2.2.3. Окно поворота выделенного фрагмента

2.2.4. Контекстное подменю опций

3. Описание работы с программой

3.1. Что такое Draft kromsate:

3.2. Что такое кнопка Process!

3.3. Как работают резаки


1. Основной интерфейс программы

1.1 Управляющие Tab-вкладки

1.1.1. Вкладка Pages

Элемент Описание
Split Разделить страницу - Эта опция включает/выключает действие резака "Set internal margin or split line". Применяется для разрезания сдвоенных разворотов, или же для отрезания вертикальной полосы - ошмётка соседней страницы - в случае одиночного скана.
Deskew Автоматическое устранение перекоса. Рекомендуется всегда использовать этот режим при самой первой обработке сканов. Алгоритм - Hough transform с точностью 0.1.
Despeckle Автоматическое удаление соринок. Работает только на чёрно-белых сканах - а на серых и цветных не даёт никакого эффекта - это особенность самого алгоритма. Не рекомендуется к использованию на ч.б. сканах плохого качества - может удалить участки букв или грамматические точки.
Art Доп. режим работы Deskew - для страниц со сложными художественными рисунками, таблицами и сильно разреженных cтраниц. Применяйте в случаях, когда обычный Deskew неправильно определяет угол перекоса страницы.
Если же и при включённом Art угол перекоса страницы определяется неправильно - тогда нужно заключить присутствующие на скане картинки или таблицы в Exclude-зону - чтобы исключить их из расчёта угла перекоса.
Art имеет один недостаток - выполняется в два-три раза медленнее стандартного алгоритма. Поэтому не стоит применять его для всех страниц подряд.
Orhto Доп. режим работы Deskew - для страниц, содержимое которых расположено перпендикулярно, т.е. развёрнуто на 90 градусов. Допускается использовать одновременно с Art.
Automargins Распознавающий режим резаков Эта опция должна быть всегда включена. Точное её назначение неизвестно.
Page h.align Горизонтальное автоматическое выравнивание текста по площади скана. Может принимать значения: A (Auto) - в действительности это Лево; L (Left) - Лево; C (Center) - Центр; R (Right) - Право.
Page v.align Вертикальное автоматическое выравнивание текста по площади скана. Может принимать значения: A (Auto) - в действительности это Верх; T (Top) - Верх; C (Center) - Центр; B (Bottom) - Низ.

 

Если приглядеться, то видно, что на этом рисунке все пронумерованные элементы управления построены (автором программы) в 2 колонки - обозначенные буквами L и R. Это подопции левой (L) и правой (R) страниц. Понятия "левая" и "правая" страницы имеют смысл только при обработке сдвоенного разворота - когда одновременно с разрезанием обрабатываются образовавшиеся левая и правая половинки разворота. Активностью элементов в колонке R управляет галка Split - когда она включена, то все элементы в колонке R становятся активными - и наоборот. В случае одиночного разворота (т.е. когда ничего не нужно разрезать) этот одиночный разворот условно считается левой страницей. Итак, в колонке L находятся элементы с номерами 1,3,5,7,8,11,12,15,17; а колонке R - элементы с номерами 2,4,6,9,10,13,14,16,18.
Элемент № 7 Вкл./выкл режима распознавания контура текста у резака "Cut left margin".
Элемент № 8 Вкл./выкл режима распознавания контура текста у резака "Cut right margin".
Элемент № 11 (T) (Top) Вкл./выкл режима распознавания контура текста у резака "Cut top margin".
Элемент № 12 (B) (Bottom) Вкл./выкл режима распознавания контура текста у резака "Cut bottom margin".
Обычно галки 7,8,11,12 должны быть включены. Они управляют т.н. "режимом распознавания   контура текста" у соответствующих резаков - верхнего, нижнего, левого и правого (при наведении мыши на ползунок каждого резака выдаётся контекстная подсказка с его названием). При включении этих галок соотвествующие резаки принимают синий цвет, а при выключении - малиновый.

При синем резаке соответствующая сторона (левая, правая, верхняя, нижняя) контура текста на скане определяется автоматически - при последующей обработке по кнопке Process!. При малиновом резаке эта сторона задаётся вручную - самим положением резака. Т.е. малиновый резак режет "там, где стоит", а синий - лишь примерно задаёт границу области распознавания контура текста, а программа потом сама при обработке определит истинную линию реза.

Сначала существовали только синие резаки. Но из-за неизбежных погрешностей алгоритма распознавания пришлось ввести малиновые резаки - чтобы устанавливать линию реза просто вручную - в сложных случаях, когда синие резаки неправильно срабатывают - отрезают полезные элементы текста. Наиболее часто это отдельно стоящие номера страниц и т.п.


1.1.2. Вкладка Book

Элемент Описание
Units Используйте всегда значение Pixels.
H.Gap value Размеры левого и правого полей, которые будут автоматически добавлены к контуру текста, определяемого программой (всё это происходит при обработке по кнопке Process!). Очень важный параметр, различный для разных dpi. Для 300 dpi следует задавать 70, для 400 dpi - 100, для 600 dpi - от 120 до 150.
V.Gap value Аналогично - здесь ширина верхнего/нижнего полей страницы.
vert.gap = hor.gap Вкл./выкл. режим равенства вертикальных и горизонтальных полей. Рекомендуется всегда включать.
Page width Способ определения ширины страниц при обработке по кнопке Process!.

- Auto: Автоматическое определение средней ширины - самой обработкой по кнопке Process!. Рекомендованное значение.

- Fixed: Обрезанная страница будет иметь заданные размеры, которые можно задавать вручную через предусмотренные справа поля.

- None: Обрезанная страница не будет иметь полей - т.е. мы получим после обработки по кнопке Process! "голый текст" в чистом виде.

Примечание: После обработки по кнопке Process!, если было задано Auto, программа автоматически подставляет вычисленные средние размеры страниц в поля H.Gap value и V.Gap value, и тогда нужно обязательно сменить Auto на Fixed, чтобы при повторной переделке каких-то отдельных страниц (Process current file) их размер выдерживался равным вычисленному.

Page height Аналогично - способ определения высоты страниц.

1.1.3. Вкладка Files

Элемент Описание
Output dir:

Папка, в которую будут сохраняться результирующие файлы. Если папка не существует, программа попытается создать её.

Default Использовать папку по умолчанию для результирующих файлов. Эта папка будет называться "out" и автоматически создастся внутри папки с исходными файлами.
Output prefix

Произвольный префикс, который будет добавляться к именам выходных файлов.
Можно задать символ * - тогда на выходе будут сохраняться оригинальные имена файлов. Если при этом исходные файлы являются multi-page тифами, или просто разворотами, то исходное имя также будет сохранено, но с прибавлением соответствующего суффикса.

Start from / step

Start from (1) - числовое значение в имени файла, с которого начнется нумерация выходных страниц.
step (
2) - шаг, используемый при нумерации выходных файлов.

Name length Длина имени выходных файлов
Output format:

Формат выходных изображений.

DPI

Значение DPI выходных файлов.

Color Режим цветности выходных файлов.
Input DPI Входное dpi. Вводится только в том случае, если обрабатываемые файлы либо не содержат значение dpi, либо оно у них неправильное.

1.1.4. Вкладка Options

Элемент Описание
Deskew method Выбор алгоритма поворота скана при Deskew. Рекомендуемый метод - Auto(shear).

Fast: Стандартный поворот. Именно этот режим используется в большинстве граф. программ. Это lossless-поворот, т.е. буквы не утолщаются. Но он приводит к артефактам: сдвигу одной части буквы относительно другой и появлению эффекта "обратного italic" (для сканов <= 300 dpi). Кстати, в BookRestorer эти артефакты налицо. Fast хорош для сканов с dpi > 500 - тогда искажения практически незаметны и его можно спокойно применять - к тому же он намного быстрее всех остальных режимов поворота. Начиная с версии 5.9, Fast больше не нужен.

Antialias (англ. "сглаживание, устранение контурных неровностей"): Для grey/color-сканов. Имеет интерполяцию для предотвращения артефактов (например, "ступеньки" в строках текста). Слегка неравномерно уширяет буквы. Для серых/цветных Antialias полностью идентичен Interpolate, когда-то он был придуман именно для b/w чтобы нейтрализовать артефакты.

Interpolate: Для grey/color-сканов. Это Fast с билинейной интерполяцией - для предотвращения артефактов (например, "ступеньки" в строках текста). Хорош для gray и color, для b/w ничего особого не дает. На толщину повёрнутого текста влияет значение параметра convert to b/w threshold (закладка Convert). Если выбрать Interpolate и задать Сonvert = LowLight, то уширение практически исчезает, при том, что текст поворачивается так же хорошо (т.е. не деформируется ступеньками), как и при Antialias-повороте. Начиная с версии 5.9, метод Interpolate переписан на Ассемблере, поэтому работает быстрее, чем Fast.

Shear (англ. "сдвиг ( фрагмента изображения )"): Метод для b/w-сканов.

Auto(shear): Метод для b/w-сканов. Shear с автоматической компенсацией артефактов. Это не-интерполяционный метод. Данный метод - самый рекомендуемый. В отличие от Antialias, без побочных эффектов. Начиная с этой версии, при этом режиме grey/color-сканы поворачиваются с помощью метода Interpolate (наилучшее качество), а b/w - как и раньше, с помощью Shear-метода.

Вообщем, следует использовать только Auto(Shear), который в зависимости от цветности скана сам выбирает нужный, наиболее оптимальный метод, т.е. Interpolate для серых-цветных, Shear c автокомпенсацией артефактов - для b/w.

Antialias threshold Порог сглаживания. Регулирует работу режима Antialias (см. выше). Чем этот порог меньше, тем меньше утолщение, но тем больше проявление искажения. Рекомендуемое значение - 150 - тогда буквы практически не утолщаются.
Resample filter Фильтр при изменении разрешения (т.н. ресемплинг). Используйте всегда значение Bicubic.
Despeckle Выбор алгоритма поворота скана при Despeckle. Рекомендуемый метод - Normal.
Примечание: любой из алгоритмов Despeckle предназначен только для ч.б. сканов - на grey/color-сканах он не производит никакого эффекта.
ВАЖНО: Иногда Despeckle вообще не следует применять - на бледных или низкокачественных сканах - чтобы не удалить кусочки букв или грамматические точки.

Fine: Это "геометрический" алгоритм. Удаляются все спеклы, меньшие определённого размера (размер выбирается Кромсатором самостоятельно), и даже спеклы чуть большего размера, но имеющую определённую форму, явно указывающую на "мусорное" происхождение.
Распознаются буквы i и j и метод не позволяет "зачищать" их точки. Особенно это актуально, когда эти символы используются как индексы в математических формулах. Такой защиты, насколько известно, нет ни в одной другой программе. Метод показал свою 100% эффективность и надежность. Это самый "чистящий" метод.

Normal: Это классический простейший алгоритм Despeckle (фильтр по среднему с апертурой 3х3 и с пропуском белых точек).

Fine+Normal: Интеллектуальный метод очистки. Например, он не вычищает точки над i и j.

Safe: Метод для бледных сканов, с разорванными буквами. В этом случае в процессе обработки области, занимаемые буквами, чиститься не будут. Суть его - в предварительной кластеризации текста, т.е. выделении букв, и удалении мусора только в области, не принадлежащей букве. Метод не идеальный, но буквы страдают гораздо меньше.

Sand despeckle Эта опция хоть как-то соединяет точки "песочно-образных" букв (т.е. состоящих из разрозненных точек).
Strong con. speckles Это strong connected pixels (4-connected pixels). В противоположность 8-connected pixels. Т.е. если эту опцию включить, то пикселы, касающиеся друг друга только по диагонали, будут интерпретироваться как два разных, т. е. изолированных.

Эта опция влияет на чистку. По умолчанию выключена, что означает: если пиксел касается другого только по диагонали, то они все равно считаются принадлежащими одному спеклу, и размер его получается больше, и вероятность его удаления понизится. Поэтому лучше не включать этот флаг.


1.1.5. Вкладка Options 2

Элемент Описание
Cutters state: Управление режимом очистки резаков. Значение по-умолчанию - cut&clear t/b, но рекомендуемое значение - only cut. Влияет также на вид галок панели управления резаками:

cut&clear t/b: выключён/включён и засерен/включён (только резаки "верх-низ").
only cut
: только включён/выключён.
cut&clear all:
выключён/включён и засерен/включен (все резаки).

Засерен означает, что область за резаком будет не отрезаться при кромсании, а только очищаться. При включённом Automargins это даёт в итоге один и тот же результат. Если же юзер взял весь контроль за размерами страниц на выходе на себя (Automargins = off), то это имеет смысл.

Text vert. sensivity Вертикальная регулировка точности работы алгоритма, распознавающего контур текста (т.е. алгоритм по кнопке Process!) Изменять этот параметр НЕ рекомендуется никогда.

При автоматическом определении программой контура текста могут возникать неточности. Так, могут быть проигнорированы одинокие, далеко отстоящие от основного текста символы ("одиночные выступающие  символы" (термин bolega) - ОВ-символы), напр. номера страниц, состоящие из одной цифры. Или последние 1-2 символа выступающей строки текста. Это известная и пока не решённая проблема. В результате эти символы могут быть потеряны (если их не перекроет задаваемое поле H.Gap Value или V.Gap Value).

Рекомендуемый способ регулировки: после проработки Draft kromsate переключить в Automargins соответствующий резак с синего на малиновый и выставить его вручную сразу за ОВ-символом, который некорректно отрезается алгоритмом по кнопке Process!.

Text horiz. sensivity То же самое, что и строкою выше, только по горизонтали.

1.1.6. Вкладка Convert

Элемент Описание
Convert to b/w threshold: Порог конвертации в ч./б. Рекомендуемое значение - Normal. Влияет на процедуру конвертации grey->b/w Параметр определяет порог grey-цвета, ниже которого точка становится черной, а выше - белой. Диапазон 0-255. Для удобства ряд ходовых порогов имеют имена (см. ниже). Это странично-ориентированный параметр, т.е. для каждой страницы его можно задавать различным.

Влияет на результат, как это ни странно, при обработке цветных сканов (без перевода в b/w). Можно его поварьировать (сделать более dark, если скан бледный, и light, если наоборот).

The same for left & right Одно и то же для левого и правого (Вкл./Выкл.) Имеет смысл только при работе со сдвоенными разворотами.
 

Left page:

Значение порога конвертации для левой страницы. Подбирается экспериментально в зависимости от степени бледности скана. Неправильно выбранный порог приводит либо к потере деталей, либо к излишнему замусорению скана.

Normal, LowDark, MiddleDark, LowLight, MiddleLight, HighLight: обычные ходовые пороги.
HighDark: В отличие от остальных, не является пороговым. Он адаптивный, порог высчитывает автоматически, исходя из энтропии изображения.
Smooth: Исключение. Применяется спец.алгоритм со сглаживанием (анализирует энтропию), никак не связанный с порогом конвертации в b/w. Может сглаживать, "округлять" (слегка ужирнять) буквы (в т.ч. очень бледные части букв) и даже увеличивать их связность (убирать разрывы в буквах).

Smooth очень хорошо работает на чрезвычайно блёклых сканах или сканах поганого качества (например, с очень низким dpi).
Недостаток - очень чувствителен к фону (шумам), поэтому если скан сильно грязный (с неравномерным фоном), то smooth вносит очень много мусора, который в итоге так сливается с текстом, так что никакой Despeckle потом не помогает, поэтому лучше использовать его совместно с Histogram Thresholding для подавления грязи (фон слегка забледняется с помощью Histogram, и поэтому не вносит мусора при конвертации).
Серые полутоновые рисунки при Smooth следует включать в Exclude region.
После Smooth текст слегка жирнеет. Чтобы этого не происходило, можно, к примеру, на закладке Quality -> Gray enhance... -> Contrast сдвинуть ползунок Brightnes (яркость) на позицию 20 влево.

User: Значение порога задаётся пользователем. При выборе User появляются окошки выбора значения порога:

Right page: Значение порога конвертации для правой страницы

Аналогично - для правой страницы.


1.2. Общие элементы

1.2.1. Элементы управления списка файлов

Элемент Описание
Жирная зелёная галочка (другое название - "marked"-файл). Её смысл:

1. Пометка на обработку (по кнопке Process!) данного файла - это сейчас основной смысл. Только те файлы, напротив которых стоит эта галка, будут обработаны после нажатия кнопки Process!.

2. Запоминание (для последующей обработки по кнопке Process!) текущих изменённых индивидуальных настроек файла - уже устаревший смысл (из-за кнопки "Auto-accept options is on/off").

Когда-то после изменения опций (например, подвинули резак) необходимо было "перещёлкнуть" эту галочку - т.е. снять её и вновь поставить - иначе изменённые опции не запоминались, но в последних версиях Кромсатора появилась специальная (для этой проблемы) кнопка "Auto-accept options is on/off" - когда она включена, "перещёлкивать" галочки (после изменения опций) уже не надо. Эта кнопка теперь включена по умолчанию.

Щёлкнуть мышкой на любой (обычно последний) файл в списке, нажать эту кнопку - автоматически проставятся жирные зелёные галочки на всех файлах в списке, предшествующих ему.
Щёлкнуть мышкой на любой файл в списке, нажать эту кнопку - на нём проставится жирная зелёная галочка.
Щёлкнуть мышкой на любой (обычно (пред)последний) файл в списке, нажать эту кнопку - автоматически проставятся жирные зелёные галочки на всех alternate ("чередующихся", т.е. одинаковой чётности) файлах в списке, предшествующих ему. Т.е. если стоим на чётном файле - пометятся все предыдущие ему чётные файлы, если стоим на нечётном - то пометятся все нечётные.

1.2.2. Виды выделений файлов в списке:

Название Описание Способ выделения Групповое изменение
Marked С жирной зелёной галочкой Левая кнопка мыши Клавиша Ctrl
Selected Выделенные красным цветом. Клавиша Пробел (или Insert) (при активном списке файлов).

Чтобы выделить группу, нужно пробелом отметить первый файл в группе, затем стать на последний файл и нажать Shift + Пробел.

Клавиша Shift
Bold selected Выделенные чёрным жирным. Клавиша Ctrl + Пробел.  

Из таблицы видно, что, чтобы поменять опцию у группы файлов, то нужно (при изменении опции):

- Для marked-файлов держать нажатым Ctrl.

- Для selected-файлов держать нажатым Shift.

Выделение Marked (как это указано чуть выше) используется, чтобы пометить файлы, которые будут обрабатываться обработкой по кнопке Process!

Выделение Selected - это пользовательское выделение, используемое в случаях, когда нужно выделить группу файлов в списке и проделать над ней некую операцию.

Выделение Bold selected используется обработкой Draft kromsate - для того, чтобы обозначить те файлы, где хотя бы один из резаков (после Draft kromsate) установился малиновым, а не синим.


1.2.3. Групповое изменение опций

Любую опцию можно установить/сбросить/изменить у любой группы файлов. Для этого нужно при изменении опции держать нажатым Alt. Кромсатор предложит на выбор, к какой группе применить изменение (в любом случае, выдав сначала такое предупреждение):


1.2.4. Управление списком файлов

1.2.4.1. Перемещение файлов:

а. Единственный файл - нажимаем на него левой кнопкой мыши и перетаскиваемо на другую позицию в списке.

б. Группа файлов:

- Команда Move selected: перемещает все выделенные (selected) файлы (выделение может быть не обязательно сплошным, а, например, через один) в определённую позицию в списке файлов. Например, можно выделить все чётные страницы и переместить их в конец списка, где они расположатся уже последовательно.

- Команда Shift selected: все выделенные файлы сдвигаются на заданное количество строк вверх или вниз, сохраняя при этом расстояние между друг другом.

- Команда Paste interliev ("вставлять файлы через один"): вставляет в список (скопированные в буфер файлы) через один, т.е. на место только чётных или только нечётных.

Если изменение порядка (как для единственного файла, так и для группы) выполняется уже после обработки по кнопке Process! (т.е. когда уже получены выходные файлы), то программа будет автоматически переименовывать и выходные файлы так, чтобы сквозная нумерация на выходе не нарушалась.


1.2.4.2. Навигация по списку файлов:

ВАЖНО: Для перемещения по списку файлов (в главном окне, а также в окне просмотра результатов), можно использовать "горячие клавиши": "q" или "[" (предыдущий) и "]" или "w" (следующий).

В списке исходных файлов нажатие стрелок, Home, End при нажатом Shift перемещают курсор на следующий selected, предыдущий selected, первый selected, последний selected соответственно.


1.2.4.3. Многостраничные TIF-файлы:

Если открывать много TIF-файлов скопом, программа считает их одностраничными.

Если к первому открытому одностраничному TIF-файлу добавить многостраничные, она их тоже считает одностраничными.

Если первый многостраничный - то все нормально, т.е. программа распознаёт корректно все последующие добавленные файлы, какие бы (одно- или много- страничные) они ни были.

Для того, чтобы открыть несколько (не один) TIF-файлов как многостраничные, нужно при выборе команды меню (или при щелчке на кнопке открытия файлов) держать нажатым Shift. Такое явное указание было введено из-за чрезмерной длительности автоматического определения "многостраничности" открываемых TIF-файлов.


1.2.4.4. Разное:

Начиная с 4-й версии, Кромсатор поддерживает полуавтоматическое добавление файлов в задание. Например, вы сканируете книгу, и файлы попадают в папку MyScan. Вы загружаете сколько есть файлов в задание. В дальнейшем, если в этой папке будут появляться от сканера новые изображения, можно просто нажимать в кромсаторе "H" (раньше для этого нужно было вызывать пункт меню add files) и они добавятся в конец задания (при условии, что сканирующая программма нумерует их).

В уже существующее задание можно добавлять новые файлы (с возможностью пересортировки, если необходимо), при этом допускаются одинаковые имена файлов (при условии, что папки у них все-таки разные).

Теперь в задании можно использовать любую смесь форматов файлов. (Ранее к multi-page-тифам, например, нельзя было добавить bmp или jpg).


1.2.5. Панель свойств загруженных файлов

Элемент Описание
1. <горизонтальный размер изображения в пикселях> х <вертикальный размер изображения в пикселях>
2. <разрешение изображения в DPI>   <количество цветов изображения>
3. <Вид сжатия изображения>

При запуске Кромсатора эта панель ВСЕГДА не видна. Чтобы её увидеть, надо "растянуть вверх" панель списка файлов.


1.2.6. Кнопки панели управления

- Общий вид основной панели управления.

Элемент Описание
Load image files - загрузить графические файлы.
Save current task - cохранить текущее задание.
Fit image - растянуть изображение по ширине окна.
Draft kromsate - т.е. запустить процедуру автоматической предварительной расстановки резаков - по всем загруженным сырым сканам.
Запустить обработку marked-файлов (т.е. помеченных жирными зелёными галочками).
Process current file - обработать текущий файл.
Process left page - обработать текущую левую страницу. Имеет смысл только при обработке сдвоенных разворотов.
Process right page - аналогично для текущей правой страницы.
(Выкл.)

(Вкл.)

Auto-accept changings option - Автопринятие изменения опций

Включена по умолчанию. Рекомендуется иметь эту кнопку всегда включённой. Выключать её имеет смысл только при использовании кнопки Preview на вкладке Quality - т.к. при смене dpi кромсатор не корректирует положения резаков.

Image zoom - масштаб изображения.
Rotate image - поворот изображения. Можно держать Ctrl или Alt при изменении значения в этом комбобоксе. Ctrl - повернет для всех, Alt - спросит, для каких.

1.2.7. Схема расположения резаков

(Изображение уменьшено)

Элемент Описание
1. - (Set internal margin) ?
2. - (Set internal margin or split line) Резак для разрезания сдвоенных разворотов
3. - (Cut top margin) Верхний резак
4. - (Cut left margin) Левый резак
5. - (Cut bottom margin) Нижний резак
6. - (Cut right margin) Правый резак

1.2.8. Панель управления резаками

- Общий вид панели управления резаками.

При запуске Кромсатора эта панель ВСЕГДА не видна полностью. Чтобы её увидеть, надо "заузить" панель списка файлов.

Элемент Описание
1.  (Cut left margin) Вкл./выкл. левый резак
2.  (Cut right margin) Вкл./выкл. правый резак
3. ? (Возможно, это ранее было управление резаком для разрезания сдвоенных разворотов, который теперь не отключается, а просто его действенность включается/выключается галкой Split)
4.  (Cut internal2 margin) Вкл./выкл. резак Set internal margin (?)
5.  (left cutter position) Координата левого резака
6.  (first internal cutter position) Координата резака для разрезания сдвоенных разворотов
7.  (right cutter position) Координата правого резака
8.  (second internal cutter position) Координата резака Set internal margin (?)
9.  (Cut/clear top margin) Вкл./выкл. верхний резак
10.  (Cut/clear bottom margin) Вкл./выкл. нижний резак
11.  (top cutter position) Координата верхнего резака
12.  (bottom cutter position) Координата нижнего резака
13.  (left page width) Расстояние между левым и правым резаком (при выкл. Split) или между левым резаком и резаком для разрезания сдвоенных разворотов (при вкл. Split)
14.  (left page height) Расстояние между верхним и нижним резаком
15.  (right page width) Расстояние между резаком для разрезания сдвоенных разворотов и правым резаком (при вкл. Split)
16.  (right page height) Расстояние между верхним и нижним резаком

1.2.9. Управление резаками

Чтобы двигать сразу два резака синхронно (например, верхний и нижний), нужно держать нажатым Ctrl.

Резаки можно наклонять (чтобы лучше отсекать грязь и полосы на перекошенных сканах). Для этого нужно двигать ползунок резака правой клавишей мыши, либо левой, но с нажатым Shift. Двойной щелчок на ползунке выпрямляет резак.

Если нужно убрать тень и мусор от разворота, но при этом не разрезать разворот на две части, то нужно убрать опцию Split, но оставить оба внутренних резака. В этом случае область между ними будет просто очищаться.

Резаки синхронизируются с картинкой при изменении масштаба, повороте и отражении.

Можно на панели управления резаками в контекстном меню элемента, в котором выводятся координаты резаков (Xi1=..., Xi2=..., и т.п.) выбрать команду Reset cutter position - соответствующий резак подойдет к соответствующему краю страницы и станет виден.

Отключение резаков скопом не предусмотрено (чревато). Но выход есть - нужно вывести резаки за пределы картинки.


1.2.10. Контекстное меню ПОЛЗУНКА любого резака

Элемент Описание
Reset slope Убрать наклон резака (т.е. "выпрямить" его).
Copy current position to   > Распространить позицию данного резака на ... Подробнее - см. ниже таблицу

Copy current position to Распространить позицию данного резака на ...
Пункт меню Назначение

all marked

все файлы, отмеченные жирной зелёной галочкой.

all down

все нижележащие файлы

all up

все вышележащие файлы

alternate down

все нижележащие файлы той же чётности

all selected

все выбранные красным файлы


1.2.11. Пункты контекстного меню (главного окна)

Редактировать теперь можно и исходное изображение (в отличие от старых версий), хотя операций и меньше, чем для выходного. Поддерживается редактирование для многостраничных тифов.

Исходный файл можно чистить (Mouse-Up mode -> Clear selection) и сохранять (Auto save).

Для исходного изображения имеется операция быстрого удаления любой тонкой сплошной длинной чёрной линии (хорошо удалять подчёркивания ручкой). Пока только для исходного b/w-скана. Нажав Ctrl + Shift, щёлкните по любой черной точке контура. Но учтите, что если линия касается буквы, то и буква удалится.

При редактировании изображений (как исходного, так и выходного) поддерживаются не только прямоугольные выделения, но и эллиптические и произвольной формы, нарисованные мышкой.

Пункт меню Назначение

Zoom rectangle

Увеличить выделенный фрагмент во весь экран

Show selection

По этой команде создаётся небольшое окошко (их можно создавать сколько угодно), в котором будет отображаться выделенная область. В нём можно таким образом "хранить" разные варианты обработки и визуально сравнивать их.

Crop selection

Вырезать выделенный фрагмент в отдельное новое изображение

Invert selection

Инвертировать выделение - поменять местами выделенную и не-выделенную область - т.е. выделенная область становится не-выделенной, а пространство скана за пределами этой области становится выделенным.

Так можно, например, выделить на изображении области вне рисунков: выделяем картинки (множественное выделение поддерживается, держать shift), и выбираем команду invert selection - тогда выделение инвертируется, т.е. выделяется все, кроме картинок.

Deselect

Снять выделение
Save image Сохранить изображение
Undo Откат изменения. Глубина отката - неограниченна
Exclude region Зона исключения. Допускается до 20 зон на страницу. Исключает действие (внутри зоны) следующих операций:
  • Despeckle - для защиты полутоновых или мелкозернистых рисунков и изображений. Это первоочередная задача Exclude region.

  • Deskew (Auto Shear, Interpolate, Antialias) - зона не будет участвовать в определении skew-угла (например, именно изображения приводят к неправильной детекции угла наклона). Зона будет поворачиваться без использования интерполяции, чтобы не внести дополнительный муар.

  • Выравнивание освещенности - если на скане имеется полутоновые иллюстрации, то при  они могут сильно пострадать.

  • Все опции Gray image enhance, за исключением Histogram.

  • Метод удаления фона Convert -> Convert to b/w threshold: -> Smooth.

Exclude and Mark as dither region

Данная зона при обработке будет переводиться в b/w по специальному алгоритму, предназначенному для правильной передачи полутоновых или цветных изображений.

Mark as bitonal region Bitonal-конвертирование зон. Просто спасение для точной передачи многотоновых иллюстраций.
Mark as change contrast region

Зона изменения контраста. Значение контраста берется из окошка Contrast, закладка Contrast, при условии, что применение изменения контраста глобально (ко всему изображению) отключено. Т.е. если на закладке Contrast стоит галка на Enabled, то contrast-zones игнорируются.

Mark as floodfill region FloodFill-зоны работают только для b/w. Заливается белым цветом чёрная область, начиная от центра зоны. Если окажется, что в центре зоны - белый пиксел, то кромсатор будет искать черный пиксел в пределах зоны, начиная от центра и двигаясь по спирали. Если в пределах зоны не будет чёрных пикселей, то ничего выполняться не будет. Заливка чёрной области выполняется применительно ко всей области, т.е. не ограничивается размером зоны. Т.е. зона нужна только для того, чтобы задать своим центром начальную координату, с которой будет выполняться заливка.
Delete all regions Удалить все выделенные участки
Delete selected region Удалить выделенный участок
v   Ruler

С его помощью можно мерить не только расстояния, но и одновременно угол наклона.

Запись измеренного угла: включить режим измерения углов (меню Ruler), щёлкнуть на первой точке линии измерения и, не отпуская кнопку мышки, подвести её курсор к другой точке этой же линии. За мышкой будет следовать "резиновая" линия, рядом с которой будет выводиться угол наклона линии. Если затем отпустить кнопку мыши и при этом держать нажатым Ctrl (или Shift), то измеренный угол занесётся в поле Fixed deskew angle (вкладка Pages кнопка special...) с тем же знаком, что и знак, выдаваемый Ruler. На этот жёстко заданный угол кромсатор и будет поворачивать скан при обработке. Кстати, все углы в кромсаторе трактуются одинаково, т.е. + означает поворот против часовой стрелки.

Units                       > Единицы измерения

No Zoom Filter

Выключение фильтра отображения изображения. Это удобно при делать при работе с цветными сканами - чтобы меньше тормозило.

Linear Zoom Filter

Использовать линейный фильтр отображения изображения.

Mouse-Up mode    >

Выбор смысла прямоугольного выделения мышью см. далее подробнее

Selection form        >

Выбор формы инструмента выделения фрагмента см. далее подробнее

v   AutoSave

Автосохранение текущего файла при переходе к следующему. Удобно при редактировании каждой страницы.

v   Do not show save dialog

?

Convert to bitonal    Ctrl+Y

Преобразовать в битональное изображение. То есть применить dithering (или растрирование) к серому изображению - т.к. его прямое преобразование его в ч.б. испортит его. Dithering (дизеринг) - это имитация серого (8-битного) изображения мелкими чёрно-белыми точками, построенными на скане так, что dithering-изображение издалека очень похоже на исходное серое - однако, является уже 1-битным - т.е. чёрно-белым.

Алгоритм работы с Convert to bitonal: страницы с худ.картинками сканируем в grey, преобразуем иллюстрации (т.е. отдельные фрагменты страницы) в bitonal, нажимаем Preview (при этом т.к. выходной формат задан b/w, получаем исходный файл уже как b/w), сохраняем его и в итоге на входе программа уже имеет b/w-файл, но с иллюстрациями, почти не попорченными прямым конвертированием в b/w. Надо еще чтобы use error dithering был включен, там же, в меню.

Convert to b/w        Ctrl+U

Преобразовать в ч.б. При этом порог конвертации берется из текущего значения Convert to b/w threshold на закладке Convert). При этом формат файла не изменяется, просто заданный кусок преобразуется в b/w и возвращается на место, т.е. файл как был, так и остаётся 8-битным (серым) - а преобразованная картинка построена теперь уже только лишь из чёрного и белого цветов.

Convert to grey

Конвертирует выделенную область на цветном изображении в grey. Команда не является опцией обработки.

Mouse-Up mode Выбор смысла прямоугольного выделения мышью
Пункт меню Назначение

v   Set exclude region

Установить зону исключения

Mark as dither region

Пометить как dithering-зону

Mark as change contrast region

Пометить как зону изменения контраста

Clear selection

Очистить выделение. Это очень удобный режим для ручной чистки от мусора. Выделяем грязь прямоугольником мышью, отпускаем левую кнопку мыши - и весь выделенный прямоугольник очищается.

Convert to b/w

Конвертировать в чёрно-белое

Convert to bitonal

Конвертировать в dithering


1.3. Пункты меню

ПРИМЕЧАНИЕ: В этом разделе будут рассмотрены только наиболее важные и интересные пункты меню. О смысле и значении остальных пунктов меню (которые мы не будем рассматривать) легко догадаться, исходя из прочих разделов данного Пособия.


1.3.1. Пункт меню File

В программе существует такое понятие, как "Задание". Задание - это информация о загруженных в программу файлах, расставленных по ним резакам, выставленным опциям и т.д. Задание можно сохранять и открывать заново. Использование задания позволяет прерывать и снова возобновлять обработку сканов

Open task Открыть задание
Save task Сохранить задание
Close task Закрыть задание
Task options settings Открыть окно выбора пакета опций

1.3.1.1. Подпункт Task option settings

Опции программы, изменённые пользователем, можно сохранять в виде набора, и потом использовать повторно.

Для этого в окне File->Task options settings задайте нужный набор опций, присвойте этому набору любое имя и сохраните его (кнопка Save). Можно создать сколько угодно таких наборов default-опций - со своими именами. Один из таких наборов будет набором по-умолчанию (поставите в нём галку на Use as default options) - он будет автоматически загружаться при открытии Кромсатора.

Перед созданием нового задания можно загружать любой набор - тогда эти опции восстановятся. После этого можно загружать новые изображения.   Например, можно сделать отдельные наборы для 300dpi, 600dpi, и т.д.


1.3.2. Пункт меню Edit

Clear all options Очистить все опции. Эта команда сбрасывает все опции программы в нулевые значения (причём, они не совпадают со значениями по-умолчанию). Очень удобно для нестандартных обработок.

1.3.3. Пункт меню Result

Result
Пункт меню Назначение

View all

Открывает редактор постобработки, если в Кромсаторе имеются файлы, прошедшие обработку, то есть выполняются условия:

1. В списке файлов есть хотя бы один marked-файл. 2. Существует папка для выходных файлов. 3. В этой папке есть хотя бы один файл, соответствующий какому-либо marked-файлу (он и загрузится в редактор постообработки).

Информацию о файлах, прошедших обработку, можно сохранить в файл задания (меню File -> Save task) и затем загрузить её обратно в программу (меню File -> Open task). После этого можно опять открыть редактор постобработки (выбрав View all) и продолжить там обработку выходных файлов.

Show source files

Возможность в окне просмотра результата редактировать исходные файлы.

2. Интерфейс редактора постобработки

2.1. Общие элементы

Общий вид панели управления редактора постобработки:

Обе панельки инструментов - плавающие, их можно пристыковать к бокам или превратить в окошки и закрыть (Right click - Hide) - чтобы увеличить "эффективный" размер экрана. Для того, чтобы опять включить их, надо выбрать в контекстном меню Options... -> Show navigate command's panel и/или Show edit command's panel.

Элемент Описание
- First page Перейти к первой странице
- Previous page Перейти к предыдущей странице
- Next page Перейти к следующей странице
- Last page Перейти к последней странице
- Fit Сделать масштаб "по ширине страницы"
- Sync original scan with current image Если включить опцию “Sync”, то при навигации по выходным файлам будет производиться автоматическая смена изображений и в окне с исходными файлами.

- Image zoom
Регулировка масштаба

- Page number
Переход к странице с нужным номером

- Panels layout
Режим отображения страниц
- Shift image increment value

- Можно двигать изображение клавишами "Alt + стрелка". Здесь задаётся шаг смещения.

- Copy Копировать
- Cut Вырезать
- Paste Вклеить
- Undo Отменить
- Auto-clear mode Режим автоочистки
- Auto-despeckle mode Режим автоудаления соринок
- Eraser Ластик
- Crop Вырезающий прямоугольник
- Show stamp Показать штамп
- Clear options Показать диалог с опциями очистки
- Rotate selection Показать диалог вращения выделенного фрмагмента

Чтобы пометить файл (как selected, т.е. красным) в списке файлов основного окна, находясь при этом в окне редактора постобработки Result view, нужно нажать F2 или F2 и F3 (для левого и правого файла, в случае, если в окне просматриваются сразу два выходных файла). Это бывает необходимо, чтобы отметить неправильно обработанный файл. Пометив таким образом все (или один) такие файлы, можно вернуться в главное окно Кромсатора, подправить помеченные файлы и дать команду process selected.

Во окне Result view нажатие Backspace перемещает на предыдущую просмотренную страницу (например, смотрели 10-ую, потом 15-ую - нажали Backspace и вернулись к 10-ой, а не к 14-ой). Ctrl + Backspace - на страницу, с которой началось просматривание в окне Result view.

Форму выделения можно запомнить в буфер обмена (Ctrl-Insert), потом восстановить - на этом же, или на другом файле (Shift-Insert).

Может ли Кромсатор делать despeckle для белых точек на чёрном фоне? Да, но только в окне редактора постобработки Result view (т.е. в основном окне программы не может).

Для листания страниц используются следующие "горячие клавиши": вперед - w и ], назад - q и [. Листает также нажатие средней кнопки мыши. В последнем случае направление листания можно задать, выбрав соответствующую опцию в контекстном меню Options... -> Middle button click -> (Forward, Backward, None).

Ctrl-Shift-щелчок мыши на b/w работает как floodfill, на grey/color - как magic wand.

Hotkey: в случае, если zoom таков, что изображение не вмещается целиком в окно просмотра, "A" или ":" делают видимым верхнюю часть изображения, а "S" или """ - нижнюю, т.е. быстрый скролл вверх-вниз.

В версии 5.6A почти все операции редактирования доступны во всех режимах просмотра (одиночная страница/две страницы/сравнение с оригиналом). Активное окно подсвечивается.

Некоторые возможности редактора постобработки:


2.2. Пункты контекстного меню

2.2.1. Общее контекстное меню

Пункт меню Назначение

Special...    >

Специальные возможности

Clear

Очистить выделение

Crop

Вырезать выделение в отдельный файл

Rotate selection  Ctrl+R

Поворот выделения. Rotate selection нельзя пользоваться в режиме показа Two pages. Просто в этом случае не всегда понятно, к какому из двух изображений применять команду. Сейчас в принципе это можно определить по тому, где вызвано контекстное меню, но когда будет общее меню и плавающая панель инструментов - тогда проблема.

Stamp    >

Работа со штампом

Undo    Ctrl+Z

Безлимитный

Save

Сохранить

Image info    Ctrl+I

Информация об изображении

Options...    >

Подменю с опциями

Zoom rectangle  Ctrl+W

Увеличить выделенный прямоугольник во всё окно

Fit    Ctrl+F

Сделать масштаб по ширине окна

Fit height    Ctrl+H

Сделать масштаб по высота скана окна

Copy    Ctrl+Ins

В clipboard можно Copy не только из кромсатора, но и из любых графических программ

Cut    Ctrl+X

Вырезать

Move    Ctrl+M

Двигать

Shift image

Сместить изображение

Paste    Shift+Ins

После Paste фрагмент можно двигать, растягивать и только потом merge.

Выделяем, Copy. Paste - участок появится поверху страницы и он ещё не слит с ней, т.е. его можно таскать или изменять размеры. Если же ещё нажать клавишу T (разницу почувствуете сразу же после нажатия), то последущий merge будет выполнен с прозрачностью, т.е. белый цвет будет прозрачным. Для того, чтобы окончательно слить участок с изображением, выбираете команду merge в контекстном меню или щелкаете в любом месте за пределами участка. В новой версии добавлена ещё возможность сделать прямоугольнички по краям участка (grips) однопиксельными, а то при копировании малых участков эти грипы все заслоняли.

Invert selection

Обратить выделение

Deselect

Убрать выделение

v   AutoSave

Автоматическое сохранение данного файла при переходе к последующему.

v   AutoClear

После взвода AutoClear выделения мышкой будут чиститься автоматически, в момент отпускания клавиши мыши.

Clear options

Опции очистки

Clean color    >

Цвет, которым будет закрашиваться очищаемая область

Convert to bitonal

Конвертировать в dithering
Convert to b/w Конвертировать в чёрно-белое
Draw    > Вызов подменю рисования
Restore last selections Начиная с версии 5.05, в Кромсаторе есть одна хитрая возможность - предположим, что вы почистили (в режиме autoclear) изображение и вдруг обнаружили, что по каким-то причинам страницу нужно пере-обработать (иногда такое бывает: обнаруживаешь, что часть страницы была блеклая и despeckle эту часть повредил). Тогда заключаете эту часть страницы в exclude-зону, которую despeckle трогать не будет, переобрабатываете страницу, и чтобы не чистить страницу по новой, выбираете команду restore last selections и нажимаете Delete. В результате команда отселектирует все зоны, которые были зачищены при предыдущей обработке, и по нажатию del очистит их.

Если же при ручной чистке использовалось despeckle-removing (с помощью Ctrl-Mouse Up), то такие зоны тоже передеспеклятся (в таком же режиме) автоматом, а на странице выделятся желтой подсветкой, аналогично и для случая, если имело место despeckle белых пятен на чёрном фоне (Ctl-Shift-MouseUp), только подсветка будет зеленой.

Text label    > Работа с текстовой пометкой

2.2.2. Очистка сканов от грязи при помощи мыши

Любой из возможных алгоритмов Despeckle не в состоянии полностью и автоматически очистить скан от соринок, грязи, мусора, и т.п. Поэтому иногда следует вручную почистить сканы после Despeckle (а иногда и вместо Despeckle - если сканы бледные, плохо пропечатанные - и Despeckle может их попортить).

Настройка:

Чистка:

а. Простая очистка:

Выделяем фрагмент, в момент конца выделения, когда кнопка мышки отпускается, выделенный фрагмент полностью очищается. Цвет, которым заливается, зависит от опции Clean color (white/black). Цвет можно также быстро изменить просто двойным щелчком мышки на изображении.

б. Despeckle-очистка: (рекомендуемая)

Если при этом держать нажатым Shift, то будет не очистка, а despeckle (обращаю внимание, что despeckle применяется не ко всему изображению, а только к выделенной области). Следует увеличить (см. ниже окно Clear options) допустимый Speckle size (рекомендуемое значение - Speckle size (fine) = 20), и тогда чистка будет намного лучше, чем просто Despeckle при обработке (по кнопке Process!), но нужно следить, чтобы выделение не захватывало знаков препинания. Режим хорош тем, что не нужно точно позиционировать выделение на мусор, можно захватывать и текст, он в большинстве случаев не пострадает. Таким образом, Despeckle-очистка гораздо менее трудоёмка, чем простая очистка, только самые большие кусочки мусора надо вычищать всё-таки простой очисткой (т.е. через Shift при Despeckle-очистке).

Если при этом держать нажатым и Shift, и ещё Ctrl, то despeckle будет работать не для чёрного мусора, а для белого, т.е. закрашивать мелкие белые пятна на чёрном фоне. Если после этого остаются пятна, которые больше, чем заданный Speckle size, то делаем двойной щелчок (т.е. переключаемся на заливку чёрным), выделяем пятно, отпускаем мышку - пятно закрасилось. Снова двойной щелчок, чтобы вернуться к белой заливке. При despeckle белых пятен нужно быть осторожным с текстом - внутренние замкнутые полости ряда букв часто имеют малые размеры и могут при этом легко закраситься чёрным!

Можно сделать немного по-другому: с самого начала в окне Clear options установить Change mode by mouse dbl-click = Clear/despeckle (чтобы двойным кликом быстро переключаться от чистки полной до чистки по типу despeckle).

Вообще поведение клавиш (Shift, Ctrl) можно изменять - в окне Clear Options. Т.е. можно задать, чтобы при простом отпускании мыши был despeckle, а с Shift - чистка. Кому как нравится. По умолчанию используется Clear Options -> Despeckle method -> Fine. Можно дополнительно указать использовать Fine+Normal. Но размеры допустимых спеклов для Normal (они задаются раздельно, для Fine - одни (поле Speckle size (fine)), для Normal - другие (поле Speckle size (normal)) лучше не увеличивать. Т.к. Normal не просто чистит мусор, но и убирает лохматинки с букв.

 

Элемент Описание
Speckle size (fine) Максимальный размер соринок, которые будут удаляться выделением мышью
Action MouseUp - clear, Shift+MouseUp - despeckle
MouseUp - despeckle, Shift+MouseUp - clear
MouseUp - clear, CapsLock=On - MouseUp - despeckle

Выбор режима очистки мышью

Там ещё есть несколько операций с magic color. Это для цветных сканов (или для цветных иллюстраций). Штука сильная. Позволяет "выравнивать" цвет, делать как бы цветовой despeckle и сlean и т.п. Как это работает, объяснять долго, это будет описано в будущей доке.

В Clear options сохраняется список цветов, использованных при magic clear (только в пределах сессии).


2.2.3. Окно поворота выделенного фрагмента

Rotate selection. (Поворот выделения). Работает для выделенного участка (можно всю страницу). Тут можно задать угол поворота, либо расчитать его автоматом (кнопка auto 2), потом нажать Paste (положит обратно, но не сольёт, т.е. можно будет подвигать мышкой) или Paste and merge (положит и сольёт сразу). Сброс угла - кнопка 1, выбор направления поворота - в группе Rotate direction; можно выбрать алгоритм поворота в списке 3. Можно включить режим прозрачного наложения Merge with transparency. Есть окошко предварительного просмотра 5, где можно щёлкать мышью на картинке, и она будет увеличиваться (для возврата к исходному масштабу нажмите кнопку fit image 4), а ещё можно "схватить" и "таскать" картинку мышью в окне предварительного просмотра.


2.2.4. Контекстное подменю опций

Options...
Пункт меню Назначение

Mouse Wheel -> Zoom

Включить режим, когда вращение колёсика мыши изменяет масштаб

Mouse Wheel -> Scroll

Включить режим, когда вращение колёсика мыши прокручивает скан

MouseWheel -> Navigate

Включить режим, когда вращение колёсика мыши листает сканы

Middle button click    >

Выбор смысла работы средней кнопки мыши

v  Auto merge

?

No Zoom Filter

Отключить фильтр отображения сканов

Linear Zoom Filter

Включить линейный фильтр отображения сканов

Одна страница 600dpi grey или color занимает в несжатом виде (а именно так windows работает с битмапами) от 50 до 100 МБ - именно из-за этого Кромсатор долго отображает такие сканы при включенном фильтре, ведь фильтр на каждую точку анализирует 9 соседних, т.е. умножьте объём ещё на 10. Нагрузка на кэш процессора колоссальная.

Nonlinear Zoom Filter

Включить нелинейный фильтр отображения сканов

v  No zoom filter for source images

Если эта опция активна, в режиме "сравнение с оригиналом" левое изображение, т.е. оригинал, отображается без фильтра.

v  Lock undo

Возможность блокировки undo-менеджера.

v  Remove text label after merge

?

v  Show navigate command's panel

Показать плавающую кнопочную панель - Панель навигации

v  Show edit command's panel

Показать плавающую кнопочную панель - Панель редактирования

Selection form    >

Выбор формы выбирающего инструмента - прямоугольник или полигон

3. Описание работы с программой

При самом первом сеансе работы с Кромсатором убедитесь, что кнопка с галкой Auto-accept changings option is on/off (в верхней панели) включена и галка на ней имеет зелёный цвет. Кнопка должна выглядеть вот так: . Это означает, что все изменения опций, которые Вы cделаете, будут фиксироваться автоматом. Иначе, как только Вы сместите фокус с файла, все выставленные Вами опции (например, позиции резаков) уйдут.

Коротко алгоритм работы со СканКромсатором:

(Это лишь концептуальное описание - для общего понимания сути работы с программой)

1. Предварительная обработка.

Загружаем сырые сканы и разрезаем вручную (для полного визуального контроля над процессом) сдвоенные развороты или же, если это одиночные сканы, отрезаем у каждого скана ошмёток соседней страницы в виде вертикальной полосы.

Это делается так: Выбираем в меню Edit -> Clear all options. Затем кликаем мышью последний файл в списке загруженных и нажимаем кнопку Apply up to current - от этого на всех файлах в списке проставятся жирные зелёные галочки. Удерживая Ctrl, выставляем на вкладке Pages галку Split (разрезать сканы) и галку Deskew (чтобы применить Deskew ко всем получаемым в процессе разрезания сканам). Позиционируем резак Set internal margin or split line над линией смыкания 2-х соседних страниц на самом первом скане. Нажимаем правой кнопкой мыши на ползунок этого резака, и в появившемся контекстном меню выбираем пункт Copy current position to -> all down. Тем самым, данная позиция резака распространится на все нижележащие сканы. Теперь нужно пройти дальше по всем сканам - при помощи клавиатурных клавиш "q" и "w" (или "[" и "]") и вручную подкорректировать позицию разрезающего резака - чтобы она проходила над линией смыкания 2-х соседних страниц на всех сканах. При необходимости повторяйте Copy current position to -> all down.

Выставляем прочие нужные опции (Output dir и т.п.) и нажимаем кнопку Process!. Ждём, пока все сканы не разрежутся.

Выходим из программы.

2. Окончательная обработка.

Загружаем в программу полуобработанные после 1-го этапа сканы. Нажимаем кнопку Draft kromsate . В открывшемся окне нажимаем OK. Запустится процедура автоматической предварительной расстановки резаков - по всем загруженным сканам.

После окончания работы Draft kromsate проходим вручную по всем сканам и корректируем неправильно выставившееся резаки. Принцип в том, что резаки не должны отсекать ничего полезного, но в то же время они должны по максимуму отсекать всю грязь от текста. Некоторые резаки после Draft kromsate будут вообще отключены - тогда их можно включить (если нужно) на панели управления резаками - вот её изображение:

На разряженных страницы, где мало текста (титульные страницы, оглавления, страницы с выступающими одинокими строками и т.д.), Draft kromsate автоматически переключит некоторые резаки с синего на малиновый - чтобы подчеркнуть место неуверенного распознавания контура текста. В списке файлов такой скан будет выделен чёрным жирным цветом. Зачастую следует вручную подкорректировать малиновые резаки (после Draft kromsate) и переключить их обратно на синий режим - для простоты.

Если нужно - можно на данном этапе сохранить задание на диск (меню File -> Save task) и возобновить работу позже.

Выставляем на вкладках программы желаемые опции обработки (Despeckle и т.п., можно повторно Deskew для надёжности).

Нажимаем кнопку Process! и ждём. Начинается автоматическая финальная обработка сканов (включая обрезку).

После обработки (по кнопке Process!), переключаемся на вкладку Book. Программа автоматически подставила вычисленные средние размеры страниц в поля H.Gap value и V.Gap value. Теперь нужно обязательно сменить там Auto на Fixed, чтобы при повторной переделке каких-то отдельных страниц (Process current file) их размер выдерживался равным среднему вычисленному.

Если нужно - можно на данном этапе сохранить задание на диск (меню File -> Save task) и возобновить работу позже.

Просматриваем полученные сканы в редакторе постобработки (меню Result -> View all). Если мы замечаем, что где-то неправильно отрезался отдельно стоящий номер страницы, или же кусочек строки - возвращаемся в главное окно программы, становимся на нужный скан, и корректируем нужный резак. Как правило, нужно при этом переключить этот резак с синего на малиновый - путём сброса соответствующей галки в группе Automargins на вкладке Pages. Откорректировав резаки, нажимаем кнопку Process current file (обработать текущий файл) - и данный скан перенарежется по-новому.

Вот и всё - таков вкратце алгоритм работы с программой.


3.1. Что такое Draft kromsate:

Draft kromsate - это автоматическая расстановка резаков самой программой, т.е. автоматизация самой нудной и рутинной работы. Draft kromsate - это т.н. алгоритм автоматической сегментации, т.е. определение логических блоков, занимаемых на скане полезным текстом и грязью. Задача Draft kromsate -  только расставить резаки на сканах (приблизительно), он не вычисляет размеров финальных страниц.


3.2. Что такое кнопка Process!

Основная обработка по кнопке Process! - это автоматический алгоритм распознавания контура текста на скане. В процессе этой обработки программа автоматически анализирует область внутри резаков, находит контур текста, и обрезает по нему. Попутно к скану применяются Despeckle, Deskew и т.п. Получается т.н. "голый текст", без полей. Далее рассчитываются средние ширина и высота голых текстов (и заносятся в поля Page width и Page height на вкладке Book), создаётся пустой шаблон с этими размерами, каждый голый текст копируется на копию этого шаблона (с относительным выравниванием, задаваемым в полях ввода Page h.align и Page v.align на вкладке Pages), а затем к этой копии добавляются поля заданного размера (размеры берутся из полей ввода H.Gap value и V.Gap value на вкладке Book). Так и получаются конечные обработанные сканы.

Кроме того, кнопка Process! служит для запуска более простых обработок, задание для которых составляет пользователь, выставляя свои опции в программе.


3.3. Как работают резаки

Резаки имеют 2 состояния - синий режим и малиновый режим. Резаки - это всего лишь подсказка для работы обработки по кнопке Process!. Важно понимать, что синий резак - не режет, он лишь очерчивает зону, внутри которой обработка по кнопке Process! будет полностью автоматически искать контур текста - и по нему реально и отрежет. В случае синего резака линия реального разреза будет где-то внутри (зоны, очерченной синими резаками) и она будет параллельно данному синему резаку (но есть исключение - синие Split-резаки Set internal margin и Set internal margin or split line не меняют никогда свой цвет и всегда режут скан по тому месту, над которым находятся - т.к. при разрезании сканов пополам никакое зональное распознавание не требуется).

ВАЖНО: Между синим резаком и соответствующей стороной контура текста (по которой и будет реально отрезано) может находиться произвольное количество белого пространства - это никак не влияет на правильную работу обработки по кнопке Process!. Важно лишь, чтобы там было как можно меньше грязи - иначе она будет принята Process!'ом за полезный текст, что приведёт к ненужному увеличению средних ширины и высоты голых текстов.

Иногда Draft kromsate автоматически отключает некоторые синие резаки - это означает, что Draft kromsate счёл, что с данной стороны текста никакой грязи нет и резак как подсказка не нужен. Однако, это не всегда так - в этом случае нужно вручную включить нужный синий резак (установкой соответствующей галки на панели управления резаками) и вручную выставить его.

Однако, полностью автоматическое (алгоритмическое) определение контура текста невозможно в принципе. Поэтому было введено понятие "малиновый резак". Малиновый резак - это "настоящий" резак, т.е. он режет скан именно по тому месту, над которым находится (только потом ещё к скану тоже поля навешиваюся). Малиновый резак - это средство ручной корректировки работы обработки по кнопке Process!.

Наиболее типичное применение малинового резака - это борьба с некорректным отрезанием ОВ-символов ("одиночные выступающие символы") - отстоящих далеко от основного текста номеров страниц, параграфов, кусочков строк и т.п. - которые программе трудно опознать как смысловые элементы - для этого потребовалось бы проводить полноценный OCR (т.е. распознавание текста).


Просьба ко всем желающим поддержать программу СканКромсатор: отсканируйте какую-нибудь книгу из этого списка, залейте её в Интернет, и пришлите ссылку по адресу bolega@hotmail.ru.


Автор: monday2000.

Дата создания: 27 марта 2006 г.

Изменено: 30 октября 2007 г.

E-Mail  (monday2000 [at] yandex.ru)

Hosted by uCoz