Вернуться к разделу "Материалы по сканированию и оцифровке бумажных книг".
По материалам книги Сибил и Эмиль
Айриг
"Сканирование - профессиональный подход".
Создавая электронные версии бумажных книг (в формате DjVu), необходимо знать некоторые основные базовые понятия из области сканирования и преобразования изображений. Это поможет создавать электронные книги лучшего качества, а также находить общий язык с единомышленниками.
К таким базовым понятиям относятся, например, "DPI" и "ресемплинг".
Исходная чёрно-белая или цветная страница бумажной книги имеет непрерывный тон - смежные цвета или оттенки плавно переходят друг в друга. Однако компьютеры не могут воспринять ничего непрерывного, для того, чтобы поместить в компьютер цифровую копию бумажной страницы, её нужно разбить на дискретные единицы - пикселы.
Пиксел, или элемент изображения, является минимальной единицей измерения данных изображения. Каждый пиксел имеет однородный цвет. Компьютер же воспроизводит цифровые изображения путём моделирования непрерывных тонов с помощью этих маленьких дискретных элементов.
Понятие "разрешение" имеет несколько различных значений:
Плотность информации, которую сканирующее устройство может вводить на дюйм (входное разрешение, или разрешение при сканировании).
Полный объём информации в растровом изображении (разрешение изображения).
Число дискретных горизонтальных и вертикальных элементов, которые может одновременно отображать компьютерный монитор (экранное разрешение).
Важно различать эти значения.
Во всех случаях разрешение описывает либо общее количество, либо плотность графической информации в пикселях на единицу площади цифрового изображения (при масштабе 100%).
Все оцифровывающие устройства - сканеры, цифровые фото- и видеокамеры и т.д., имеют несколько общих функций:
- Преобразуют аналоговую (реальную) информацию в цифровые данные, которые могут использоваться компьютером.
- Генерируют растровые изображения, состоящие из матриц чёрно-белых, серых полутоновых или цветных пикселов (элементов изображения).
Примечание: Растровые изображения часто называют также битовыми изображениями, но между ними имеется важное различие. Термин "растровое изображение" описывает состоящие из пикселов изображения независимо от их цветовых характеристик. Битовые изображения (bitmap) содержат только чёрно-белые пикселы.
- Считывают или производят выборку исходного изображения, измеряя значения градаций серого или цвета для каждого элемента выборки.
Входное разрешение сканера описывает плотность, с которой сканирующее устройство производит выборку информации в данной области (обычно на дюйм или на сантиметр) в ходе оцифровки.
Программные интерфейсы многих оцифровывающих устройств описывают частоту дискретизации в ppi или пикселах на дюйм. Многие цифровые фото- и видеокамеры имеют единое фиксированное входное разрешение, а в сканерах обычно имеется диапазон возможных разрешений. При этом с ростом частоты дискретизации сканирующего устройства размер генерируемых пикселов уменьшается. Это легко понять, если мысленно попробовать упаковать 50 сардин в банку, предназначенную для 25 сардин стандартного размера. 50 сардин поместятся в ней только в том случае, если они вдвое меньше стандартных 25.
Термин "пикселы" может также указывать полный объём информации, которую оцифрованное изображение содержит по горизонтали и по вертикали (например, 800 х 400 пикселов). Этот вариант использования описывает скорее разрешение изображения, чем входное разрешение. Наконец, многие используют термин "пикселы" для описания экранного разрешения - числа горизонтальных и вертикальных дискретных визуальных элементов, которые может отображать компьютерный монитор, - например, 1024 х 768 пикселов. В отличие от размера пикселов, которые вводит сканирующее устройство, размер пикселов на компьютерном мониторе остается постоянным. Следовательно, монитор отображает все пикселы каждого изображения с единым фиксированным размером. Это объясняет, почему изображение, сканированное с разрешением 300 ppi, отображается на мониторе компьютера Macintosh с разрешением всего 72 ppi и выглядит намного большим на экране, чем в печати.
DPI (точки на дюйм) Многие журналисты и некоторые программные интерфейсы сканирования всё ещё используют термин dpi (точки на дюйм) для описания разрешения при сканировании, или входного разрешения. Однако с технической точки зрения число точек на дюйм описывает выходное разрешение, представляя горизонтальную плотность меток, которые имиджсеттеры и лазерные принтеры типа PostScript делают в ходе печати. Будьте внимательны и не путайте эти два термина - подразумевайте "ppi" всякий раз, когда видите в интерфейсе сканера "dpi".
Одним из важнейших критериев при выборе сканера или бесплёночной цифровой камеры должно быть максимальное входное разрешение конкретного сканирующего устройства. Изготовители определяют это максимальное значение двумя способами: как оптическое разрешение или как интерполированное разрешение.
Оптическое разрешение описывает объём реальной информации, который может ввести оптическая система сканирующего устройства. Факторы, определяющие оптическое разрешение, зависят от типа оцифровывающего устройства. В планшетных, листовых, ручных сканерах и многих сканерах для обработки слайдов и диапозитивов максимальное оптическое разрешение зависит от трёх факторов:
а). Количества отдельных датчиков в линейке ПЗС в перемещающейся сканирующей головке. ПЗС ("приборы с зарядовой связью") - это твердотельный электронный компонент, состоящий из множества крошечных датчиков, которые регистрируют аналоговый электрический заряд, пропорциональный интенсивности падающего на них света).
b). Максимальной ширины оригинала, который может обработать сканер. Например, линейка ПЗС из 5100 ячеек в сканере, принимающем оригиналы шириной до 8,5 дюймов, позволяет получить максимальное горизонтальное оптическое разрешение 600 ppi.
с). Расстояние смещения сканирующей головки по оригинальному изображению. Оно определяет вертикальное разрешение, которое может быть выше, чем горизонтальное.
В цифровых фото- и видеокамерах, а также некоторых сканерах для обработки диапозитивов обычно используется прямоугольная матрица (а не перемещающаяся линейка) ПЗС, определяющая общее число пикселов, которые могут вводиться по любому направлению.
Примечание: Изготовители планшетных сканеров часто приводят вертикальное оптическое разрешение вдвое большее, чем горизонтальное, например, 600 х 1200 ppi. Механизм перемещения этих сканеров отрабатывает "полушаги", сдвигая головку на половину пиксела за шаг, что приводит к перекрыванию пикселов. Для получения окончательного значения уровней цвета или серого сканер должен выполнить математическое усреднение. "Истинное" оптическое разрешение этих сканеров ниже (например, 600 х 600 ppi), оно также приводит к наилучшей чёткости изображения и уменьшает шум.
С другой стороны, максимальное интерполированное разрешение устройства представляет кажущийся объём информации, который сканер может вводить с помощью алгоритмов реализуемых процессором и/или программным обеспечением. Алгоритмы интерполяции не добавляют реальных деталей в изображение, они лишь добавляют пикселы, просто усредняя значения цвета или градаций серого в смежных пикселах и вставляя между ними новый пиксел. Интерполированное разрешение часто в два или более раз выше, чем оптическое.
Остерегайтесь маркетинговых уловок - там, где важно качество, имеет значение только оптическое разрешение. Интерполяция добавляет "псевдоинформацию", которая может быть приемлема для дешёвых публикаций или компаний с ограниченными средствами, но никогда не будет работать в цветных изображениях большого формата, где жизненно важны детальная структура и широкий тоновый диапазон. Интерполяция также приводит к "смягчению" изображения и необходимости более серьёзного увеличения контраста на границах между областями. Если вы часто сканируете для высококачественной печати, то лишь выиграете, вложив дополнительные деньги в сканер с более высоким оптическим разрешением.
Каждый пиксел растрового изображения имеет четыре основные характеристики - размер, тоновое значение, глубину цвета и позицию. Эти четыре атрибута определяют разрешение, причем каждый это делает по-своему.
Все пикселы одного изображения имеют одинаковый размер. Изначально размер пиксела определён разрешением, с которым было сканировано или оцифровано изображение. Так, разрешение в 600 пикселов на дюйм указывает, что размер каждого пиксела равен 1/600 дюйма. При более высоком входном разрешении генерируются пикселы меньшего размера, что, в свою очередь, обеспечивает большее количество информации и вероятных деталей на единицу измерения, а также большую плавность тоновых переходов. При более низком разрешении пикселы имеют больший размер, наблюдается меньше деталей на единицу измерения и изображение имеет мозаичную структуру. Размер и количество пикселов определяют количество информации, содержащейся в изображении. Можно изменить размер пиксела в любой момент производственного процесса, изменив разрешение. При этом если изображение выводится на печать, то автоматически изменится размер отпечатка.
Сканеры и цифровые камеры присваивают определенное значение цвета или оттенка серого каждому пикселу изображения. Эффект непрерывности тона возникает из-за того, что пикселы очень малы и соседние пикселы только немного отличаются друг от друга по цвету или тону. Изображения, сканированные с помощью устройств с широким динамическим диапазоном, наилучшим образом передают непрерывность тона. Динамический диапазон - это аппаратная чувствительность сканера к тончайшим цветовым оттенкам на сканируемом изображении. Динамический диапазон зависит от битовой разрядности сканера, соотношения сигнал/шум, типа лампы подсветки, непрерывной коррекции тона и т.д. Чем дороже сканер, тем шире его динамический диапазон.
Конечно, каждому отдельному пикселу можно приписать лишь одно значение, но существует такая характеристика, как разрядность битового представления цвета (или глубина цвета) оцифровывающего устройства, определяющая количество возможных цветов или тонов. Каждый дополнительный бит приводит к росту размера графических файлов и, соответственно, потребности в свободном месте на жёстком диске, хотя при этом увеличивается гладкость переходов между смежными цветами и тонами.
Растровое изображение представляет собой сетку дискретных пикселов, каждый из которых имеет определенные горизонтальные и вертикальные координаты внутри сетки. В большинстве основных программ редактирования изображений можно узнать координаты любого пиксела, поместив над ним инструмент Eyedropper (пипетка). Физические размеры сетки, определяемой общим количеством пикселов и разрешением, задают относительное положение пикселов.
Большинство цифровых изображений имеют следующие размерные характеристики:
1. Физические размеры (длина и ширина) в дюймах (миллиметрах, точках и т.д.). Это, в общем-то, довольно условная величина, которая показывает, какую площадь экрана монитора или страницы при печати на принтере будет занимать данное изображение при масштабе 100%.
2. Печатные (пиксельные) размеры (длина и ширина) в пикселях (процентах).
3. Разрешение (пикселы/дюймы, пикселы/сантиметры). Это определённое соотношение предыдущих величин.
Все 3 вида этих характеристик являются переменными величинами.
Многие профессионалы-графики не понимают, чем изменение физических размеров изображения отличается от повторной выборки. При изменении физических размеров пропорционально изменяется разрешение при неизменном информационном содержании (размере файла). С другой стороны, повторная выборка, или ресемплинг, всегда связана с изменением объёма информации в изображении и может включать независимые изменения любой из трёх (или всех) размерных характеристик файлов. Ресемплинг всегда изменяет количество пикселей и размер файла. Поскольку это влечет за собой интерполяцию и усреднение, повторную выборку следует использовать только в том случае, если сканированное изображение оригинала содержит или слишком много, или слишком мало информации для высококачественного вывода.
Профессионалы художественной графики используют термин субдискретизация (downsampling), или уменьшение размеров изображения, для описания уменьшения числа пикселов в изображении и термин интерполяция (upsampling), или увеличение размеров изображения, чтобы описать увеличение числа пикселов.
Усреднение значений пиксела происходит в обоих случаях. При правильном проведении субдискретизации устраняются ненужные детали, в то время как при увеличении пиксельных размеров изображения добавляются псевдодетали. Оба способа являются компромиссными и воздействуют на качество изображения, но субдискретизация редко приводит к видимому ухудшению качества изображения, потому что она обычно сопровождается уменьшением размера изображения, а увеличение пиксельных размеров изображения почти всегда приводит к ухудшению изображения.
Повторную выборку изображения можно провести с помощью двух базовых методов - ручного масштабирования или через диалоговое окно типа Image Size (размер изображения), где в цифровой форме определяется изменение разрешения или размеров. Второй метод намного точнее и дает возможность точно проконтролировать количество добавляемой или отбрасываемой информации.
Используйте алгоритм повторной выборки самого высокого качества, поддерживаемый вашим пакетом редактирования изображений, чтобы минимизировать видимые потери. Так, например, Photoshop предлагает выбор трех опций: Bicubic (бикубическая), Bilinear (билинейная) и Nearest Neighbor (ближайший сосед). Опция Bicubic выполняет наиболее сложное усреднение значений пикселов; метод Bilinear производит более мягкий просмотр, уменьшающий вероятность артефактов; и Nearest Neighbor выполняется быстро, но приводит к более видимой ступенчатости изображения.
Не производите повторную выборку одного изображения более, чем один раз. Каждое изменение объёма информации в изображении связано с потерями, так что не стоит разбираться в причинах ухудшения второго, третьего (и далее) поколения.
Субдискретизация более надежна, чем увеличение пиксельных размеров изображения, с точки зрения уменьшения потерь качества изображения, особенно если физический размер выводимого изображения уменьшается. Детали, потерянные при проведении субдискретизации, все равно нельзя было вывести на печать.
Как уже было сказано, изменение разрешения не обязательно предполагает ресемплинг. Всего возможны 2 варианта:
1. Изменение разрешения с ресемплингом. При этом всегда изменяется количество пикселей и размер файла. Это часто связано с риском ухудшения качества изображения. Подварианты:
a). При чрезмерном уменьшении разрешения (с понижающим ресемплингом) может возникнуть угроза целостности и детальности изображения ("нарастание мозаичности").
b). При сильном увеличении разрешения (с повышающим ресемплингом) может ухудшиться чёткость и проработка деталей изображения (т.к. процесс интерполяции не добавляет "реальных" деталей). Этот дефект можно частично компенсировать с помощью фильтра наложения нерезкой маски. (Соблюдайте осторожность при наложении нерезкой маски на изображения низкого разрешения - во всех случаях, кроме светлых изображений, это может привести к нежелательным эффектам возникновения ореола).
2. Изменение разрешения без ресемплинга не меняет информационное содержание файла, а только автоматически и пропорционально меняет физические размеры изображения (в мм) так, чтобы оставить неизменными размеры в пикселях по длине и ширине. Можно наоборот - поменять физические размеры изображения - при этом пропорционально изменится разрешение. В любом случае количество пикселей, размер и качество изображения не изменятся.
Рассмотрим примеры повышения и понижения разрешения изображения с ресемплингом и без него (в Adobe Photoshop 5.0):
Файл в формате Color TIFF LZW.
a). Без ресемплинга:
Размер файла не изменился.
b). С ресемплингом:
Размер файла возрос в 2,87 раза (примерно в 3 раза).
a). Без ресемплинга:
Размер файла не изменился.
b). С ресемплингом:
Размер файла уменьшился в 3,36 раза (примерно в 3 раза).
Разрешение (компьютерная графика) в Википедии
Автор: monday2000.
24 мая 2006 г.
E-Mail (monday2000 [at] yandex.ru)