Вернуться к разделу "Как самому сделать DjVu-книгу".


infanata_logo.gif (7419 bytes)

foto_46937.jpg (3485 bytes)

NIP, 24/07/2007 17:58


Наглядное сравнение сканеров CCD и CIS при сканировании книг

(лучше один раз увидеть, чем 100 раз по форумам читать)

Незрелый ананас, для человека справедливого,
всегда хуже зрелой смородины.

(C) Козьма Прутков

Немного теории

CCD (Charge-Coupled Device, прибор с зарядовой связью - ПЗС) - светочувствительный элемент представляет собой узкую полоску из множества фотодатчиков, на которую при сканировании на каждом шаге двигателя отражается от документа и через систему зеркал попадает свет от лампы, установленной на каретке. На каждом шаге каретки сканер фиксирует одну горизонтальную полоску оригинала, разбитую в свою очередь на некоторое количество пикселей на CCD-линейке. Итоговое изображение, составленное из полосок, представляет собой как бы мозаику из пикселей одинакового размера и разного цвета. Для проецирования изображения с подсвеченного оригинала на CCD-линейку используется специальная оптическая система из объектива и нескольких зеркал.
Наглядное сравнение сканеров CCD и CIS при сканировании книг Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.1. Устройство каретки сканера на основе CCD матрицы.

CIS (Contact Image Sensor, контактный датчик изображения) - светочувствительный элемент представляет собой линейку одинаковых фотодатчиков, равную по ширине рабочему полю сканирования, непосредственно воспринимающих световой поток от оригинала. Оптическая система - зеркала, преломляющая призма, объектив - полностью отсутствует.
Наглядное сравнение сканеров CCD и CIS при сканировании книг Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.2. Устройство каретки сканера на основе CIS матрицы.

Подопытные кролики

Mustek Be@rPaw 1200CU Plus - планшетный сканер для домашнего использования. В сканере используется CIS-матрица (Contact Image Sensor). Аппаратные разрешения: 600х1200dpi

Epson Perfection 1270 - планшетный сканер, предназначенный для домашних пользователей. В сканере используется цветной линейный датчик CCD (Charge-Coupled Device). Аппаратные разрешения: 1200х2400dpi

Смотри и сравнивай

Чтобы сравнить сканеры CCD и CIS, применительно к оцифровке печатных изданий, я отсканировал в оттенках серого с разрешением 300dpi один и тоже разворот середины брошюры с текстом в 10-ти миллиметрах от кромки переплета. Для наглядности отличий в резкости получаемого результата сканировал с разной степенью прилегания материала к стеклу. Фильтры пост обработки в драйверах отключены. Полученные сканы обработке, кроме обрезки и преобразования в jpg, не подвергались.

Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.3. Окна настроек драйверов при сканировании.

Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.4. Хороший прижим: 6 мм от стекла до кромки переплета.
Линия сканирования перпендикулярна строкам.

Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.5. Средний прижим: 20 мм от стекла до кромки переплета.
Линия сканирования перпендикулярна строкам.

Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.6. Без прижима: 38 мм от стекла до кромки переплета.
Линия сканирования перпендикулярна строкам.

Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.7. Без прижима: 38 мм от стекла до кромки переплета. Линия сканирования параллельна строкам, а переплет расположен по центру планшета.

Перегонки

Условия: сканирую всю область формата А4 в оттенках серого при разрешении 300dpi.
Все замеры делаю по часам с точностью до секунды.
Наглядное сравнение сканеров CCD и CIS при сканировании книг
Подопытный CIS сканер медленнее в 3,8 раза!
Отмечу, что обнаруженные тормоза, скорее всего, не общая характеристика CIS-сканеров, а особенность конкретной модели. Т.к. в спецификации на Mustek Be@rPaw 1200CU Plus указан тип интерфейса USB 1.1, тогда как у Epson Perfection 1270 используется USB 2.0.
Повторив тест на скорость Epson Perfection 1270 для сканирования в цветном режиме 48bit 300dpi я получил практически те же результаты, хотя в его характеристиках, найденных в Интернете, указаны такие параметры: черно-белый текст, А4, 300 dpi: 13 секунд; цветное фото A4, 300 dpi: 19 секунд.

Мнения "ведущих собаководов"

Информация от консультантов сети магазинов компьютерной техники "Позитроника" (21.03.2007):
CCD-сканеры имеют ряд неоспоримых преимуществ перед CIS-моделями.
Во-первых, они обеспечивают большую (примерно в 10 раз) глубину резкости. Это означает, что с CCD-сканером 3-мерные объекты или даже книги и журналы будут отсканированы с хорошей резкостью. При сканировании CIS сканером сканируемый объект должен быть максимально плоским, иначе полученное изображение будет размытым и нерезким.
Во-вторых, они обеспечивают лучшую чувствительность к оттенкам.
В-третьих, срок службы таких сканеров значительно продолжительнее. CCD сканеры обеспечивают стабильно высокое качество сканирования в течение более 10 тыс. часов. У существующих в настоящее время CIS сканеров наблюдается падение яркости в среднем на 30% после нескольких сотен часов работы.
В-четвертых, CCD-сканеры имеют более высокую разрешающую способность.
Для объективности заметим, что разработчики и конструкторы обоих типов сканеров не перестают совершенствовать свои творения, поэтому соревнование между ними еще не закончилось абсолютной победой одного из участников.

Фрагмент статьи о тестировании МФУ OKI B2500 MFP (19.06.2007):
Примененная недорогая CIS-технология имеет некоторые недостатки, одними из главных являются неточная цветопередача и слабые показатели глубины сканирования (возможность передать объем сканируемого предмета).
Тест на глубину сканирования (охват объема) проводился с помощью линейки, установленной под углом, образуя, таким образом, со стеклом сканера и опорой прямоугольный треугольник. Высота опоры (один катет прямоугольного треугольника) равна 1.5 см - спичечный коробок, длина части линейки от стекла до опоры (гипотенуза) равна 10 см.
Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.8.
Видно, что четко различимая часть линейки составляет примерно 1 см, откуда простым расчетом получим глубину сканирования около 1.5 мм. Что ж, не шибко хороший результат, но ведь это "заслуга" примененной в сканере CIS-матрицы...

Посмотрев на это всё... (IMHO, но не только)

Глубину сканирования Epson Perfection 1270 проверяю по технологии, приведенной выше в отрывке статьи о тестировании МФУ, при помощи линейки и спичечного коробка. Сравните с рисунком 8 или со своим сканером.
Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.9. Тест на глубину сканирования (охват объема) CCD-сканера Epson Perfection 1270.

Даже при относительно хорошем прижиме сканируемого объекта к стеклу планшета, как это видно на рисунке 3, CIS-сканер размывает места находящиеся в долях миллиметра от стекла. Малая глубина резкости обусловлена отсутствием оптики - название "контактный датчик" говорит само за себя.

Можно было бы прижать чуть сильнее и проблема пропадет, решат некоторые. Вот тут то мы и наступим на грабли!
Из-за того, что каретка с другой стороны очень близко прижимается к стеклу, малейший прогиб планшета может привести к подтормаживанию каретки и в результате образуются "сдавленные" промежутки. Если сканируем простой текст для дальнейшей обработки в программе OCR - это еще пол беды, а вот если сканируем графику или схемы - хорошего мало.

Наглядное сравнение сканеров CCD и CIS при сканировании книг
Рис.10. Скан сильно прижатого текста. Линия сканирования параллельна строкам.
Изменена экспозиция для выделения проблемного участка скана.

Кроме малой глубины резкости (из-за отсутствия оптики) у CIS-сканера есть еще один принципиальный недостаток - небольшие зазоры между соседними фотодатчиками. Чтобы сделать его менее заметным CIS-матрицу фокусируют чуть ниже плоскости планшета, т.е. CIS-сканеры изначально дают слегка размытый результат (или, если хотите, сглаженный - менеджеры по продажам иногда относят эту особенность технологии к достоинствам). Проявление этого недостатка становится заметным на потерявших резкость участках скана в виде полосатости, которая хорошо видна, например, на рисунке 6.

А у CCD-сканера наоборот есть недостаток связанный с наличием оптики - разный ход луча (разное расстояние) при сканировании изображения в центре и по краям. Искажение от этой особенности CCD-сканера на изображении начинает проявляться только если объект сканирования отходит от планшета. Т.е. проблемы с геометрией у CCD-сканера начинаются там же, где начинаются проблемы с резкостью у CIS-сканера. Но даже сильно искаженное изображение CCD-сканера пригодно к применению, в отличие от размытого изображения CIS-сканера (см. рисунок 6).
Кроме того искажения можно минимизировать, расположив сканируемую книгу на планшете так, чтобы переплет был перпендикулярен линии сканирования и располагался как можно ближе к центру планшета. Пример такого скана на рисунке 7, а тот же фрагмент с искажениями на рисунке 6. Правда при сканировании обычной книги этим способом разворот не поместится на планшет целиком и придется сканировать каждую страницу в отдельности.

Еще один из часто называемых недостатков CCD-сканера - длительный прогорев лампы. Но у подопытного сканера лампа включается сразу после включения его в сеть и отключается автоматически только при длительном простое. Т.е. при пакетном сканировании, по крайней мере у этой конкретной модели, абсолютно нет задержек по этой причине. Обратная сторона медали: из-за того, что лампа выделяет тепло, на внутренней поверхности стеклянного планшета с течением времени появляется налет, который нужно чистить, иначе на изображении появится синева и нечеткость. Вывод: включай CCD-сканер в розетку только тогда, когда собрался сканировать.

Как одно из достоинств CIS-сканера указывают его постоянную готовность к сканированию, тогда почему время от нажатия на кнопку сканирования до фактического начала сканирования у подопытного CIS-сканера больше (см. раздел "Перегонки" выше), чем у подопытного CCD-сканера? Ответ прост: перед сканированием каретка сканера проходит цикл калибровки на специальной области под планшетом вне зоны сканирования и более медлительный сканер проходит этот цикл дольше.

Использование CIS-матрицы не только заметно уменьшает габариты и вес устройства, но и позволяет использовать питание от компьютера через USB-интерфейс. Кроме того CIS-сканеры работают, как правило, гораздо тише. Хотя, IMHO, плата за меньший шум - медлительность.

Считается, что отсутствие оптики делает CIS-сканер менее чувствительным к внешним механическим воздействиям, т.е. его труднее испортить неаккуратным обращением. Но следует учесть также и то, что стекло планшета у такого сканера часто тоньше, чем у его конкурента с оптикой.

В одной из публикаций, датируемой концом 2003-го года, приведена краткая сводная таблица достоинств и недостатков сканеров обоих технологий. Вот эта таблица с моими исправлениями, которые выделены цветом и знаком вопроса.
Наглядное сравнение сканеров CCD и CIS при сканировании книг
Красным цветом выделены и зачеркнуты характеристики, которые к середине 2007 года утратили актуальность. Синим со знаком вопроса - характеристики, которые характерны не для всех моделей. Зеленым цветом - мой комментарий.

Что изменилось по состоянию на середину 2007-го года?

У CCD-сканеров существенно снизилась цена и в нижнем ценовом диапазоне есть модели у которых нет задержек при пакетном сканировании, связанных с прогревом лампы.

У CIS-сканеров увеличено разрешение до 2400x4800 dpi, правда пока только у более дорогих моделей, и у некоторых моделей появилась возможность работать со слайд-адаптерами.

Например компания Canon выпускает CIS-сканер CanoScan LiDE 80 - новую ведущую модель с функцией сканирования фотоплёнок, далее цитата с сайта Canon: "Это - первый в мире сканер с контактным датчиком изображения (Contact Image Sensor, или CIS) и функцией сканирования фотоплёнок, первый в мире CIS-сканер с разрешением 2400x4800 точек на дюйм и первый в мире CIS-сканер с применением технологии FARE (Автоматическое ретуширование и улучшение изображений на плёнке). Сочетание всех этих технологических достижений в столь компактной модели - толщиной всего 38 мм...". Розничная цена на него по состоянию на лето 2007-го года чуть меньше 180 у.е.

Для сравнения цена подопытного CIS-сканера Mustek Be@rPaw 1200CU Plus около 45 у.е., а цена подопытного CCD-сканера Epson Perfection 1270 около 65 у.е.

Выбор сканера для домашнего сканирования книг (IMHO)

Для сканирования большинства книг важна в первую очередь скорость при хорошем качестве.
Именно поэтому для сканирования книг без сложных иллюстраций выбираю разрешение 300dpi.

CCD-сканер, на мой взгляд, обеспечивает наилучшие качество и скорость сканирования.
При выборе модели нужно обратить особое внимание на время полного цикла сканирования, которое сильно зависит от способа прогрева лампы и интерфейса передачи данных на компьютер.

Преимущества CIS-сканера не имеют отношения к качеству получаемого изображения и относятся к потребительским характеристикам, которые могут быть востребованы только в случае, когда возникла необходимость сканировать в читальном зале на ноутбук и нет возможности подключиться к электросети.

Следует отметить, что есть специализированные устройства для сканирования книг: например Plustek Optic Book 3600 (http://www.plustek.ru/), у которого любая книга может полностью лечь на стекло сканера и в результате - идеально отсканированное изображение без раздражающей книжной тени от переплета и никаких искаженных линий текста, причем бумажный оригинал не повреждается. Скорость сканирования - примерно 7 секунд полный цикл одной страницы 300dpi.
Наглядное сравнение сканеров CCD и CIS при сканировании книгНаглядное сравнение сканеров CCD и CIS при сканировании книг
Цена Plustek Optic Book 3600 по состоянию на лето 2007-го года около 280 у.е.

Мой путь по граблям... :)

Когда я брал себе сканер то не подозревал, что буду использовать его для перевода книг в электронный вид и уж тем более не задумывался о таких тонкостях как тип приемного элемента. По крайней мере я хоть знал, чем отличается максимальное оптическое разрешение от просто максимального (интерполированного), которое производители сканеров любят писать большими буквами сами знаете для чего.

Главными показателями при выборе сканера для меня тогда были:
1) цена - сами понимаете, чем дешевле, тем "зачем платить больше?";
2) качество сканирования - как его определить, если до этого весь опыт в сканировании сводился к скану нескольких фотографий, да нескольких страниц текста на случайных сканерах...;
3) удобство пользования - лишнего места на столе нет, да и свободные розетки на удлинителе сами не появляются;
4) надежность - чтобы не ломался.

Выбор модели также оказался делом случая. На работе был Mustek Be@rPaw 2448 Plus (со слайд модулем), а это кстати сказать CCD сканер. Для дома выбрал модель попроще - Mustek Be@rPaw 1200, а это опять таки CCD сканер (но тогда я об этом не задумывался). Продавец на фирме сказал, что у них есть за меньшие деньги новая модель с питанием от USB. Когда я спросил - "а в чем разница и почему дешевле?" - мне ответили: "так ведь экономия на блоке питания, а в остальном всё то же самое".

Но теперь то ясно, что Mustek Be@rPaw 1200CU Plus ЭТО УЖЕ CIS СКАНЕР!

И этот CIS-сканер меня долго устраивал! Для сканирования фотографий небольшое размытие (или сглаживание) только на пользу. FineReader с его сканами текста справлялся на ура. Плюс дополнительные пользовательские удобства: отсутствие блока питания, малый вес и габариты.

Пока не наступил на грабли - хотел задать на форуме вопрос о "подгоревшем" блоке стиральной машинки, положил плату на сканер - а результат совсем нечеткий :(
Наглядное сравнение сканеров CCD и CIS при сканировании книг
О сканировании книг повторяться не буду, всё видно на примерах из раздела "Смотри и сравнивай".

Еще один не очевидный недостаток CIS-сканера Mustek Be@rPaw 1200CU Plus - нерабочие WIA-драйвера, при использовании которых уже на втором сканировании возникает сообщение, что сканер не подключен. При сканировании через TWAIN-драйвера все нормально.

Когда решил найти ему замену как нельзя более кстати прочитал статью monday2000 "Описание покупки сканера (январь 2007)"
Теперь вполне доволен CCD-сканером Epson Perfection 1270.

Расшифровка некоторых терминов для людей далеких от техники

Датчик (он же сенсор, он же рецептор) - устройство, непосредственно принимающее, преобразующее и передающее специальным приборам данные каких-н. измерений.
IMHO (In My Humble Opinion) - по моему скромному мнению.
OCR (Optical Character Recognition) - оптическое распознавание символов, автоматическое распознавание с помощью специальных программ графических изображений символов печатного текста и преобразование их в формат, пригодный для обработки текстовыми процессорами, редакторами текстов и т. д.

Ссылки для любознательных

FAQ по сканированию и подготовке книг к публикации
Анатомия сканера: взгляд изнутри
Анатомия сенсоров изображений
Выбираем сканер для дома
Тестирование планшетных CCD-сканеров начального уровня
Эволюция в технологиях широкоформатного сканирования, или Килограммы против качества
Тест на самый быстрый сканер!!!
Какой сканер на сегодня лучше брать (CIS/LED) или (CCD/CCFL)?

Ограничения на использование информации из этой статьи

Никаких ограничений.
Каждый, кто прочитал эту статью и кому не лень, имеет право:
- распечатать или выучить наизусть эту статью целиком или любую её часть, без ограничений;
- копировать эту статью целиком или любую её часть на сменный или не очень носитель любым способом, кроме противоестественного;
- использовать полученную из этой статьи информацию на своё усмотрение;
- не соглашаться с приводимой в этой статье информацией, особенно с выводами и утверждениями из разделов помеченных аббревиатурой IMHO, но в случае несогласия с каким либо пунктом - слов "бред", "фигня" (и им подобных) недостаточно - пожалуйста аргументируйте свои возражения.

При использовании любой части этой статьи в своих публикациях ссылка на Infanata желательна.


P.S.
Затратив совсем немножко больше усердия и терпения хороший результат можно получить при помощи любого сканера. Все мои новости до весны 2007-го года сделаны при помощи рассмотренного в статье CIS-сканера, несмотря на все его недостатки. Например вот эта: Радиация. Дозы, эффекты, риск

"Используй то, что под рукой и не ищи себе другое", (C) Филиас Фогг, мультик "80 дней вокруг света".

И очень маленький совет от меня напоследок: не нужно устраивать перегонки "кто больше книг запостит на сайт" - сделай не десять, а одну самую интересную настолько качественно, насколько сумеешь.

P.P.S.
Скачать эту статью в формате PDF (rar +3%) 2,261,715 байт     Зеркало
Скачать статьи о сканерах оффлайн, которые приведены в разделе "Ссылки для любознательных", HTML (rar +3%) 1,904,469 байт


Автор: NIP

Источник: Наглядное сравнение сканеров CCD и CIS при сканировании книг

Дата: 24/07/2007 17:58

Hosted by uCoz