Обзор OmniPage Professional 16 | Надежные отзывы
Вы можете подумать, что программное обеспечение для оптического распознавания символов (OCR) не намного больше. Если он распознает документы точно и достаточно быстро, где можно улучшить? Фактически, Nuance заявляет о нескольких заметных улучшениях для OmniPage Professional 16, вероятно, самого известного приложения OCR на рынке.
Во-первых, говорит Nuance, новая версия на 16–27 процентов точнее, чем раньше, и в то же время на 46 процентов быстрее. Кроме того, он должен уметь компенсировать искажения линз на изображениях страниц, снятых камерой, автоматически затемнять слова в конфиденциальных документах и обрабатывать электронные и бумажные формы. Он может создавать документы в формате XPS Office 2007 и включает копии PaperPort 11 (приложение Nuance для управления документами) и PDF Converter 4, который, как вы можете догадаться, конвертирует документы в формат PDF.
Утверждается, что программа лучше справляется с созданием точных представлений страниц, не помещая все в отдельные текстовые и графические фреймы. Это уже давно вызывает недовольство, так как одно дело – иметь правильную страницу, а другое – легко редактировать текст в этом макете. Большинство программ OCR борются с частью «простого редактирования макета».
После установки и активации OmniPage Professional 16 вам необходимо настроить сканер для работы с ним. Мастер настройки сканера должен запуститься автоматически, хотя в нашем случае этого не произошло. Мастер загрузил последнюю базу данных сканеров с Nuance, в которую не входил наш HP OfficeJet 7210, текущее и популярное многофункциональное устройство. Чтобы распознать программу, нам пришлось запустить диагностику, которая включала сканирование текста, серой шкалы и цветных документов – около пяти минут работы.
Главный экран обработки предлагает четыре вкладки основных задач вверху и три панели внизу; один для эскизов, один для графического изображения страницы и один для текста с распознаванием текста. Внизу находится полноразмерная панель статистики документа, большую часть которой OmniPage обрабатывает сама.
Вкладки предназначены для рабочего процесса, типа загрузки или сканирования, макета страницы и экспорта. Несмотря на то, что думает Nuance, они не так интуитивно понятны в использовании. Как будто это признание этого факта, серия практических руководств охватывает многие задачи, которые должны быть очевидны, но таковыми не являются. Неожиданно рабочий процесс 1-2-3 по умолчанию, предназначенный для автоматической обработки наиболее распространенных задач распознавания текста, по умолчанию настроен на загрузку изображений из файла – действительно ли большинство клиентов хотят получать свои входные документы? Вы должны изменить это поведение до того, как программа начнет вместо этого обращаться к сканеру.
Отсканировав документ и распознав его символы, программа затем проверила его и заявила о 100-процентной точности, хотя в тексте было два случая одной и той же опечатки. То, что чтение «tor» вместо «for» по-прежнему дает правильное слово, еще не означает, что оно правильное.
OmniPage завершил распознавание чуть более чем за две секунды, что быстро, и даже более сложная страница с графикой и текстом в рамке заняла менее 10 секунд. Эта страница нуждалась в дополнительной подготовке, прежде чем мы смогли получить редактируемый документ с разумным сходством с оригиналом. Нам нужно было очертить области страницы, которые мы хотели обрабатывать как текст, а не оставлять OmniPage включенным автоматически.
Даже здесь есть заметные неточности. Некоторые из них понятны, например, неправильное прочтение цветного текста из оригинала, в то время как другие, например различия в шрифте и стиле текста, менее приемлемы. Часть текста была помещена в поля на созданной нами странице Word 2003, а остальная часть – в основной текст. Кроме того, существует множество отступов и межстрочных интервалов, хотя весь текст имеет одинаковое левое поле в оригинале.
Достаточно легко сохранить документы с оптическим распознаванием текста в любом из поддерживаемых типов файлов, включая Word 2007 docx, Adobe PDF, WordPerfect X3 и WAV для воспроизведения звука. Преобразование текста в речь особенно хорошее и, несмотря на американский акцент, звучит сравнительно естественно и выразительно.
Если вам не нужен PaperPort или PDF Converter и вы можете обойтись без некоторых из более корпоративных функций OmniPage Professional 16, таких как распознавание форм, затемнение (или редактирование) слов и диспетчер пакетной обработки, то стандартный OmniPage 16 стоит около £ 60 – большая экономия по сравнению с версией Professional.
«Вердикт»
Все улучшения, отмеченные для OmniPage Professional 16, были бы полезны, но, судя по нашим тестам, у программного обеспечения еще есть какой-то способ выполнить их. Нет сомнений в том, что для пакетной обработки длинных стандартных текстовых документов программное обеспечение может сэкономить много времени, но для более сложных страниц, содержащих значительный графический контент, ему все равно будет сложно приблизиться к тому, что вы отсканировали.
Оценка в деталях
Характеристики 7
Значение 7
Удобство использования 6