До настоящего времени,считалось что,реальной альтернативы ABBYY FineReader нет.
Но недавно Российская компания Cognitive Technologies выпустила
бесплатную версию своей программы CuneiForm v12,для распознования
текста.
Ее возможности не уступают ABBYY FineReader
OCR CuneiForm может распознавать любые полиграфические, машинописные
гарнитуры всех начертаний и шрифты, получаемые с принтеров за
исключением декоративных и рукописных. В систему встроены специальные
алгоритмы для распознавания текста с матричного принтера, плохих
ксерокопий факсов и машинописи.
OCR CuneiForm это:
* высокое качество распознавания;
* высокая скорость работы;
* распознавание текстов на русском, английском, смешанном
русско-английском, украинском, немецком, французском, испанском,
итальянском, шведском и других (всего более 20);
* работа в режиме автофрагментации для поиска текстовых блоков, таблиц
и изображений, а также мощное средство ручной и полуавтоматической
фрагментации;
* распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
* автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
* полное сохранение топологии страницы;
* поддержка пакетного режима сканирования и распознавания;
* простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
* встроенный текстовый редактор для работы с распознанным текстом;
* совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых
адаптивное распознавание, нейронные сети, когнитивный анализ
альтернатив распознавания и другие.
Портирована,работает с любого носителя.Качество распознования,отменное.
Это система оптического распознавания ведущего российского разработчика
программного обеспечения Cognitive Technologies. OCR CuneiForm
обеспечивает быстрое и высококачественное преобразование бумажных
документов и электронных графических файлов в редактируемый текст для
последующей работы с ним.
OCR CuneiForm отличается от других программ этого класса высоким
уровнем распознавания, особенно текстов низкого качества и наличием
встроенных мастеров - помощников в работе; мощным встроенным текстовым
редактором.
Компания Cognitive Technologies, созданная в 1993 году на базе
лаборатории искусственного интеллекта Института Системного Анализа РАН,
сочетает в системе распознавания текстов CuneiForm передовые технологии
и результаты многолетних исследований и разработок отечественных ученых
и программистов. Благодаря этому OCR CuneiForm стал одной из самых
популярных в мире систем распознавания текстов. В России CuneiForm
всегда задавал стандарты и новые направления развития и для других
OCR-систем.
Основные возможности OCR CuneiForm
1. ИНТЕРФЕЙС
Интерфейс программы содержит выпадающие контекстные меню, панели быстрого доступа, контекстную помощь.
2. СКАНИРОВАНИЕ
Автоматический подбор оптимальных параметров сканирования.
Возможность импортирования отсканированных или полученных через факс-модем графических файлов во многих форматах.
Обработка изображений: печать образа, инвертирование, поворот.
3. ФРАГМЕНТАЦИЯ
Автоматический и полуавтоматический режимы поиска блоков текста, таблиц
и графики, который обеспечивает большую гибкость при работе с
многоколоночными текстами и текстами сложной структуры и с графическими
элементами.
Режим ручной фрагментации для работы с текстами особо сложной структуры.
4. РАСПОЗНАВАНИЕ
CuneiForm распознает любые полиграфические, машинописные гарнитуры всех
начертаний и шрифты, получаемые с принтеров за исключением декоративных
и рукописных. В систему встроены специальные алгоритмы для
распознавания текста с матричного принтера, печатной машинки, плохих
ксерокопий и факсов.
Самообучающиеся адаптивные алгоритмы распознавания повышают вероятность распознавания низкокачественных документов.
5. ЯЗЫКОВАЯ ПОДДЕРЖКА
Система распознает русский, английский, смешанный русско-английский,
украинский, немецкий, французский, испанский, португальский,
итальянский, голландский, датский, шведский, финский, сербский,
хорватский, польский, казахский, узбекский и другие языки.
6. СЛОВАРНЫЙ КОНТРОЛЬ
Словарь общеупотребительной лексики каждого поддерживаемого языка для
контекстной проверки и повышения качества результатов распознавания.
Возможность создания и пополнения пользовательского словаря, а также возможность экспорта/импорта словаря в/из текстовых файлов.
7. РЕАЛИЗАЦИЯ ПРИНЦИПА "What You Scan Is What You Get" ("Что Вы сканируете, то и получаете").
CuneiForm позволяет получить полную копию вводимого документа, включая:
Шрифтовое оформление и форматирование.
Расположение текста, иллюстраций и таблиц.
Колонки, абзацы, отступы, стили и размеры шрифтов.
Черно-белые, 256-градационные серые и цветные 24-битные иллюстрации в выходном RTF-файле.
8. РАБОТА С ТАБЛИЦАМИ
Распознавание таблиц различной структуры, в том числе и без линий разграфки.
Редактирование таблиц (уменьшение/увеличение, удаление/создание колонок и т.д.)
Сохранение результатов в распространенных табличных форматах.
9. РЕДАКТИРОВАНИЕ
В программу встроен многофункциональный редактор, не уступающий по своим возможностям популярным текстовым процессорам.
Одновременная подсветка распознанного текста и исходного изображения,
снабженная функцией "следующий/предыдущий сомнительно распознанный".
Поддержка иллюстраций, таблиц, колонок, колонтитулов, сложного форматирования и различных шрифтов.
Возможность редактирования текстовых документов популярных форматов.
10. ИНТЕГРАЦИЯ С ДРУГИМИ ПРИЛОЖЕНИЯМИ
Опции командной строки и поддержка Drag&Drop для вызова из внешних
приложений, сканирования, распознавания и сохранения результатов в
автоматическом режиме