OCR-приложения (приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition - Оптическое распознавание символов)

– программы для перевода изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах. По сравнению с ручной перепечаткой текста, такие программы дают существенный выигрыш в скорости работы, к тому же делают меньше ошибок. Еще одно достоинство - возможность сохранить иллюстрации, а они иногда не менее важны, чем текст документа.

На этом сайте представлен обзор OCR программ, которые поддерживают распознавание текста на русском языке. Среди других программ распознавания текста можно отметить TypeReader & OpenRTK компании ExperVision (коммерческая лицензия) и свободные OCR проекты: Tesseract, поддерживаемый компанией Google, GOCR, OCRopus.


OCR Cunieform

OCR CUNEIFORM - это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies

Первоначально OCR CuneiForm разрабатывался как коммерческий продукт, однако, в декабре 2007 года компания-разработчик стала распространять программу бесплатно, а в апреле 2008 года открыла исходные тексты программы. В планах дальнейшее развитие этой системы распознавания текста – проект OpenOcr.Org, поддерживаемый компанией Cognitive Technologies и сообществом OpenSource разработчиков.

Эта OCR программа прилагается в комплекте с некоторыми моделями сканеров фирм Canon, Hewlett Packard, Oki, Olivetti. Технологии распознавания компании Cognitive используются в популярном издательском пакете Corel Draw.

OCR CuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста.

Скачать бесплатно программу сканирования и распознавания текста OCR Cuneiform 12 (freeware) с DepositFiles http://depositfiles.com/files/sj9pt7q6x

Подробнее о программе распознавания текста OCR CuneiForm (возможности, скриншоты)...

Finereader

ABBYY Finereader – популярная программа распознавания текста российской компании ABBYY

Finereader обеспечивает качественное распознавание и сохранение оформления документов. Существуют три версии этого пакета распознавания: Home Edition, Professional Edition и Corporate Edition, которые отличаются своими возможностями, пользовательским интерфейсом, ценой и типом лицензии.

Версия Home Edition предназначена только для домашнего использования и пригодится тем, кому время от времени требуется получить распознанную копию страниц книги, учебника, статьи из журнала для последующего редактирования в распространенных офисных программах. Интерфейс программы упрощен, для работы можно выбрать один из типовых способов обработки изображения и нажатием одной кнопки быстро получить результат.

Professional и Corporate Edition имеют профессиональный интерфейс, дополнительно содержат поддержку распознавания PDF файлов, встроенный редактор текста, проверку орфографии. Corporate версия ориентирована на использование в организациях, поддерживаются сетевые сканеры и многофункциональные устройства, добавлены возможности для совместной работы пользователей.

Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг.

В версии 9.0 также есть возможность распознавания изображений, полученных с цифровых фотоаппаратов. Обработка таких изображений имеет свои особенности, нужно скорректировать неравномерное освещение страницы, недостаточную резкозть, изгиб строчек текста.

Купить ABBYY Finereader в интернет-магазине Ozon.ru:
ABBYY FineReader 9.0 Home Edition
ABBYY FineReader 10 Professional Edition
ABBYY FineReader 9.0 Corporate Edition

Что почитать:
А. П. Корнеев, А. А. Иванова, Р. Г. Прокди. Программа FineReader. Серия: Компьютерная шпаргалка

Подробнее о программе распознавания текста Finereader (возможности, скриншоты)...

OmniPage

OmniPage – программа сканирования и распознавания текста компании Nuance Communications

Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения "3D Correction".

В этой программе есть поддержка параллельной работы с несколькими документами: можно открывать, распознавать, корректировать и сохранять несколько документов одновременно.

OmniPage выпускается в трех версиях: Standard, Professional, Enterprise. Версия Professional, в отличие от Standard, включает средство для управления документами, ParerPort, и программа PDF Create, позволяющее создавать PDF документы из любого приложения. В версии Enterprise добавлены интеграция с Microsoft SharePoint Server, дополнительные сетевые и многопользовательские функции.

Посмотреть возможности программы и купить ее можно на сайте компании-разработчика www.nuance.com.

Подробнее о программе распознавания текста OmniPage (возможности, скриншоты)...

Readiris

Readiris – программа сканирования и распознавания текста компании I.R.I.S.

Так же, как и другие программы распознавания текста, Readiris преобразует отсканированные изображения документов в редактируемый формат. Readiris уверенно распознает документы, содержащие сложную верстку, таблицы, иллюстрации.

Существуют Pro и Corporate версии этого продукта, а также добавочные модули распознавания ближневосточных и восточных языков. Версия Corporate отличается от Pro улучшенной работой с PDF, поддержкой сжатия выходных файлов, распознаванием одного пакета в несколько файлов, индексированием распознанных документов и другими возможностями. В Corporate версии есть удобное средство для автоматического распознавания файлов, попадающих в определенную папку (Watched folder).

Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки - арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Есть версия Readiris для Macintosh.

Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и DjVu.

Скачать бесплатно ознакомительную версию программы сканирования и распознавания текста ReadIris можно с сайта компании-разработчика www.irislink.com

Подробнее о программе распознавания текста ReadIris (возможности, скриншоты)...

MS Office Document Imaging

Microsoft Office Document Imaging – программа распознавания текста компании Microsoft

В последних версиях офисного пакета Microsoft Office появились инструменты для сканирования и распознавания текста – MS Office Document Scanning и Document Imaging. высокая степень интеграции с другими приложениями MS Office, поддерживаются средства индексирования документов. Document Imaging может открывать файлы MDI (собственный формат Microsoft для сжатия изображений) и TIFF, и передавать результаты распознавания в Microsoft Word.

Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц.

Подробнее о программе распознавания текста MS Office Document Imaging (скриншоты)...

Меню

Ссылки по теме


Hosted by uCoz