OCR-приложения (приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition - Оптическое распознавание символов)
– программы для перевода изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах. По сравнению с ручной перепечаткой текста, такие программы дают существенный выигрыш в скорости работы, к тому же делают меньше ошибок. Еще одно достоинство - возможность сохранить иллюстрации, а они иногда не менее важны, чем текст документа.На этом сайте представлен обзор OCR программ, которые поддерживают распознавание текста на русском языке. Среди других программ распознавания текста можно отметить TypeReader & OpenRTK компании ExperVision (коммерческая лицензия) и свободные OCR проекты: Tesseract, поддерживаемый компанией Google, GOCR, OCRopus.
OCR CUNEIFORM - это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive TechnologiesПервоначально OCR CuneiForm разрабатывался как коммерческий продукт, однако, в декабре 2007 года компания-разработчик стала распространять программу бесплатно, а в апреле 2008 года открыла исходные тексты программы. В планах дальнейшее развитие этой системы распознавания текста – проект OpenOcr.Org, поддерживаемый компанией Cognitive Technologies и сообществом OpenSource разработчиков. Эта OCR программа прилагается в комплекте с некоторыми моделями сканеров фирм Canon, Hewlett Packard, Oki, Olivetti. Технологии распознавания компании Cognitive используются в популярном издательском пакете Corel Draw. OCR CuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста. Скачать бесплатно программу сканирования и распознавания текста OCR Cuneiform 12 (freeware) с DepositFiles http://depositfiles.com/files/sj9pt7q6x Подробнее о программе распознавания текста OCR CuneiForm (возможности, скриншоты)... |
ABBYY Finereader – популярная программа распознавания текста российской компании ABBYYFinereader обеспечивает качественное распознавание и сохранение оформления документов. Существуют три версии этого пакета распознавания: Home Edition, Professional Edition и Corporate Edition, которые отличаются своими возможностями, пользовательским интерфейсом, ценой и типом лицензии. Версия Home Edition предназначена только для домашнего использования и пригодится тем, кому время от времени требуется получить распознанную копию страниц книги, учебника, статьи из журнала для последующего редактирования в распространенных офисных программах. Интерфейс программы упрощен, для работы можно выбрать один из типовых способов обработки изображения и нажатием одной кнопки быстро получить результат. Professional и Corporate Edition имеют профессиональный интерфейс, дополнительно содержат поддержку распознавания PDF файлов, встроенный редактор текста, проверку орфографии. Corporate версия ориентирована на использование в организациях, поддерживаются сетевые сканеры и многофункциональные устройства, добавлены возможности для совместной работы пользователей. Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг. В версии 9.0 также есть возможность распознавания изображений, полученных с цифровых фотоаппаратов. Обработка таких изображений имеет свои особенности, нужно скорректировать неравномерное освещение страницы, недостаточную резкозть, изгиб строчек текста.
Купить ABBYY Finereader в интернет-магазине Ozon.ru:
Что почитать: Подробнее о программе распознавания текста Finereader (возможности, скриншоты)... |
OmniPage – программа сканирования и распознавания текста компании Nuance CommunicationsПрограмма отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения "3D Correction". В этой программе есть поддержка параллельной работы с несколькими документами: можно открывать, распознавать, корректировать и сохранять несколько документов одновременно. OmniPage выпускается в трех версиях: Standard, Professional, Enterprise. Версия Professional, в отличие от Standard, включает средство для управления документами, ParerPort, и программа PDF Create, позволяющее создавать PDF документы из любого приложения. В версии Enterprise добавлены интеграция с Microsoft SharePoint Server, дополнительные сетевые и многопользовательские функции. Посмотреть возможности программы и купить ее можно на сайте компании-разработчика www.nuance.com. Подробнее о программе распознавания текста OmniPage (возможности, скриншоты)... |
Readiris – программа сканирования и распознавания текста компании I.R.I.S.Так же, как и другие программы распознавания текста, Readiris преобразует отсканированные изображения документов в редактируемый формат. Readiris уверенно распознает документы, содержащие сложную верстку, таблицы, иллюстрации. Существуют Pro и Corporate версии этого продукта, а также добавочные модули распознавания ближневосточных и восточных языков. Версия Corporate отличается от Pro улучшенной работой с PDF, поддержкой сжатия выходных файлов, распознаванием одного пакета в несколько файлов, индексированием распознанных документов и другими возможностями. В Corporate версии есть удобное средство для автоматического распознавания файлов, попадающих в определенную папку (Watched folder). Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки - арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Есть версия Readiris для Macintosh. Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и DjVu. Скачать бесплатно ознакомительную версию программы сканирования и распознавания текста ReadIris можно с сайта компании-разработчика www.irislink.com Подробнее о программе распознавания текста ReadIris (возможности, скриншоты)... |
Microsoft Office Document Imaging – программа распознавания текста компании MicrosoftВ последних версиях офисного пакета Microsoft Office появились инструменты для сканирования и распознавания текста – MS Office Document Scanning и Document Imaging. высокая степень интеграции с другими приложениями MS Office, поддерживаются средства индексирования документов. Document Imaging может открывать файлы MDI (собственный формат Microsoft для сжатия изображений) и TIFF, и передавать результаты распознавания в Microsoft Word. Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц. Подробнее о программе распознавания текста MS Office Document Imaging (скриншоты)... |