Как распознать отсканированный документ
Получите 500 бесплатных страниц для распознавания документов
Отсканированный документ представляет собой набор графических изображений, объединенных в некоторый формат. Например, форматы DjVu или TIFF предназначены исключительно для хранения изображений. В отличие от формата PDF: в этом формате можно хранить как изображения, так и текст. Зачастую вам может быть достаточно целиком сохранять отсканированные страницы в PDF без распознавания. В этом случае вы максимально сохраняете исходный внешний вид документа, не подвергая его искажениям при распознавании.
Программа ScanPapyrus дает вам возможность воспользоваться облачными сервисами распознавания.
Для распознавания вам потребуется подключение к Интернету, кроме того сервисы распознавания не является бесплатными со стороны компаний. Для того чтобы использовать распознавание, вам нужно создать аккаунт на сайте сервиса и подключить его к ScanPapyrus.
ABBYY Cloud OCR
Алгоритмы распознавания этой компании прошли многолетнее развитие и являются, пожалуй, самыми лучшими в мире. Они редко ошибаются при распознавании, максимально сохраняют форматирование документа и не тратят на распознавание много времени.
500 бесплатных страниц при первой регистрации.
OcrWebService
OCR Web Service построен на высокоточной технологии автоматического оптического распознавания символов (OCR) с точностью до 99%. Эта повышенная точность значительно снижает необходимость в корректуре и коррекции после распознавания.
Бесплатный месяц использования при первой регистрации. Лимит 25 страниц в день.