Как распознать отсканированный документ
Получите 25000 бесплатных страниц для распознавания документов
Отсканированный документ представляет собой набор графических изображений, объединенных в некоторый формат. Например, форматы DjVu или TIFF предназначены исключительно для хранения изображений. В отличие от формата PDF: в этом формате можно хранить как изображения, так и текст. Зачастую вам может быть достаточно целиком сохранять отсканированные страницы в PDF без распознавания. В этом случае вы максимально сохраняете исходный внешний вид документа, не подвергая его искажениям при распознавании.
Программа ScanPapyrus дает вам возможность воспользоваться облачными сервисами распознавания.
Для распознавания вам потребуется подключение к Интернету, кроме того сервисы распознавания не является бесплатными со стороны компаний. Для того чтобы использовать распознавание, вам нужно создать аккаунт на сайте сервиса и подключить его к ScanPapyrus.
OcrWebService
OCR Web Service построен на высокоточной технологии автоматического оптического распознавания символов (OCR) с точностью до 99%. Эта повышенная точность значительно снижает необходимость в корректуре и коррекции после распознавания.
Бесплатный месяц использования при первой регистрации. Лимит 25 страниц в день.
OCR Space
Онлайн-сервис распознавания текста OCR Space преобразует сканы или изображения текстовых документов в редактируемые файлы с помощью оптического распознавания символов (OCR).
Сохраняет распознанный документ в виде PDF с возможностью поиска (Searchable PDF).
25000 бесплатных страниц в месяц. Дневной лимит 500 страниц.