Распознавание документов в ScanPapyrus

Конвертируйте отсканированные документы в Word, PDF с сохранением форматирования текста.

Отсканированный документ представляет собой набор графических изображений, объединенных в некоторый формат. Например, форматы DjVu или TIFF предназначены исключительно для хранения изображений. В отличие от формата PDF: в этом формате можно хранить как изображения, так и текст. Зачастую вам может быть достаточно целиком сохранять отсканированные страницы в PDF без распознавания. В этом случае вы максимально сохраняете исходный внешний вид документа, не подвергая его искажениям при распознавании.

Программа ScanPapyrus дает вам возможность воспользоваться облачным сервисом распознавания от компании ABBYY (http://www.abbyy.com). Алгоритмы распознавания этой компании прошли многолетнее развитие и являются, пожалуй, самыми лучшими в мире. Они редко ошибаются при распознавании, максимально сохраняют форматирование документа и не тратят на распознавание много времени.

Для распознавания вам потребуется подключение к Интернету, кроме того доступ к сервису распознавания не является бесплатным.

Как использовать распознавание в ScanPapyrus

Начиная с версии 19.0, в ScanPapyrus появилась вкладка Распознавание.

В этой вкладке есть кнопка Распознать документ, нажав которую вы вызовете окно с параметрами распознавания. В этом окне вы можете указать язык документа, либо же, если документ на нескольких языках, то несколько языков, например, русский и английский.

Здесь же выберите выходной формат документа. Доступно несколько вариантов:

  • Microsoft Word – документ будет сохранен в файл формата Microsoft Word. Будет сохранено форматирование исходного документа, изображения будут вставлены в документ как в оригинале.
  • Microsoft Excel – если исходный отсканированный документ предоставляет собой таблицу, то вы сразу можете сохранить его в табличном документе в формате Microsoft Excel.
  • PDF текст и изображения – документ будет сохранен в PDF. Текст исходного документа будет сохранен как текст в PDF, вы сможете его копировать из PDF, производить поиск по документу. Изображения будут вставлены в документ как в оригинале. Также будет сохранено форматирование оригинального документа.
  • Rich Text – документ в текстовом формате RTF, более простом чем формат Microsoft Word.
  • Простой текст – простой текстовый документ без хранения изображений. Форматирование документа будет утеряно.

После выбора параметров нажмите кнопку Распознать. Программа отправит ваш документ в облачный сервис распознавания. На экране вы увидите ваш список документов, отправленных на распознавание.

Обычно, распознавание выполняется сервисом за одну - две минуты. Состояние распознавания документа вы можете отслеживать в окне Список задач распознавания, которое вызывается кнопкой Список задач из главного окна программы. Нажмите кнопку Обновить статус, чтобы обновить состояние задачи. Когда распознавание будет закончено, состояние задачи изменится на Завершено, а в колонке Файл появится кнопка Сохранить как…, нажав которую вы можете сохранить документ в выбранное место на вашем жестком диске.

Активация ключа распознавания

Для того чтобы воспользоваться сервисом распознавания вам понадобится активировать ключ распознавания. Каждый ключ дает вам возможность распознать 100 страниц на сервисе распознавания. Вы можете приобрести ключ распознавания на странице Купить сейчас. На эту же страницу вы попадете, нажав кнопку Купить ключ во вкладке Распознавание. После покупки, ключ будет отправлен на вашу электронную почту. Когда вы получите ключ распознавания, вам нужно будет активировать его в ScanPapyrus. Для этого нажмите кнопку Активировать ключ во вкладке Распознавание.

Вставьте ваш ключ в поле ввода и нажмите кнопку Активировать. Появится сообщение об успешной активации ключа. Срок действия ключа составляет 90 дней с момента активации.

Отслеживать состояние ключей распознавания вы можете в окне Список активированных ключей распознавания, которое вызывается кнопкой Статус ключа.

В этом окне вы можете увидеть, сколько вам доступно страниц для распознавания и когда истекает срок действия вашего ключа.

Безопасность ваших данных

Для распознавания ScanPapyrus использует облачный сервис ABBYY OCR Cloud (https://www.abbyy.com). Ваши данные хранятся и обрабатываются ABBYY в соответствии с политикой конфиденциальности (https://www.abbyy.com/privacy/). ABBYY не будет иметь доступа, просматривать, использовать, публиковать, воспроизводить или раскрывать любые Ваши загруженные данные. Загруженные данные будут храниться для целей обработки на сервере в Европейском союзе ограниченное время.

ABBYY автоматически удаляют все загруженные данные в течение сорока двух (42) часов после их загрузки в Сервис. Обработанные загруженные данные удаляются в течение двадцати четырех (24) часов после их обработки Сервисом.

При отправке страниц Вы должны самостоятельно оценивать законность, надежность, уместность, право собственности на интеллектуальную собственность и права на использование данных, отправляемых Вами в Сервис.

Все данные передаются по защищенному протоколу HTTPS, обеспечивающему защиту от перехвата данных.

Программа ScanPapyrus не отправляет и не хранит Ваши данные на сторонних серверах.