Бумажные документы так или иначе остаются в обороте, поэтому по-прежнему актуальны задача перевода документов в электронный вид и возможность извлечения
информации из документа в структурированном виде для последующей передачи в целевые бизнес-системы. После ухода западных игроков с российского рынка решений для распознавания изображений (сканов) документов сервисы LDM.IDR, предназначенные для преображения в машиночитаемый текст, стали весьма актуальны. Особенно такие решения, которые превосходят западные аналоги в качестве распознавания.
Компонент LDM.IDR позволяет исполнять различные функции — полнотекстовое распознавание с сохранением порядка чтения, классификацию документов, извлечение значимых атрибутов как из структурированных документов (счета-фактуры, акты и др.), так и из неструктурированных (договоры, постановления), выделение маркеров в виде штампов, подписей, печатей и др. Для управления механизмом распознавания документов используется как «типовой» подход с настройкой шаблонов, так и механизмы
машинного обучения, способные построить модель документа на основе примеров файлов без привлечения разработчиков.
Предлагаемые долгие годы на рынке продукты предполагали, как правило, жесткий процесс обработки документов, включающий последовательные этапы сканирования, классификации, распознавания, проверки
данных и т.п. В основе LDM.IDR лежит сервисная модель. Это позволяет использовать функциональность сервисов там и тогда, когда это нужно, встраивать сервисы в бизнес-приложения и сквозные процессы.
Примером использования сервисного подхода может быть сценарий, при котором сотрудник фотографирует счет-фактуру на
мобильный телефон, сервис распознает текст и создает документ, автоматически загружаемый в бизнес-систему.
Итак, использование компонента LDM.IDR обеспечивает:
- снижение операционных затрат на обработку документов;
- подключение сервисов распознавания в любые бизнес-процессы и использование там и тогда, где это необходимо;
- реализацию потоковой обработки документов;
- анализ документов в бизнес-системах «здесь и сейчас»;
- снижение количества ошибок при вводе информации в бизнес-системы.