Как мы, OCR и роботы освободили бухгалтеров от рутины

  • Дата публикации: 28.04.2024

Рассказываем об опыте роботизации процессов в бухгалтерии с помощью RPA и OCR.

Распознавание и верификация документов Sherpa OCR

В современном мире роботизация бизнес-процессов становится ключевым элементом стратегии многих компаний, стремящихся повысить эффективность работы и сделать быстрее и больше, не потеряв в качестве. Использование инновационных технологий, таких как Sherpa OCR, позволяет автоматизировать процесс обработки документов, улучшая точность и скорость выполнения задач. Совмещение роботизации и OCR-технологий открывает новые возможности для оптимизации бизнес-процессов, сокращения издержек и увеличения производительности. 

Как завести первичную документацию быстро и без ошибок 

Для комплексного решения проблемы верификации и разнесения первичной документации для бухгалтерии на одном из наших проектов в качестве решения была рассмотрена платформа SheRPA c компонентами шаблонизации, распознавания и станцией верификации. Sherpa входит в топ 3 отечественных решений, при этом OCR составляющая не имеет аналогов.

Sherpa RPA объединяет в себе функционал программных роботов, интеллектуального распознавания документов (IDP), а также инструменты ИИ, работающих как в открытом, так и закрытом контуре. Встроенный шаблонизатор позволяет распознавать и верифицировать структурированные и неструктурированные документы даже плохого качества, распознавать рукописный текст, штрих-коды, QR коды, проверять наличие печатей и подписей. Ко-пилот Auto IDP позволяет автоматически создать большую часть шаблона распознавания даже сложного документа без необходимости ручной разметки данных, что существенно сокращает трудозатраты по организации процесса распознавания. В платформу уже заложены шаблоны для различных видов документов, что делает наше решение еще более привлекательным для бизнеса.

-Константин Артемьев, основатель и генеральный директор SherpaRPA.

 

При ручном занесении первичных данных у бухгалтеров возникли следующие проблемы:

Времязатратность: ручное распознавание текста на сканах документов требовало значительных временных затрат, особенно при обработке большого объема документов.

Ошибки и неточности: при ручной обработке существует риск допущения ошибок и неточностей, таких как неправильное прочтение символов, опечатки или упущения.

Низкая производительность: в процессе ручного распознавания текста с использованием сканера скорость работы ограничена человеческими возможностями, что может существенно снижало производительность.

Монотонность: ручное распознавание текста приводило к снижению концентрации сотрудников и ошибкам.

Нагрузка в пиковые периоды: ручное распознавание больших объемов документов стало проблемой в пиковые периоды.

Перейдем к решению проблем клиента.

Входные данные представляют собой набор PDF-файлов документов, включающих отсканированные копии счетов от различных поставщиков. Каждый документ содержит таблицы с информацией о товарах или услугах, ценах, количестве и общей сумме. Формат текста и структура таблицы может варьироваться от документа к документу, включая различные шрифты и стили. Некоторые документы могут содержать изображения логотипов компаний, подписи и печати.

Для решения данной задачи мы выстроили схему процесса:

  • на вход робот получает PDF сканы документов
  • затем с помощью заранее настроенных шаблонов выполняет распознавание и извлечение данных
  • если все поля и таблицы были извлечены успешно, задача отправляется в очередь роботу и далее на последующее занесение в 1С
  • в случае отсутствия части информации происходит отправка в очередь задач на верификацию сотрудником
  • после успешной верификации задачи помещается в очередь роботу для дальнейшего заполнения полей в 1С

Для корректного извлечения таблиц и необходимых атрибутов необходима настройка шаблонизатора. Основные действия при настройке шаблонизатора:

1. Настройка якорей. Якоря — точки на сканированном документе, с помощью которых робот определяет, в какой части документа размещаются определенные данные. При помощи якорей задаются границы определенных атрибутов.

2. Настройка атрибутов. Атрибуты позволяют определить и обозначить области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты».

3. Таблицы. Таблицы чаще всего распознаются автоматически, в настройках есть возможность указать какое именно количество столбцов должно быть в таблице.

Результат распознавания шаблонизатором:

После настройки извлечения данных из документов мы отладили отображение информации в станции верификации. Данный компонент настраивается в Оркестраторе и в данном случае должен работать так, что, если какая-то часть информации не была распознана – согласно настроенным действиям документ попадает на ручной разбор. Управление маршрутами документов выполняется с помощью специальных тегов. 

Для удобного отображения и редактирования информации существует возможность настройки формы внутри действий, которая позволяет добавить различные типы данных и кнопки.

Мы использовали типы данных «текст», «таблица» и «PDF файл». Кнопка «Удалить» – очищает форму и убирает задачу в статус «Заброшена». Кнопка «Сохранить» – сохраняет внесенные изменения и отправляет задачу роботу на обработку.

Верификация данных на базе Оркестратора позволяет любому сотруднику, используя браузер, скорректировать распознанные документы. Также при необходимости можно добавить дополнительные поля и функциональные кнопки. 

На выходе получаем верифицированные текстовые данные и таблицы, которые могут быть использованы в других системах или процессах с высокой степенью достоверности, например, занесены в 1С. 

Как мы рассказывали в недавней статье  – один из удобных и быстрых способов взаимодействия с 1С — это метод запросов, который мы применили и в данной задаче.

Наличие встроенных шаблонов для распознавания текста (паспорт, ТОРГ-12, УПД, различные акты, счета и СНИЛС) ускоряет процесс настройки распознавания типовых документов, а удобная интеграция запросов в 1С позволяет разрабатывать не просто роботов, работающих с интерфейсом, а создавать полностью автономные и стабильные решения, работающие в фоновом режиме. Изначально верификацией сканов документов счетов в аутсорсинговой бухгалтерской организации занималось несколько человек, это занимало порядка 4 часов в день у каждого сотрудника. После внедрения робота внимание сотрудников требуется для нетиповых документов в случае отсутствия части информации.

Роботизация бизнес-процесса распознавания документов играет ключевую роль в повышении эффективности и конкурентоспособности компаний. Использование современных технологий, таких как системы оптического распознавания символов (OCR) и автоматизированные алгоритмы обработки изображений, позволяет значительно сократить временные затраты, минимизировать ошибки и улучшить качество обработки документов. Это открывает новые возможности для более эффективного использования ресурсов, повышения уровня сервиса для клиентов и обеспечения стабильного роста бизнеса в условиях быстро меняющейся экономической среды. Роботизация распознавания документов становится неотъемлемой частью стратегии цифровой трансформации и позволяет компаниям оставаться на передовой в условиях современного бизнеса. 

 

Получите бесплатную консультацию экспертов команды NFP

 

Автор статьи: Сергей Григорьев, разработчик отдела внедрения BI и RPA

  • Продукты
  • Услуги
  • Школа NFP
  • О компании
  • Карьера
Оставить заявку на консультацию
Услуги
Школа NFP
Прошедшие и предстоящие события школы
Вебинары офиса NFP в мае
Вебинары офиса NFP в мае
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
27.04.2024
Вебинары офиса NFP в апреле
Вебинары офиса NFP в апреле
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
04.04.2024
Вебинары офиса NFP в январе
Вебинары офиса NFP в январе
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
10.01.2024
Вебинары офиса NFP в декабре
Вебинары офиса NFP в декабре
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
08.12.2023
Вебинары офиса NFP в октябре
Вебинары офиса NFP в октябре
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
09.10.2023
Вебинары офиса NFP в августе
Вебинары офиса NFP в августе
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
01.08.2023
Вебинары офиса NFP в июле
Вебинары офиса NFP в июле
Прокачайте свои навыки на полезных вебинарах с топовыми экспертами Школы NFP.
04.07.2023
Вебинары офиса NFP в июне
Вебинары офиса NFP в июне
Прокачайте свои навыки на полезных вебинарах Школы NFP
26.05.2023