г. Москва, ул. Малая Пироговская, д. 16

Как мы, OCR и роботы освободили бухгалтеров от рутины

  • Дата публикации: 28.04.2024

Рассказываем об опыте роботизации процессов в бухгалтерии с помощью RPA и OCR
Распознавание и верификация документов Sherpa OCR

В современном мире роботизация бизнес-процессов становится ключевым элементом стратегии многих компаний, стремящихся повысить эффективность работы и сделать быстрее и больше, не потеряв в качестве. Использование инновационных технологий, таких как Sherpa OCR, позволяет автоматизировать процесс обработки документов, улучшая точность и скорость выполнения задач. Совмещение роботизации и OCR-технологий открывает новые возможности для оптимизации бизнес-процессов, сокращения издержек и увеличения производительности.

Как завести первичную документацию быстро и без ошибок 

Для комплексного решения проблемы верификации и разнесения первичной документации для бухгалтерии на одном из наших проектов в качестве решения была рассмотрена платформа SheRPA c компонентами шаблонизации, распознавания и станцией верификации. Sherpa входит в топ 3 отечественных решений, при этом OCR составляющая не имеет аналогов.

Sherpa RPA объединяет в себе функционал программных роботов, интеллектуального распознавания документов (IDP), а также инструменты ИИ, работающих как в открытом, так и закрытом контуре. Встроенный шаблонизатор позволяет распознавать и верифицировать структурированные и неструктурированные документы даже плохого качества, распознавать рукописный текст, штрих-коды, QR коды, проверять наличие печатей и подписей. Ко-пилот Auto IDP позволяет автоматически создать большую часть шаблона распознавания даже сложного документа без необходимости ручной разметки данных, что существенно сокращает трудозатраты по организации процесса распознавания. В платформу уже заложены шаблоны для различных видов документов, что делает наше решение еще более привлекательным для бизнеса.

-Константин Артемьев, основатель и генеральный директор SherpaRPA.

При ручном занесении первичных данных у бухгалтеров возникли следующие проблемы:

Времязатратность: ручное распознавание текста на сканах документов требовало значительных временных затрат, особенно при обработке большого объема документов.

Ошибки и неточности: при ручной обработке существует риск допущения ошибок и неточностей, таких как неправильное прочтение символов, опечатки или упущения.

Низкая производительность: в процессе ручного распознавания текста с использованием сканера скорость работы ограничена человеческими возможностями, что может существенно снижало производительность.

Монотонность: ручное распознавание текста приводило к снижению концентрации сотрудников и ошибкам.

Нагрузка в пиковые периоды: ручное распознавание больших объемов документов стало проблемой в пиковые периоды.

Перейдем к решению проблем клиента.

Входные данные представляют собой набор PDF-файлов документов, включающих отсканированные копии счетов от различных поставщиков. Каждый документ содержит таблицы с информацией о товарах или услугах, ценах, количестве и общей сумме. Формат текста и структура таблицы может варьироваться от документа к документу, включая различные шрифты и стили. Некоторые документы могут содержать изображения логотипов компаний, подписи и печати.

Для решения данной задачи мы выстроили схему процесса:

  • на вход робот получает PDF сканы документов
  • затем с помощью заранее настроенных шаблонов выполняет распознавание и извлечение данных
  • если все поля и таблицы были извлечены успешно, задача отправляется в очередь роботу и далее на последующее занесение в 1С
  • в случае отсутствия части информации происходит отправка в очередь задач на верификацию сотрудником
  • после успешной верификации задачи помещается в очередь роботу для дальнейшего заполнения полей в 1С

Для корректного извлечения таблиц и необходимых атрибутов необходима настройка шаблонизатора. Основные действия при настройке шаблонизатора:

1. Настройка якорей. Якоря — точки на сканированном документе, с помощью которых робот определяет, в какой части документа размещаются определенные данные. При помощи якорей задаются границы определенных атрибутов.

2. Настройка атрибутов. Атрибуты позволяют определить и обозначить области документа, данные из которых будут распознаваться роботом и импортироваться в таблицу «Результаты».

3. Таблицы. Таблицы чаще всего распознаются автоматически, в настройках есть возможность указать какое именно количество столбцов должно быть в таблице.

Результат распознавания шаблонизатором:

После настройки извлечения данных из документов мы отладили отображение информации в станции верификации. Данный компонент настраивается в Оркестраторе и в данном случае должен работать так, что, если какая-то часть информации не была распознана – согласно настроенным действиям документ попадает на ручной разбор. Управление маршрутами документов выполняется с помощью специальных тегов.

Для удобного отображения и редактирования информации существует возможность настройки формы внутри действий, которая позволяет добавить различные типы данных и кнопки.

Мы использовали типы данных «текст», «таблица» и «PDF файл». Кнопка «Удалить» – очищает форму и убирает задачу в статус «Заброшена». Кнопка «Сохранить» – сохраняет внесенные изменения и отправляет задачу роботу на обработку.

Верификация данных на базе Оркестратора позволяет любому сотруднику, используя браузер, скорректировать распознанные документы. Также при необходимости можно добавить дополнительные поля и функциональные кнопки.

На выходе получаем верифицированные текстовые данные и таблицы, которые могут быть использованы в других системах или процессах с высокой степенью достоверности, например, занесены в 1С.

Как мы рассказывали в недавней статье  – один из удобных и быстрых способов взаимодействия с 1С — это метод запросов, который мы применили и в данной задаче.

Наличие встроенных шаблонов для распознавания текста (паспорт, ТОРГ-12, УПД, различные акты, счета и СНИЛС) ускоряет процесс настройки распознавания типовых документов, а удобная интеграция запросов в 1С позволяет разрабатывать не просто роботов, работающих с интерфейсом, а создавать полностью автономные и стабильные решения, работающие в фоновом режиме. Изначально верификацией сканов документов счетов в аутсорсинговой бухгалтерской организации занималось несколько человек, это занимало порядка 4 часов в день у каждого сотрудника. После внедрения робота внимание сотрудников требуется для нетиповых документов в случае отсутствия части информации.

Роботизация бизнес-процесса распознавания документов играет ключевую роль в повышении эффективности и конкурентоспособности компаний. Использование современных технологий, таких как системы оптического распознавания символов (OCR) и автоматизированные алгоритмы обработки изображений, позволяет значительно сократить временные затраты, минимизировать ошибки и улучшить качество обработки документов. Это открывает новые возможности для более эффективного использования ресурсов, повышения уровня сервиса для клиентов и обеспечения стабильного роста бизнеса в условиях быстро меняющейся экономической среды. Роботизация распознавания документов становится неотъемлемой частью стратегии цифровой трансформации и позволяет компаниям оставаться на передовой в условиях современного бизнеса.

Автор статьи: Сергей Григорьев, разработчик отдела внедрения BI и RPA

Получите бесплатную консультацию экспертов команды NFP

FAQ: Часто задаваемые вопросы

Какие проблемы решает автоматизация распознавания документов в бухгалтерии?

Автоматизация решает проблемы временных затрат на ручное распознавание, снижает количество ошибок при обработке документов, повышает производительность работы бухгалтерии, устраняет монотонность рутинных операций и позволяет эффективно справляться с пиковыми нагрузками при большом объеме документов.

Что такое Sherpa RPA и какие возможности он предоставляет?

Sherpa RPA - это платформа, объединяющая функционал программных роботов, интеллектуального распознавания документов и инструменты искусственного интеллекта. Она позволяет распознавать структурированные и неструктурированные документы, включая документы плохого качества, рукописный текст, штрих-коды и проверять наличие печатей и подписей.

Как работает процесс автоматического распознавания документов?

Процесс начинается с получения PDF-сканов документов, затем с помощью настроенных шаблонов выполняется распознавание и извлечение данных. При успешном распознании данные отправляются в 1С, при ошибках - на верификацию сотрудником с последующей автоматической обработкой.

Что такое якоря и атрибуты в настройке шаблонизатора?

Якоря - это точки на документе, которые помогают роботу определить расположение данных. Атрибуты обозначают области документа для распознавания конкретной информации. Таблицы обычно распознаются автоматически с возможностью настройки количества столбцов.

Как работает станция верификации документов?

Станция верификации позволяет сотрудникам через браузер корректировать неправильно распознанные документы. Она включает формы с различными типами данных и функциональными кнопками для сохранения изменений или удаления задачи при необходимости.

Какие преимущества дает интеграция OCR с системой 1С?

Интеграция через метод запросов позволяет создавать полностью автономные решения, работающие в фоновом режиме. Это обеспечивает стабильность обработки документов и исключает необходимость работы с интерфейсом 1С, значительно ускоряя процесс внесения данных.

Где заказать внедрение роботизации распознавания документов для бухгалтерии?

Офис NFP компании Первый Бит предлагает комплексные услуги по внедрению роботизации процессов распознавания документов с использованием платформы Sherpa RPA. Наши специалисты помогут настроить шаблоны распознавания, организовать процесс верификации и обеспечить интеграцию с вашей системой 1С.

Как получить консультацию по автоматизации бухгалтерских процессов с помощью OCR?

Для получения консультации по автоматизации распознавания бухгалтерских документов с использованием технологий OCR и RPA обратитесь в офис NFP компании Первый Бит. Мы проведем анализ ваших бизнес-процессов, предложим оптимальное решение и поможем внедрить систему, которая сократит временные затраты и повысит точность обработки документов.

FAQ: Часто задаваемые вопросы

Какие проблемы бухгалтерии решает автоматизация распознавания документов?

Автоматизация устраняет рутинные задачи ручного ввода данных, сокращает время обработки документов до 80%, минимизирует человеческие ошибки и позволяет бухгалтерам сосредоточиться на аналитических задачах. Это особенно важно в периоды отчетности и при больших объемах первичной документации.

Как начать автоматизацию распознавания бухгалтерских документов?

Для начала автоматизации необходимо проанализировать текущие процессы обработки документов, определить наиболее трудоемкие операции и выбрать подходящее решение. Платформа Sherpa RPA предлагает готовые шаблоны для распознавания счетов-фактур, актов и других типовых документов, что ускоряет запуск проекта.

Какие документы можно автоматизировать для распознавания в первую очередь?

В первую очередь рекомендуется автоматизировать обработку счетов-фактур, товарных накладных ТОРГ-12, актов выполненных работ, счетов на оплату и УПД. Эти документы имеют стандартизированную структуру и составляют основную часть документооборота бухгалтерии.

Как оценить экономический эффект от автоматизации распознавания документов?

Эффект оценивается через сокращение времени обработки документов, уменьшение количества ошибок, высвобождение персонала для более важных задач и ускорение закрытия отчетных периодов. Типичный ROI проекта составляет 6-12 месяцев за счет повышения производительности бухгалтерии на 40-60%.

Какие преимущества дает интеграция системы распознавания с 1С?

Интеграция позволяет автоматически переносить распознанные данные прямо в базу 1С, исключая двойной ввод информации. Это обеспечивает целостность данных, сокращает время на обработку документов и минимизирует риски расхождений в учете.

Сколько времени занимает внедрение системы автоматического распознавания?

Типовой проект внедрения занимает от 4 до 8 недель, включая настройку шаблонов распознавания, интеграцию с 1С и обучение сотрудников. Использование готовых шаблонов для стандартных документов значительно ускоряет процесс запуска системы.

Где заказать внедрение автоматизации распознавания документов для бухгалтерии?

Офис NFP компании Первый Бит предлагает комплексное внедрение систем автоматического распознавания документов для бухгалтерии. Мы помогаем выбрать оптимальное решение, настроить процессы под ваши бизнес-требования и обеспечить seamless-интеграцию с существующей системой 1С для максимальной эффективности.

Как получить расчет экономии от автоматизации документооборота для нашей компании?

Для получения индивидуального расчета экономического эффекта от автоматизации распознавания документов обратитесь в офис NFP компании Первый Бит. Наши эксперты проведут аудит текущих процессов, проанализируют объемы документооборота и подготовят детальный бизнес-кейс с расчетом ROI и сроками окупаемости проекта.

Курсы и вебинары офиса NFP

Обзор прикладного решения 1С:УХ 8

Обзор прикладного решения 1С:УХ 8

Курс ориентирован в первую очередь на представителей бизнеса, которые хотят получить представление о том, как продукт «1С:Управление холдингом» может помочь в решении задач бизнеса.

Подробнее
08 Декабрь 2025
Бюджетирование в 1С:УХ 8

Бюджетирование в 1С:УХ 8

Цели и задачи: дать слушателям системное представление о возможностях «1С:Управление холдингом» в части функционала, обеспечивающего формирование планов (функциональных и мастер-бюджетов), сбор факта, план-фактный и факторный анализ.

Подробнее
10 Декабрь 2025