Публично анонсирован новый искусственный интеллект компьютерного зрения от компании UiPath

  • Дата публикации: 25.02.2019

Перевод статьи «The New UiPath AI Computer Vision Is Now in Public Preview», рассказывающей о новом революционном инструменте компьютерного зрения UiPath AI, основанного на глубоком обучении.

Надежная автоматизация виртуальных рабочих столов (Vdi), таких, как Citrix, VMware, VNC и Windows Remote Desktop, всегда была крепким орешком для взлома в роботизированной автоматизации процессов. Сотни тысяч предприятий во всем мире используют Vdi и виртуализация на предприятиях растет с каждым днем.

Поиск простых решений для сложных проблем — это, безусловно, непростая задача. Как говорится:«Кто умеет ждать — дождётся большего», поэтому компания UiPath так рада объявить публичный анонс того, что можно назвать настоящим прорывом для индустрии RPA: новый инструмент компьютерного зрения UiPath AI, основанный на глубоком обучении.

Проблема автоматизации VDI

Специфической проблемой при попытке автоматизировать VDI является традиционная зависимость RPA от селекторов. Эти селекторы работают с базовыми свойствами элементов пользовательского интерфейса и отлично подходят для идентификации элементов приложения (например, кнопок, текстовых полей и т. д.) при автоматизации собственных декстопных систем. Однако этот метод терпит поражение при попытке автоматизировать одно и то же программное обеспечение для VDI.

Причина разбивки заключается в том, что VDI передаёт изображение удаленного рабочего стола аналогично тому, как это делают службы потоковой передачи видео. Там просто нет селекторов, чтобы идентифицировать видео.

Были попытки решить эту проблему с использованием оптического распознавания символов (OCR) и сопоставления изображений, но они привели к проблемам надежности и обслуживания, поскольку даже незначительные изменения в пользовательском интерфейсе нарушают автоматизацию.

До сих пор на рынке не было решения, позволяющего эффективно автоматизировать среду VDI.

Бесшовная автоматизация в декстопных и VDI средах

UiPath решает проблемы, рассмотренные выше, с помощью алгоритма компьютерного зрения AI, который позволяет распознавать пользовательские интерфейсы, используя сочетание AI, OCR, нечеткого сопоставления текста и систем защиты, чтобы связать все это вместе.

Это позволяет роботам “видеть” экран и визуально идентифицировать все элементы, а не полагаться на их скрытые свойства, идентификаторы и другие метаданные.

На самом деле, этот новый искусственный интеллект компьютерного зрения не ограничивается только средой VDI. Он также может распознавать элементы в тех случаях, когда традиционные методы автоматизации пользовательского интерфейса, включая SAP, Flash, Silverlight, PDF-файлы и даже изображения, испытывают проблемы.

В отличии от автоматизации при работе с изображениями, компьютерное зрение ИИ UiPath не полагается на соответствие изображения. В результате оно стабильно и очень устойчиво к изменениям интерфейса, включая цвет, шрифт, размер и разрешение. ИИ компьютерного зрения сразу обрабатывает все эти изменения и находит для них предполагаемую цель.

Смотрите демонстрацию нового компьютерного зрения AI в действии:

Искусственный интеллект в компьютерном зрении — путь вперед

Вся эта технология ещё находится в зачаточном состоянии, но компания уже строит большие планы на её развитие. В течение года для текущей версии добавятся ещё несколько улучшений юзабилити, с поддержкой записи полной автоматизации, с использованием ИИ компьютерного зрения, а затем, во второй версии будет привнесён совершенно новый уровень возможностей и надежности.

Оригинал статьи читайте на сайте uipath.com

Наверх