«Ростелеком» протестировал новый сервис по оцифровке документов на основе искусственного интеллекта

По итогам пилотного проекта система распознала и автоматически проанализировала 72% от пилотного объема документов сегмента B2B компании. Планируется, что при полноценном внедрении решения эти показатели превысят 80%. С помощью платформы были оцифрованы слабоструктурированные документы ОЦО «Ростелекома», а все данные из них автоматически перенесены в информационную систему компании. Нейросеть также проверила актуальность договоров, определила наличие необходимых подписей, печатей, дат и реквизитов. Таким образом, была частично реализована функция по автоматической проверке юридической значимости документов. Эту аналитическую работу обычно выполняют сотрудники компании. Информация и персональные данные при оцифровке были зашифрованы и защищены механизмом деперсонализации: перед обработкой документы разрезались на отдельные фрагменты, по которым невозможно установить их принадлежность. Скорость распознавания одного документа составила около 20 секунд. Благодаря двухэтапному распознаванию платформа с высокой точностью обработала также данные в договорах, заполненных от руки. Рукописный текст, который современные ИИ-системы распознают с низким порогом уверенности, уходил на вторичную верификацию операторам ввода данных, удаленно подключенным к облачному сервису. Люди сверяли фрагменты распознанного текста и вносили правки в случае ошибок. В результате общее качество распознавания документов составляет почти 100%. Сервис автоматического распознавания, оцифровки и анализа документов с применением технологий искусственного интеллекта разработала компания «Биорг», резидент ИТ-кластера фонда «Сколково». Всего на платформе обрабатывается около 5 млн полей с персональными данными в месяц. «При масштабировании проекта компания сможет снизить операционные затраты на 56% за счет автоматизации распознавания и ввода атрибутов, необходимых для регистрации документа в системе. Отечественное решение компании “Биорг” полностью соответствует требованиям безопасности ФСТЭК и ФСБ к обработке персональных данных. В дальнейшем мы планируем дополнительно защитить обрабатываемую информацию. Так, верификаторами слабораспознанных рукописных данных будут выступать наши же сотрудники, а сама система будет развернута в нашем корпоративном облаке», — сказал директор департамента филиала ОЦО «Ростелекома» Павел Шмидт. «В идеале система на основе платформы Beorg Smart Vision оставит за человеком только финальное решение о приемке документов. С рутинной и объемной работой нейросети справляются гораздо лучше людей, которых долгий монотонный труд приводит к выгоранию, изнуряет. Эффективность и окупаемость решения целесообразно оценивать на масштабных потоках документов, поскольку искусственный интеллект наилучшим образом подходит для обработки и анализа больших данных. Это может быть несколько миллионов документов в год», — сказал директор по развитию компании «Биорг» Александр Коробов. В настоящее время «Ростелеком» проводит конкурс на полномасштабное внедрение технологии, по итогам которого решение будет масштабировано на все документоемкие процессы компании. Срок внедрения полноценной системы распознавания и анализа может составить около полугода.

«Ростелеком» протестировал новый сервис по оцифровке документов на основе искусственного интеллекта
© Курская правда