24 мая 2023

Как нейросети упрощают бизнесу работу с документами

Нейросети и технологии машинного обучения сегодня на пике спроса и популярности. Используются они для распознавания текстов и объединены общим названием — Optical Character Recognition (OCR). Как они работают, какие документы умеют распознавать и почему этот процесс стоит доверить именно нейросетям? 

Распознать все (но не сразу)

Нейросеть может распознать практически любой текст. Но лучше всего технология работает с печатными текстами высокого разрешения — от 300 dpi. При этом документ должен быть ровно сфотографирован или отсканирован, в нем не должно быть засветов, помятостей, пропусков и других искажений.

На проектах по распознаванию наша команда часто сталкивается с запросами заказчиков на оцифровку рукописных текстов. Они по-прежнему встречаются в банковском секторе (различные анкеты, опросники и так далее), страховой сфере, образовании (бланки ЕГЭ). С ними нейросети пока справляются не так легко. Технология совершенствуется на протяжении последних 5–6 лет, но все еще нет настолько хорошо обученных нейронных сетей, распознающих рукописный текст со 100%‑ной точностью. Кроме того, он бывает разным, что тоже добавляет сложностей.

Например, почерк инженера-конструктора, который вручную заполняет чертежи, система распознает довольно легко, так как он приближен к печатному тексту, содержит одинаковые межбуквенные интервалы, а все буквы похожи на один и тот же шрифт. А вот почерк обычного человека нейросетям распознать иногда сложно, так как он содержит большое количество соединений между буквами и распознать нейросетью их трудно. Как и знаменитый «нечитаемый» почерк врачей. Поэтому, если человек не может визуально распознать, что написано, то нейросеть с этой задачей тоже не справится.

Мы как-то решили протестировать одно из решений по распознаванию текстов и отсканировали написанную мной страницу, а пишу я не самым разборчивым почерком. Итог — система «сломалась», миссия оказалась для нее невыполнимой.

Зачем доверять распознавание нейросетям

Они это делают быстрее, не допускают ошибок и самое главное — сокращают трудозатраты на обработку документов. Например, если бухгалтер вручную вносит данные из первичной бухгалтерской документации, то делает это в разы медленнее решения на базе искусственного интеллекта и рискует допустить ошибки.

Платформы по распознаванию на основе нейросетей могут обрабатывать до сотен тысяч документов в сутки. Объемы зависят от мощности вычислительных ресурсов.

Для максимального ускорения процесса и миграции данных используются не только нативные интеграции, но и программные роботы. Они помогают в автоматическом режиме переносить данные из системы распознавания в учетную систему компании или электронный архив.

Кроме того, роботы могут проверять документы на подлинность. Сначала нейросеть распознает в договоре карточку контрагента, а затем робот сверяет данные с различными ресурсами или другими документами.

Что умеют нейросети 

Помимо простого распознавания для дальнейшего переноса данных в другие системы, нейросети способны:

  • распознавать наличие артефактов (штампы, печати) для понимания юридической силы документа;
  • искать сущности и сверять их актуальность;
  • определять комплектность документа по атрибутам. Система помогает проверить юридическую силу всего комплекта и его целостность, определяет тип документов, ищет экземпляры, которые требуют ручной обработки, а также выполняет кросс-проверку.

Кроме того, решения на основе нейросетей могут извлекать метаданные и сущности из документа и сверять их со справочниками.

Как это работает

Первый шаг — ввод документов. Это может быть выгрузка электронных версий из «горячей» папки в систему или бумажных экземпляров в сканер. Именно на этом этапе можно проверять полноту комплекта. Если какого-то документа не хватает, система сама попросит его догрузить.

Второй шаг — обработка документов. Нейросеть извлекает данные, проверяет наличие необходимых атрибутов, корректности расчётов и т. д. Третий шаг — верификация данных. На этом этапе проверяется корректность всей информации. Если нейросеть не распознала полностью документ, она отправляет данные человеку на ручную корректировку.

Четвертый шаг — экспорт документов. Например, в систему учета или архив.

Кейсы из практики

У заказчика в общий центр обслуживания поступало порядка 100 тысяч документов в месяц. Для обработки использовалась система распознавания всего потока документов, процесс выполнялся непосредственно на сервере, не контролировался пользователями и отсутствовал этап верификации. Для переноса документов в архив было необходимо проверять, как заполнились их карточки. Ключевыми пользователями системы были сотрудники склада, бухгалтерия, HR, администрация и отдельные группы менеджеров.

После внедрения нового решения процесс удалось выстроить иначе. Теперь 95% документов попадают в архив без распознавания, так как сначала система считывает штрих-код и QR-код пакетов документов. Далее распознавание происходит по заранее подготовленным шаблонам. На верификацию отправляются те документы, которые требуют внимания специалиста.

Время обработки документов сократилось с пяти минут до одной минуты на один документ. Если раньше надо было открыть карточку, документы и сверить с нераспознанными, то сейчас это делается автоматически. Также были оптимизированы расходы.

В одном из вузов требовалось внедрить систему распознавания для анализа наличия подписей и печатей в документах. Ранее учебное заведение использовало решение, которое просто регистрировало документацию и выгружало в архив без проверки. Из-за этого часть документов архивировалась без нужных атрибутов, что в дальнейшем приводило к спорным ситуациям с контрагентами и долгим поискам необходимого бланка.

В ходе проекта была создана нейронная сеть для анализа наличия подписей и печатей в документах. Также проверку прошел весь ранее сформированный архив. Точность распознавания составляет сейчас порядка 96%.

Кроме того, для работы с документами используются программные роботы. Трудозатраты сотрудников университета сократились в 5 раз, а риск возникновения каких-либо споров с контрагентами сведен к минимуму.

***

Несмотря на то, что сейчас все компании стараются уходить от бумажного документооборота, системы для распознавания по-прежнему актуальны и нужны. Нейросети помогают бизнесу ускорять рабочие процессы, обрабатывать и проверять документы. А так как системы постоянно совершенствуются, то в перспективе нас ждет повышение процента постоянной точности распознавания, в том числе рукописных текстов.

Автор: Владислав Чернецкий, менеджер по развитию бизнеса ИТ-решений компании Konica Minolta Business Solutions Russia
Источник: Инвест-Форсайт

iTrend: освоить маркировку интернет-рекламы можно только на собственном опыте

25 марта 2024

В феврале 2024 года в Москве прошла Конференция «Digital-коммуникации России». Организатор мероприятия – Ассоциация директоров по коммуникациям и корпоративным медиа России (АКМР). Эксперты конференции обсудили острые вопросы рынка digital, в том числе маркировку интернет-рекламы. Об опыте коммуникационного агентства в рамках перехода на работу по новым правилам рассказала Екатерина Саранцева, директор по развитию iTrend.

 

Медиалогия: iTrend – в ТОП-4 коммуникационных агентств по медиаиндексу за январь 2024 года

20 марта 2024

Коммуникационное агентство iTrend вошло в пятерку агентств, получивших наиболее высокий медиаиндекс по данным рейтинга «Медиалогии» за январь 2024 года. Компания заняла четвёртую строчку ранкинга, набрав 433,2 пункта МИ. Медиаактивность участников рынка оценивалась на основе анализа базы российских СМИ, включающей в себя более 88 тыс. источников — ТВ, радио, газеты, журналы, информационные агентства и Интернет-СМИ.

 

iTrend: интерес деловых СМИ к ИТ вырос в 6 раз за последние пять лет

20 марта 2024

Эксперты коммуникационного агентства iTrend провели исследование, в рамках которого проанализировали, как менялся медиаландшафт в ИТ-индустрии в последние пять лет. В компании сравнили количество упоминаний крупнейших российских разработчиков и системных интеграторов в деловых СМИ и пришли к выводу, что об ИТ-компаниях стали писать в 6 раз чаще.

 

Как строить личный бренд в 2024 году? Запись вебинара iTrend и РБК Компании

12 марта 2024

27 февраля 2024 года коммуникационное агентство iTrend и сервис РБК Компании провели вебинар «Новая искренность 2.0. Почему личный бренд — это тренд 2024?».

 

Проект «Облакотеки» и iTrend номинирован на премию «ЦОДы.РФ» в номинации «Креатив года»

12 марта 2024

Telegram-канал КучевыеАйТи, проект разработчика облачных сервисов «Облакотека» и коммуникационного агентства iTrend, номинирован на национальную премию «ЦОДы.РФ».

 
Все новости iTrend