2021 год медленно подходит к концу. Это был большой год для платформ IDP. Они завоевали большую популярность и проникли во многие операционные группы, попутно повысив их эффективность и сократив расходы. Признание этого сегмента аналитиками расширилось в 2021 году, когда Gartner, ISG, Quadrant и многие другие аналитики присоединились к Everest и Zinnov, чтобы охватить это пространство. В то время как 2020 год был годом первых пользователей, в 2021 году гораздо больше клиентов начали замечать возможности, которые предоставляет эта технология, и активно запускали пилотные проекты для более широкого внедрения на предприятиях.

В течение последних нескольких лет клиенты с осторожностью переходили на IDP, скептически относясь к повышению эффективности, которое может быть достигнуто с помощью этой технологии. Теперь, когда многие из них увидели, что возможно, они задают вопросы о том, что еще можно сделать, а также раздвигают границы возможного. В этом году сквозная обработка упоминалась во многих разговорах с нашими клиентами. Клиенты начали спрашивать, что потребуется, чтобы решения IDP могли обрабатывать документы полностью независимо от вмешательства человека.
В чем проблема бесконтактного взаимодействия?

Бесконтактная обработка — это святой Грааль IDP и ИИ в целом. Чем больше ИИ может полагаться на себя, а не на внешние данные, тем более масштабируемым он становится. Мы подробно рассказывали о кейсе по обработке ипотечного кредита с минимальным вмешательством в одном из наших прошлых постов. Смотрите, алгоритмы не спят и не нуждаются в отдыхе. Они могут обрабатывать данные 24 часа в сутки. Большим препятствием, с которым им нужно справиться, является вмешательство человека, в котором они нуждаются, когда они не уверены в том, что они прочитали. Если есть способ обойти это вмешательство, эффективность резко возрастет.

Нелегкий путь

Настало время короткой загадки. Вам понадобится ваша вероятность и математические навыки, чтобы решить эту. Готовый? Итак, допустим, есть документ, из которого нужно извлечь 5 полей. Ваши высокоточные алгоритмы могут извлечь каждое из этих 5 полей с точностью 90%. Если какое-либо из этих полей неверно, то кто-то должен вручную просмотреть документ, чтобы увидеть, каким должно быть реальное значение. Назовем это число точностью на уровне документа. Вопрос в том, если каждое из ваших 5 полей извлекается с точностью 90%, какой точности на уровне документа вы можете достичь?

Если вы сказали 90%, вы ошибаетесь и не одиноки.

Большинство людей совершают эту ошибку. Легко предположить, что если вы получаете точность 90% во всех полях, ваша общая точность должна быть 90%. Но это так не работает. Когда вы получаете точность 90%, ваши алгоритмы ошибаются в 10% случаев. Если бы у вас было извлечено 5 полей, каждое из 5 полей было бы неправильным в 10% случаев каждое. Даже если 4 из этих 5 полей верны и только одно неверно, точность на уровне вашего документа равна нулю.

Итак, если у вас есть 5 полей, извлеченных с ошибкой 10%, ваша максимальная ошибка составляет 5 раз по 10% = 50%. Если у вас есть 10 полей, извлеченных с точностью 90 %, ваша общая точность на уровне документа может составить 0 %.

Чтобы системы IDP могли производить сквозную обработку, они должны быть правильными для всех полей все время. Этого математически и технически очень трудно достичь. Вот почему эта проблема до сих пор не решена в такой степени.

2022 год выглядит очень многообещающе

Есть три ключевых фактора, которые кажутся многообещающими для значительного прогресса в автоматизированной обработке документов в новом году. Все эти шахматные фигуры выстроены для начала финальной игры:

1. Проверенные возможности

За годы, предшествовавшие 2022 году, платформы IDP продемонстрировали, на что они способны, и удивили многих клиентов и отраслевых экспертов. Особенно для клиентов, которые пробовали OCR-решения в прошлом и не увидели результатов, на которые надеялись, последние пару лет дали многообещающие результаты в плане эффективности и сокращения затрат. Наконец-то дан ответ на вопрос об этой технологии удержания воды. Это придало смелости как клиентам, так и игрокам IDP, чтобы они стремились к более высоким целям.

2. Развитие машинного обучения

Это также был год, когда были достигнуты огромные успехи в области машинного обучения. Возможности алгоритмов по просмотру, чтению и пониманию данных достигли новых пределов. Алгоритмы ИИ начали писать стихи и статьи в этом году. Кажется, это королева всех шахматных фигур. Многое из того, что выглядело как сцена из научно-фантастического фильма, в этом году воплотилось в реальной жизни. Все эти достижения сделали бесконтактную обработку более доступной для платформ IDP.

3. Стимулы

Инновационные клиенты начали стимулировать сделки IDP на основе результатов, вознаграждая более высокий риск автоматизации более высоким вознаграждением. Это работает в обе стороны — клиенты экономят на своих операционных расходах и передают часть этих расходов поставщикам IDP. В результате команды разработчиков продукта прилагают больше усилий, чем когда-либо, чтобы первыми внедрить бесконтактную обработку документов.

В целом 2022 год кажется многообещающим для бесконтактной обработки документов. Наши исследовательские и инженерные команды очень рады тому, что они предложат нашим клиентам в новом году. Мы надеемся установить еще более высокие стандарты бесконтактной обработки и точности.

Первоначально опубликовано на https://www.infrrd.ai.