Модуль извлечения объектов

Модуль извлечения объектов

Находит в тексте именованные сущности: как стандартные типы объектов (имена, названия организаций, даты), так и специфичные для клиента, такие как номера договоров.

Хочу такой от 1 млн ₽ в год

Функции модуля

  • выделение ключевых элементов из текста: имен, дат, сумм
  • обнаружение специфических сущностей в соответствии с бизнесом клиента
  • автозаполнение форм найденными в тексте словами нужного типа
  • оптимизация других модулей за счет дополнительных связей между документами 

Какие задачи решает

Составьте конспект

выделите основные объекты из текста, прежде чем прочитывать целиком

Выделите важное

соберите базу отправителей, их телефоны и денежные суммы из всего потока входящей почты

Найдите быстрее

система автоматически определит адреса, номера договоров и другие объекты нужного формата

Установите связи

поиск станет эффективнее, если учитывать, в каких документах встречается один и тот же номер договора или ФИО

Настройте автозаполнение

модуль выделит сущности из текста заявки и вставит их в поля нужной формы (например, из настраиваемых шаблонов модуля визуализации)

Как это работает

Мы применяем гибридный алгоритм, основанный как на глубинном обучении, так и на традиционном rule-based подходе, используя достоинства обоих методов:

  • составленные вручную лингвистические правила позволяют эффективно выделять простые сущности и не требуют данных для обучения,
  • глубинные нейросети обучаются на большом количестве данных, что делает их способными выделять в тексте сложные структуры.

Для того, чтобы мы обучили модуль распознавать пользовательские сущности, необходимо, чтобы клиент предоставил выборку с примерами таких объектов.