Named Entity Recognition.
Из документов извлекаются люди, компании, суммы, IBAN и ещё 13+ типов именованных сущностей (NER) — на базе 800+ специализированных LLM, с учётом контекста и в реальном времени.
Доверие ведущих компаний по всему миру
В одном анализе NER — люди, компании, суммы, IBAN, налоговые номера и ещё 13+ типов полей.
Включено в каждый анализ NER
Как это работает
Загрузка
Отправьте PDF, скан или изображение
Анализ ИИ
800+ LLM распознают именованные сущности
Структурированные данные
JSON с 13+ типами NER
Каждый документ анализируется правильной моделью ИИ
Отраслевые языковые модели распознают <strong>именованные сущности</strong> в контексте — «Apple» в счёте как компания, в рецепте как продукт; «Paris» в адресе как город, в имени — как человек.
Zero-Shot Распознавание
Без обучения, без шаблонов – готово к использованию немедленно
Мультипайплайн
LLM + Vision + Сопоставление шаблонов для максимального охвата
Объединение упоминаний
Один человек или компания — даже при разных написаниях в документе
Knowledge Graph
Распознанные поля формируют связанную модель знаний
Что нас отличает
NER с учётом контекста
ИИ понимает смысл в контексте — не только шаблоны, а семантика текста.
Zero-Shot Извлечение
Нет фазы обучения, нет шаблонов. Каждый документ понимается немедленно.
Объединение упоминаний
«Елена Смирнова», «Е. Смирнова» и «г-жа Смирнова» — один и тот же человек в данных.
Knowledge Graph
Связи между людьми и компаниями видны сразу — без ручной склейки записей.
Трехслойный пайплайн
LLM + Vision + сопоставление шаблонов — тройная проверка каждого поля NER.
Контекст таблиц
Значения в ячейках извлекаются вместе со строкой и столбцом — не как обрывки текста.
139 Языков
Анализируйте документы на 139 языках – от английского и французского до арабского и китайского.
API в реальном времени
Поля NER — менее чем за 100 мс на страницу, быстрее ручной проверки.
Какие именованные сущности извлекаются
От имён и компаний до сумм, IBAN и налоговых номеров — каждый тип поля в структурированном виде.
Люди
Имена, должности, роли, контакты
Организации
Компании, учреждения, отделы
Местоположения и адреса
Города, страны, уличные адреса
Даты и сроки
Даты, сроки, периоды
Суммы
Цены, итоги, валюты
IBAN и банковские данные
Номера счетов, БИК, банковские реквизиты
Адреса электронной почты
Контактные email из любого документа
Номера телефонов
Стационарные, мобильные, международные форматы
Номера счетов
Номера счетов, квитанций
Номера заказов
Номера заказов, PO номера
Налоговые номера
ИНН, налоговый номер, TIN
URL и ссылки
Веб-адреса, глубокие ссылки
Продукты
Названия товаров, SKU, услуги
Regex против Стандартного NLP против PaperOffice
Regex / Шаблон
- Фиксированные шаблоны (IBAN, email)
- Понимание контекста
- Новые типы NER без кода
- Многоязычность
- Извлечение из таблиц
- Объединение упоминаний
Стандартный NLP
- Базовые типы NER (человек, адрес)
- Понимание контекста
- Отраслевые типы
- 139 языков
- Извлечение из таблиц
- Объединение упоминаний
PaperOffice AI
- 13+ типов именованных сущностей
- Распознавание LLM с учетом контекста
- Zero-shot, без шаблонов
- 139 языков нативно
- Таблицы с контекстом строки/столбца
- Объединение упоминаний и Knowledge Graph
NER во всех отраслях
Обработка счетов
Автоматически извлекайте поставщика, суммы, IBAN, налоговые номера для автоматизации расчетов с кредиторами.
Анализ договоров
Идентифицируйте стороны, даты, обязательства и ключевые условия из юридических документов.
Медицинские записи
Извлекайте имена пациентов, диагнозы, лекарства и дозировки из клинических документов.
Соответствие требованиям и KYC
Идентифицируйте людей, компании, адреса для проверок AML/KYC и санкционного скрининга.
Логистика и цепочка поставок
Извлекайте номера отслеживания, адреса доставки, отправителей и номера заказов из транспортных документов.
Управление недвижимостью
Анализируйте договоры аренды: автоматически фиксируйте арендаторов, площади, суммы арендной платы, сроки.
HR и рекрутинг
Извлекайте кандидатов, квалификации, работодателей и ожидания по зарплате из резюме.
Страхование
Захватывайте номера полисов, суммы выплат, застрахованных лиц и даты страховых случаев из отчетов.
Интегрируйте NER за 5 минут
# Извлечение сущностей из документа
$ curl -X POST \
"https://api.paperoffice.ai/document_intelligence/entities" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@schet.pdf" \
-F "types=PERSON,ORG,MONEY,IBAN,DATE"
# Ответ: 13+ типов сущностей и confidence
# {"entities":[{"type":"ORG","value":"ООО «ТехноПром»","confidence":0.99}]} Корпоративная защита извлечённых данных
Центр обработки данных в ЕС
100% собственная инфраструктура в ЕС. Без AWS, без Azure. Соответствует GDPR.
Шифрование AES-256
Сквозное шифрование – при хранении и передаче.
Обработка на RAM-диске
Документы обрабатываются в оперативной памяти – следы на диске не остаются.
Соответствие требованиям
Сертифицировано по SOC 2, ISO 27001, HIPAA и GDPR.
Named Entity Recognition
Что такое распознавание именованных сущностей (NER)?
Какие типы именованных сущностей поддерживаются?
Как работает NER с учётом контекста?
Насколько точно работает извлечение именованных сущностей?
Что такое объединение упоминаний (entity resolution)?
Какие языки поддерживаются?
Как интегрировать API NER?
Соответствует ли обработка требованиям GDPR?
Истории успеха клиентов
Узнайте, как компании трансформировали свои процессы с PaperOffice AI.
Измеримый успех наших клиентов
"Корпоративное управление документами для всех наших горнодобывающих операций. Мирового класса."
"Этикетки для фармацевтических препаратов, регулируемые FDA, требуют безупречной документации. PaperOffice сократил процесс согласования с нескольких дней до считанных часов."
"Техническая документация и обработка заказов теперь полностью автоматизированы."
"Цифровизация произвела революцию в нашем управлении. Запросы граждан теперь обрабатываются за минуты, а не дни."
"Карты пациентов, заключения и направления регистрируются и классифицируются автоматически. У нашего персонала наконец-то появилось время для пациентов."
"8 000 сотрудников, тысячи документов гостей ежедневно. PaperOffice полностью оцифровал наши бэк-офисные процессы."
"Кредитные заявки и комплаенс-документы теперь обрабатываются за минуты, а не часы. Регуляторная проверка проходит полностью автоматически."
"Документация строительных проектов и соответствие стандартам теперь цифровые и отслеживаемые."
"Формы регистрации, счета и общение с гостями полностью переведены в цифровой формат. Наша служба консьержей теперь сосредоточена на превосходном сервисе."
"Отчетность АЗС, документы поставщиков и комплаенс-документация с более чем 250 станций обрабатываются и архивируются автоматически."
"Документация для фармацевтических функциональных этикеток, соответствующая стандартам GMP, теперь ведется полностью автоматически. Аудиторские следы безупречны и доступны мгновенно."
"Чертежи, разрешения и досье клиентов для наших деревянных домов теперь управляются централизованно. В шестом поколении мы наконец-то перешли на безбумажный формат."
"Договоры с поставщиками, сертификаты и таможенные документы для сотен обжарочных цехов по всему миру автоматически регистрируются и привязываются к соответствующему товару."
"Температурные листы, накладные CMR и сертификаты на продукты питания сканируются автоматически и привязываются к заказу. Ошибки распределения остались в прошлом."
"Разрешения на перевозку негабаритных грузов, планы маршрутов и проектная документация теперь доступны в цифровом виде мгновенно. Больше никаких поисков в папках."
"Таможенные документы, складские квитанции и экспедиторские поручения для нашей сети в Восточной Европе классифицируются автоматически. Четыре поколения логистики наконец-то стали цифровыми."
"Спецификации печати, согласования клиентов и сертификаты материалов теперь доступны централизованно. Доля брака на производстве снизилась практически до нуля."
"Сертификаты устойчивого развития, договоры с поставщиками и спецификации клиентов обрабатываются автоматически. Швейцарская точность теперь и в цифровом формате."
"Разрешения на строительство, договоры с субподрядчиками и протоколы приемки для нашей коммерческой недвижимости теперь полностью задокументированы в цифровом виде."
"Договоры купли-продажи, экспозе и досье клиентов за более чем 30 лет лидерства на рынке теперь доступны для цифрового поиска. Каждый агент находит все необходимое за считанные секунды."
"Документы морских перевозок, таможенные декларации и коносаменты фиксируются автоматически. Логистика на Балтийском море еще никогда не была такой эффективной."
"Тысячи заказов на индивидуальную упаковку в неделю с утверждением дизайна, данными печати и документами на поставку. PaperOffice держит все под контролем."
"Лабораторная документация по патологии и сертификация оборудования теперь полностью автоматизированы. Полная прослеживаемость каждого препарата."
"Кредитные документы, документы по обеспечению и переписка с клиентами обрабатываются за минуты, а не часы. Регуляторная проверка выполняется без пробелов."
"Технические характеристики, сертификаты качества и протоколы переработки для нашего сталелитейного производства доступны централизованно и мгновенно."
"Спецификации этикеток для фармацевтики и косметики с учетом нормативных требований проверяются и утверждаются автоматически. Больше никаких ручных контрольных списков."
"Документы KYC, инвестиционные отчеты и регуляторная отчетность классифицируются за секунды. Для робо-эдвайзера, регулируемого MAS, безупречный комплаенс имеет важнейшее значение."
"Паспорта безопасности, разрешения на транспортировку и документы ADR для химической логистики распределяются автоматически. Нулевая терпимость к ошибкам."
"Сертификаты подлинности, подтверждения от поставщиков и гарантии клиентов для наших коллекций жемчуга архивируются автоматически и доступны мгновенно."
"Заявки на кредиты для МСБ, документы по обеспечению и регуляторные отчеты классифицируются автоматически. У наших консультантов теперь больше времени на работу с клиентами."
"Клиентские досье за 135 с лишним лет банковской истории постепенно оцифровываются. 5000 сотрудников теперь имеют мгновенный доступ ко всем документам."
"Заявки на микрокредиты и комплаенс-документы для миллионов клиентов теперь обрабатываются за минуты, а не за дни. Это настоящий прорыв для доступности финансовых услуг."
"Сотни тысяч накладных и квитанций на возврат в день обрабатываются автоматически. Ведущий логистический оператор электронной коммерции Вьетнама теперь работает без бумаги."
"Протоколы производства с ЧПУ, сертификаты материалов и спецификации клиентов для нефтегазовых и аэрокосмических проектов теперь полностью задокументированы в цифровом виде."
"«Видение 2030» требует полной цифровизации. PaperOffice обрабатывает государственные документы для цифровой основы Саудовской Аравии."
"Сертификаты материалов, протоколы закалки и спецификации клиентов автоматически привязываются к соответствующему заказу. Единственный в Австралии производитель Q&T-стали теперь работает без бумаги."
"Протоколы сварочных швов, статические расчеты и планы проектов управляются в цифровом виде. Наши цеховые команды имеют доступ в режиме реального времени."
"Аэрокосмические сертификаты, программы ЧПУ и допуски клиентов классифицируются автоматически. Соблюдение стандарта AS9100 еще никогда не было таким простым."
"Договоры с мерчантами, документы KYC и чеки транзакций для сотен тысяч МСБ обрабатываются за секунды. Платежная революция Мексики — теперь без бумаги."
"Документация по сбору урожая, экспортные сертификаты и протоколы качества для наших высокогорных вин Мальбек архивируются автоматически. 120 лет традиций виноделия теперь в цифровом формате."
"Миллионы верификаций пользователей и нормативных документов обрабатываются полностью автоматически. Масштабирование без бумаги."
"Документы для онбординга мерчантов и подтверждения соответствия (compliance) для ведущего платежного провайдера Африки обрабатываются за считанные минуты вместо дней."
"Био-сертификаты, аудиты поставщиков и этикетки для тысяч натуральных продуктов проверяются и архивируются автоматически."
"Регуляторные документы из 33 африканских стран, партнерские договоры и аудиторские следы управляются полностью автоматически. Корпоративная DMS для финтеха стоимостью 3 млрд долларов."
"Рецепты и управление лекарствами теперь полностью автоматизированы. Больше времени для наших пациентов."
"Вековые документы теперь доступны для цифрового поиска. Веха для наших исторических архивов."
"Наши сиделки наконец-то уделяют больше времени жильцам, а не бумажной работе."
"Оцифровано более 500 000 дел. Наши сотрудники теперь мгновенно находят всю информацию."
"Управление медицинскими картами теперь элементарно. Всё автоматически фиксируется и архивируется."
"Документация по наследству теперь эффективна и безошибочна."
"Цифровое управление недвижимостью для всех наших жилых комплексов. Арендаторы и владельцы в восторге."
"С PaperOffice мы ускорили обработку счетов на 99%. ИИ автоматически распознает все релевантные данные и правильно их распределяет."
"PaperOffice стал неотъемлемой частью нашей повседневной работы. Заказы, коммерческие предложения и счета теперь обрабатываются автоматически."
"Документация по нашим услугам по уходу теперь переведена в цифровой формат и автоматизирована. Больше времени для наших пациентов."
"Технические чертежи, спецификации и протоколы качества можно найти мгновенно. Поиск, который раньше занимал 30 минут, теперь занимает 30 секунд."
"Документы клиентов, налоговые уведомления и годовые отчеты автоматически сортируются и привязываются к нужному клиенту. Хаос в документах остался в прошлом."
"Проектная документация, SLA и коммуникация с клиентами для наших проектов IT-консалтинга автоматически классифицируются и архивируются."
Именованные сущности за секунды
Люди, компании, суммы и ещё 13+ типов полей из любого документа — полностью автоматически.