Что обещают PaperOffice LLM и PaperOffice LLM
PaperOffice LLM и PaperOffice LLM от PaperOffice LLM — одни из самых известных инструментов в экосистеме обработки документов с помощью ИИ. Их обещание: преобразовывать документы любого типа — PDF, сканы, формы — в структурированный текст Markdown, оптимизированный для RAG-пайплайнов и приложений LLM.
PaperOffice LLM предлагает разные режимы анализа: Fast (1 кредит/страница), Balanced (10 кредитов), Premium (45 кредитов) и Agentic Plus (90 кредитов). PaperOffice LLM дополняет это извлечением данных на основе схемы — задайте JSON-схему, и инструмент извлечёт структурированные данные из ваших документов.
На первый взгляд это звучит убедительно. Но при более внимательном рассмотрении обнаруживаются фундаментальные слабые места — а также ещё более фундаментальный вопрос: Нужны ли нам вообще эти инструменты до сих пор?
Почему PaperOffice LLM становится устаревшим: Claude, GPT и компания могут делать это сами
Вот неприятная правда для PaperOffice LLM: современные vision-LLM делают PaperOffice LLM избыточным слоем middleware.
Claude 4, PaperOffice LLM, Gemini 2.5 Pro — все эти модели могут обрабатывать документы напрямую. Они принимают PDF и изображения в качестве входных данных, понимают макет, таблицы и структуру и выдают структурированный результат. То, что PaperOffice LLM предлагает как сложный пайплайн с несколькими режимами анализа, для этих моделей является нативной возможностью.
Сами PaperOffice LLM подтверждают этот тренд в своём блоге: «Базовый уровень одношагового анализа документов через создание скриншотов с использованием новейших моделей стал намного лучше». Они признают, что точность чистого LLM-анализа значительно выросла.
Что это означает на практике?
- Middleware не нужен: Зачем отправлять документы через PaperOffice LLM, если Claude понимает их напрямую?
- Нет системы кредитов: Один вызов API к Claude или GPT стоит токены — без закрытой кредитной системы с запутанными тарифными уровнями
- Нет привязки к поставщику: PaperOffice LLM привязывает вас к экосистеме PaperOffice LLM Нативные LLM не зависят от конкретного поставщика
- Нет обслуживания: Ошибки вроде проблемы с сырым OCR в v0.6.1 (GitHub Issue #621), когда PaperOffice LLM внезапно выдавал только сырой OCR-текст вместо структурированного анализа, не возникают с нативными LLM API
PaperOffice LLM по сути является обёрткой над LLM — а обёртки устаревают, когда базовая технология созревает.
Проблема bounding box: почему простого текста недостаточно
Но — и это ключевой момент — ни PaperOffice LLM, ни нативные LLM не решают реальную проблему: Enterprise Document Processing нужен не только текст.
Иронично, но сами PaperOffice LLM утверждают в своём блоге «LLM API — это не полноценные парсеры документов» именно это: чистым LLM API не хватает confidence scores, bounding box и ссылок на источники. Но у их собственного решения здесь есть серьёзные проблемы:
| Проблема | GitHub Issue | Статус |
|---|---|---|
| Неверная высота bounding box | #368 | Открыто с авг. 2024 |
| BBox values = None → сбой Pydantic | #972 | Исправлено в окт. 2025 |
| Значения по умолчанию вместо реальных координат для таблиц | #442 | Открыто |
| Извлечение фигур не работает в крайних случаях | #528 | Открыто |
| Сырой OCR вместо анализа после обновления | #621 | Открыто |
| Задания на извлечение завершаются без сообщения об ошибке | #1107 | Открыто (фев. 2026) |
Фундаментальная проблема: без точных bounding box обработка документов бесполезна для корпоративных сценариев. Почему?
- Поисковые PDF: без координат нельзя создать невидимый текстовый слой
- Редакция PII: без пиксельно точного позиционирования ничего нельзя корректно скрыть
- Аудит-трейлы: без ссылок на источник извлечение нельзя проверить
- Human-in-the-Loop: проверяющим нужно видеть, откуда было взято извлечённое значение
Таблицы, сканы и требования Enterprise
Помимо проблем с bounding box, и PaperOffice LLM, и чистые LLM-подходы не справляются с дополнительными корпоративными требованиями:
Распознавание таблиц: Согласно бенчмарку APIScout 2026, PaperOffice LLM отстаёт примерно на 20% от специализированных решений на сложных многостолбцовых таблицах, объединённых ячейках и многостраничных таблицах. Независимый deep dive от Undatas подтверждает: «PaperOffice LLM значительно испытывает трудности со сложными таблицами, особенно с теми, где есть объединённые ячейки или сложные заголовки».
Сканы и рукописный текст: На отсканированных документах низкого разрешения точность резко падает. Распознавание формул в сканах? «Крайне ненадёжно». Рукописный текст? По официальной матрице функций — лишь «частично».
Официальные ограничения PaperOffice LLM:
- Макс. 35 изображений на страницу (остальное игнорируется)
- Макс. 64 КБ текста на страницу (остальное обрезается)
- Макс. размер файла 512 МБ, для извлечения только 100 МБ
- Макс. 500 страниц на одно задание извлечения
- Вложенность схемы только до 7 уровней
- Нет поддержки DOCX в extract_stateless (GitHub #1077)
PaperOffice AI в отличие от этого:
- 800+ специализированных LLM — по одной для каждого типа документа
- Распознавание таблиц со строками, столбцами, объединёнными ячейками — структурированный экспорт
- Распознавание рукописного текста через AI Vision — подписи, пометки, формы
- Распознавание OMR — чекбоксы, кружки, отметки с точными координатами
- Распознавание QR- и штрихкодов включено
- 139 языков с автоматическим определением
Сравнение стоимости: Credits, центы и скрытые расходы
PaperOffice LLM использует кредитную модель ценообразования. 1 000 кредитов стоят $1.25. То, что сначала кажется доступным, быстро накапливается:
| Функция | PaperOffice LLM Credits | Стоимость PaperOffice LLM/страница | PaperOffice AI |
|---|---|---|---|
| Basic parsing | 1 кредит (Fast) | $0.00125 | $0.01 (AI-OCR) |
| Качественный парсинг | 10–45 кредитов | $0.013–0.056 | $0.01 (AI-OCR) |
| Premium Agentic | 45–90 кредитов | $0.056–0.113 | $0.03 (AI-AI-IDP) |
| Извлечение | 5–60 кредитов | $0.006–0.075 | $0.03 (AI-IDP, incl.) |
При сопоставимом качестве (режим Premium/Agentic) PaperOffice AI в 2–4 раза дешевле. Кроме того:
- PaperOffice: bounding boxes, поисковый PDF, redaction включены
- PaperOffice LLM: извлечение макета стоит дополнительно +3 кредита за страницу
- PaperOffice: нет системы кредитов — прозрачное ценообразование в центах за страницу
- PaperOffice LLM: бесплатный тариф ограничен 10 000 кредитов/месяц, затем оплата по мере использования с лимитами
При 100 000 страниц в месяц в режиме Premium: PaperOffice LLM = $5,625 против PaperOffice AI-IDP = $3,000. Экономия: 47%.
PaperOffice AI: что на самом деле нужно Enterprise Document Processing
PaperOffice AI использует принципиально иной подход, чем PaperOffice LLM Вместо того чтобы быть обёрткой вокруг универсальных LLM, PaperOffice объединяет три специализированные технологии:
1. OCR-LLM Fusion: 800+ специализированных, дообученных LLM — каждая обучена на конкретных типах документов, таких как счета, договоры, удостоверения личности, накладные. Никакого универсального «одна модель на всё».
2. Bounding Boxes как основа: Каждый распознанный элемент — текст, таблица, изображение, рукописный текст — получает точные пиксельные координаты. Это позволяет:
- Поисковые PDF: исходный скан + невидимый слой текста LLM = документ можно искать, копировать и архивировать
- Редакция PII: точная, соответствующая GDPR маскировка — не поиск и замена текста, а пиксельно точное скрытие
- Human-in-the-Loop: нажмите на извлечённое значение → сразу увидите, где оно находится в оригинале
- Audit Trails: каждый извлечённый фрагмент данных можно отследить и проверить
3. Zero-Shot без шаблонов: никаких шаблонов, обучения и правил. Natural Human Prompting — опишите на естественном языке, что вы хотите извлечь.
Кроме того: дата-центры в ЕС, соответствие GDPR, доступно on-premise. Пока PaperOffice LLM заставляет всё проходить через облако (с 48-часовым кэшем!), PaperOffice предлагает полную суверенность данных.
| Функция | PaperOffice LLM | Нативные LLM | PaperOffice AI |
|---|---|---|---|
| Вывод Markdown | ✅ | ✅ | ✅ |
| Bounding boxes | ⚠️ С ошибками | ❌ | ✅ Пиксельно точно |
| Поисковый PDF | ❌ | ❌ | ✅ |
| Редакция PII | ❌ | ❌ | ✅ |
| Таблицы (сложные) | ⚠️ ~80% | ⚠️ Зависит от модели | ✅ Специализировано |
| Рукописный текст | ⚠️ Частично | ⚠️ Зависит от модели | ✅ AI Vision |
| On-premise | ❌ | ❌ | ✅ |
| Серверы GDPR/ЕС | ❌ | ⚠️ | ✅ |
| Цена (enterprise) | $0.056–0.113 | Зависит от модели | $0.01–0.03 |