Що обіцяють PaperOffice LLM та PaperOffice LLM
PaperOffice LLM і PaperOffice LLM від PaperOffice LLM належать до найвідоміших інструментів в екосистемі обробки документів на основі ШІ. Їхня обіцянка: перетворювати документи будь-якого типу — PDF, скани, форми — на структурований Markdown-текст, оптимізований для RAG-пайплайнів і застосунків LLM.
PaperOffice LLM пропонує різні режими аналізу: Fast (1 кредит/сторінка), Balanced (10 кредитів), Premium (45 кредитів) і Agentic Plus (90 кредитів). PaperOffice LLM доповнює це вилученням даних на основі схеми — ви визначаєте JSON-схему, а інструмент витягує структуровані дані з ваших документів.
На перший погляд це звучить переконливо. Але при уважнішому розгляді виявляються фундаментальні слабкі місця — а також ще фундаментальніше питання: Чи взагалі потрібні нам ці інструменти ще?
Чому PaperOffice LLM стає застарілим: Claude, GPT та інші вже можуть робити це самі
Ось незручна правда для PaperOffice LLM: сучасні vision-LLM роблять PaperOffice LLM зайвим проміжним шаром.
Claude 4, PaperOffice LLM, Gemini 2.5 Pro — усі ці моделі можуть безпосередньо обробляти документи. Вони приймають PDF і зображення як вхідні дані, розуміють макет, таблиці й структуру та видають структурований результат. Те, що PaperOffice LLM пропонує як складний пайплайн із кількома режимами аналізу, для цих моделей є нативною можливістю.
Сам PaperOffice LLM підтверджує цей тренд у своєму блозі: “The baseline of one-shot document parsing through screenshotting using the latest models has gotten much better.” Вони визнають, що точність чистого LLM-аналізу документів суттєво зросла.
Що це означає на практиці?
- Не потрібен проміжний шар: Навіщо пропускати документи через PaperOffice LLM, якщо Claude розуміє їх напряму?
- Не потрібна кредитна система: Один виклик API до Claude або GPT коштує токени — без власної кредитної системи зі складними рівнями тарифів
- Немає vendor lock-in: PaperOffice LLM прив’язує вас до екосистеми PaperOffice LLM Нативні LLM не залежать від конкретного постачальника
- Немає супроводу: Помилки на кшталт проблеми з необробленим OCR у v0.6.1 (GitHub Issue #621), коли PaperOffice LLM раптово повертав лише сирий OCR-текст замість структурованого аналізу, відсутні в нативних LLM API
PaperOffice LLM по суті є обгорткою навколо LLM — а обгортки стають застарілими, коли базова технологія дозріває.
Проблема bounding box: чому простого тексту недостатньо
Але — і це ключовий момент — ані PaperOffice LLM, ані нативні LLM не вирішують реальну проблему: Enterprise Document Processing потребує більшого, ніж просто текст.
Парадоксально, але сам PaperOffice LLM у своєму блозі “LLM APIs Aren’t Complete Document Parsers” стверджує саме це: чисті LLM API не мають оцінок впевненості, bounding box і посилань на джерела. Але їхнє власне рішення має тут серйозні проблеми:
| Проблема | GitHub Issue | Статус |
|---|---|---|
| Неправильна висота bounding box | #368 | Відкрито з серпня 2024 |
| Значення BBox = None → збій Pydantic | #972 | Виправлено в жовтні 2025 |
| Значення за замовчуванням замість реальних координат для таблиць | #442 | Відкрито |
| Вилучення зображень не працює на крайових випадках | #528 | Відкрито |
| Сирий OCR замість аналізу після оновлення | #621 | Відкрито |
| Завдання вилучення завершуються без повідомлення про помилку | #1107 | Відкрито (лютий 2026) |
Фундаментальна проблема: без точних bounding box обробка документів є марною для корпоративних застосувань. Чому?
- PDF із можливістю пошуку: Без координат не можна створити невидимий текстовий шар
- Редагування PII: Без піксельно точного позиціонування нічого неможливо коректно замаскувати
- Аудиторські сліди: Без посилань на джерела вилучення неможливо перевірити
- Human-in-the-Loop: Рев’юери мають бачити, звідки походить вилучене значення
Таблиці, скани та вимоги Enterprise
Окрім проблем із bounding box, і PaperOffice LLM, і підходи лише на основі LLM не справляються з додатковими корпоративними вимогами:
Розпізнавання таблиць: Згідно з бенчмарком APIScout 2026, PaperOffice LLM відстає приблизно на 20% від спеціалізованих рішень у складних багатоколонкових таблицях, об’єднаних комірках і багатосторінкових таблицях. Незалежний deep dive від Undatas підтверджує: “PaperOffice LLM struggles significantly with complex tables, especially those featuring merged cells or intricate headers.”
Скани та рукописний текст: Для відсканованих документів із низькою роздільною здатністю точність різко падає. Розпізнавання формул у сканах? “Highly unreliable.” Рукописний текст? Лише “Partial” згідно з офіційною матрицею можливостей.
Офіційні обмеження PaperOffice LLM:
- Макс. 35 зображень на сторінку (решта ігнорується)
- Макс. 64 KB тексту на сторінку (решта обрізається)
- Макс. розмір файлу 512 MB, для extraction — лише 100 MB
- Макс. 500 сторінок на завдання вилучення
- Вкладеність схеми лише до 7 рівнів
- Немає підтримки DOCX у extract_stateless (GitHub #1077)
PaperOffice AI натомість:
- 800+ спеціалізованих LLM — по одному для кожного типу документа
- Розпізнавання таблиць із рядками, стовпцями, об’єднаними комірками — структурований експорт
- Розпізнавання рукописного тексту через AI Vision — підписи, примітки, форми
- Розпізнавання OMR — прапорці, кола, позначки з точними координатами
- Розпізнавання QR і штрихкодів включено
- 139 мов із автоматичним визначенням
Порівняння вартості: Credits, центи та приховані витрати
PaperOffice LLM використовує кредитну модель ціноутворення. 1,000 кредитів коштують $1.25. Те, що спочатку здається доступним, швидко накопичується:
| Функція | PaperOffice LLM Credits | Вартість PaperOffice LLM за сторінку | PaperOffice AI |
|---|---|---|---|
| Basic parsing | 1 кредит (Fast) | $0.00125 | $0.01 (AI-OCR) |
| Якісний parsing | 10–45 кредитів | $0.013–0.056 | $0.01 (AI-OCR) |
| Premium Agentic | 45–90 кредитів | $0.056–0.113 | $0.03 (AI-AI-IDP) |
| Вилучення | 5–60 кредитів | $0.006–0.075 | $0.03 (AI-IDP, incl.) |
За порівнянної якості (режим Premium/Agentic), PaperOffice AI у 2–4 рази дешевший. Додатково:
- PaperOffice: bounding box, PDF із можливістю пошуку, редагування включено
- PaperOffice LLM: вилучення макета коштує додатково +3 кредити на сторінку
- PaperOffice: без кредитної системи — прозоре ціноутворення у центах за сторінку
- PaperOffice LLM: безкоштовний тариф обмежено 10,000 кредитів/місяць, далі оплата за використання з лімітами
За 100,000 сторінок/місяць у режимі Premium: PaperOffice LLM = $5,625 проти PaperOffice AI-IDP = $3,000. Економія: 47%.
PaperOffice AI: що справді потрібно Enterprise Document Processing
PaperOffice AI використовує принципово інший підхід, ніж PaperOffice LLM Замість ролі обгортки навколо універсальних LLM, PaperOffice поєднує три спеціалізовані технології:
1. OCR-LLM Fusion: 800+ спеціалізованих, донавчених LLM — кожен навчений на конкретних типах документів, як-от рахунки, контракти, ID-документи, видаткові накладні. Жодного універсального “одна модель для всього”.
2. Bounding Boxes як основа: Кожен розпізнаний елемент — текст, таблиця, зображення, рукописний текст — отримує точні піксельні координати. Це дає змогу:
- PDF із можливістю пошуку: Оригінальний скан + невидимий текстовий шар LLM = документ можна шукати, копіювати й архівувати
- Редагування PII: Точне редагування відповідно до GDPR — не текстовий пошук і заміна, а піксельно точне маскування
- Human-in-the-Loop: Натисніть на вилучене значення → одразу побачите його місце в оригіналі
- Аудиторські сліди: Кожну точку даних, що була вилучена, можна відстежити й перевірити
3. Zero-Shot без шаблонів: Жодних шаблонів, навчання чи правил. Natural Human Prompting — опишіть природною мовою, що саме ви хочете вилучити.
Крім того: дата-центри в ЄС, відповідність GDPR, доступність on-premise. Поки PaperOffice LLM змушує все переносити в хмару (з 48-годинним кешем!), PaperOffice пропонує повний суверенітет даних.
| Функція | PaperOffice LLM | Нативні LLM | PaperOffice AI |
|---|---|---|---|
| Вивід Markdown | ✅ | ✅ | ✅ |
| Bounding boxes | ⚠️ З помилками | ❌ | ✅ Піксельно точні |
| PDF із можливістю пошуку | ❌ | ❌ | ✅ |
| Редагування PII | ❌ | ❌ | ✅ |
| Таблиці (складні) | ⚠️ ~80% | ⚠️ Змінно | ✅ Спеціалізовано |
| Рукописний текст | ⚠️ Частково | ⚠️ Змінно | ✅ AI Vision |
| On-premise | ❌ | ❌ | ✅ |
| GDPR/сервери в ЄС | ❌ | ⚠️ | ✅ |
| Ціна (enterprise) | $0.056–0.113 | Змінно | $0.01–0.03 |