Co slibují LlamaParse a LlamaExtract
LlamaParse a LlamaExtract od společnosti LlamaIndex patří mezi nejznámější nástroje v ekosystému zpracování dokumentů pomocí umělé inteligence. Jejich slibem je převod dokumentů jakéhokoli druhu – PDF, skenů, formulářů – do strukturovaného textu ve formátu Markdown, optimalizovaného pro RAG pipeline a aplikace založené na velkých jazykových modelech (LLM).
LlamaParse nabízí různé režimy analýzy: Rychlý (1 kredit/stránka), Vyvážený (10 kreditů), Prémiový (45 kreditů) a Agentic Plus (90 kreditů). LlamaExtract toto doplňuje extrakcí dat na základě schématu – definujete schéma JSON a nástroj extrahuje z vašich dokumentů strukturovaná data.
Na první pohled to zní přesvědčivě. Při podrobnějším zkoumání se však objevují zásadní slabiny – spolu s ještě fundamentálnější otázkou: Potřebujeme tyto nástroje vůbec ještě?
Proč se LlamaParse stává zastaralým: Claude, GPT a další to zvládnou sami
Zde je nepříjemná pravda pro společnost LlamaIndex: Moderní vizuální velké jazykové modely činí z LlamaParse nadbytečnou vrstvu middleware.
Claude 4, GPT-5, Gemini 2.5 Pro – všechny tyto modely dokážou zpracovávat dokumenty přímo. Akceptují soubory PDF a obrázky jako vstup, chápou rozložení, tabulky a strukturu a poskytují strukturovaný výstup. To, co LlamaParse nabízí jako komplexní pipeline s více režimy analýzy, je pro tyto modely nativní schopností.
Společnost LlamaIndex tento trend potvrzuje ve svém vlastním blogu: „Výchozí úroveň jednorázové analýzy dokumentů prostřednictvím snímků obrazovky pomocí nejnovějších modelů se výrazně zlepšila." Přiznávají, že přesnost čisté analýzy pomocí LLM dramaticky vzrostla.
Co to znamená v praxi?
- Není potřeba žádný middleware: Proč posílat dokumenty přes LlamaParse, když jim Claude rozumí přímo?
- Žádný kreditní systém: Jediné volání API na Claude nebo GPT stojí tokeny – žádný proprietární kreditní systém s matoucími úrovněmi
- Žádná závislost na dodavateli: LlamaParse vás váže na ekosystém LlamaIndex. Naturní LLM jsou nezávislé na poskytovateli
- Žádná údržba: Chyby, jako je problém se surovým OCR ve verzi v0.6.1 (GitHub Issue #621), kdy LlamaParse náhle dodával pouze surový OCR text místo strukturované analýzy, u nativních LLM API neexistují
LlamaParse je v podstatě obálka kolem LLM – a obálky se stávají zastaralými, jakmile základní technologie dozraje.

Problém ohraničovacích rámečků: Proč plain text nestačí
Ale – a to je klíčový bod – ani LlamaParse, ani nativní LLM neřeší skutečný problém: Zpracování podnikových dokumentů potřebuje více než jen text.
Ironicky společnost LlamaIndex sama ve svém blogu „LLM API nejsou kompletní analyzátory dokumentů" argumentuje přesně tímto: Čistá LLM API postrádají skóre spolehlivosti, ohraničovací rámečky a zdrojové citace. Ale jejich vlastní řešení má právě zde masivní problémy:
| Problém | GitHub Issue | Stav |
|---|---|---|
| Nesprávná výška ohraničovacího rámečku | #368 | Otevřeno od srpna 2024 |
| Hodnoty BBox = None → pád Pydantic | #972 | Opraveno v říjnu 2025 |
| Výchozí hodnoty místo skutečných souřadnic pro tabulky | #442 | Otevřeno |
| Extrakce obrázků selhává v hraničních případech | #528 | Otevřeno |
| Surový OCR místo analýzy po aktualizaci | #621 | Otevřeno |
| Extrakční úlohy selhávají bez chybové zprávy | #1107 | Otevřeno (únor 2026) |
Zásadní problém zní: Bez přesných ohraničovacích rámečků je zpracování dokumentů pro podnikové aplikace nepoužitelné. Proč?
- Durchsuchbare PDFs: Ohne Koordinaten kann keine unsichtbare Textebene erstellt werden
- Schwärzung personenbezogener Daten (PII): Ohne pixelgenaue Positionierung kann nichts präzise geschwärzt werden
- Prüfpfade: Ohne Quellenreferenzen ist die Extraktion nicht überprüfbar
- Mensch im Loop: Prüfer müssen nachvollziehen können, woher ein extrahierter Wert stammt
Tabellen, Scans und Anforderungen an Unternehmen
Über die Probleme mit Begrenzungsrahmen hinaus scheitern sowohl LlamaParse als auch reine LLM-Ansätze an weiteren unternehmerischen Anforderungen:
Tabellenerkennung: Laut dem APIScout-Benchmark 2026 liegt LlamaParse bei komplexen mehrspaltigen Tabellen, zusammengeführten Zellen und seitenübergreifenden Tabellen etwa 20 % hinter spezialisierten Lösungen zurück. Eine unabhängige Tiefenanalyse von Undatas bestätigt: „LlamaParse hat erhebliche Schwierigkeiten mit komplexen Tabellen, insbesondere solchen mit zusammengeführten Zellen oder intricate Kopfzeilen."
Scans und Handschrift: Bei gescannten Dokumenten mit niedriger Auflösung sinkt die Genauigkeit drastisch. Formelerkennung in Scans? „Höchst unzuverlässig." Handschrift? Laut der offiziellen Feature-Matrix nur „teilweise" möglich.
Offizielle Einschränkungen von LlamaParse:
- Maximal 35 Bilder pro Seite (der Rest wird ignoriert)
- Maximal 64 KB Text pro Seite (der Rest wird abgeschnitten)
- Maximale Dateigröße 512 MB, Extraktion nur bis 100 MB
- Maximal 500 Seiten pro Extraktionsauftrag
- Schema-Nesting nur bis zu 7 Ebenen tief
- Keine DOCX-Unterstützung in extract_stateless (GitHub #1077)
PaperOffice AI im Vergleich:
- Über 800 spezialisierte LLMs – jeweils eines für jeden Dokumententyp
- Tabellenerkennung mit Zeilen, Spalten und zusammengeführten Zellen – strukturierter Export
- Handschrifterkennung via AI Vision – Unterschriften, Anmerkungen, Formulare
- OMR-Erkennung – Checkboxen, Kreise, Markierungen mit exakten Koordinaten
- QR-Code- und Barcode-Erkennung inklusive
- 139 Sprachen mit automatischer Erkennung

Kostenvergleich: Credits, Cent und versteckte Kosten
LlamaParse nutzt ein credit-basiertes Preismodell. 1.000 Credits kosten 1,25 USD. Was zunächst erschwinglich klingt, summiert sich schnell:
| Funktion | LlamaParse Credits | LlamaParse Kosten pro Seite | PaperOffice AI |
|---|---|---|---|
| Basis-Parsing | 1 Credit (Schnell) | 0,00125 USD | 0,01 USD (AI-OCR) |
| Qualitäts-Parsing | 10–45 Credits | 0,013–0,056 USD | 0,01 USD (AI-OCR) |
| Premium Agentic | 45–90 Credits | 0,056–0,113 USD | 0,03 USD (AI-AI-IDP) |
| Extraktion | 5–60 Credits | 0,006–0,075 USD | 0,03 USD (AI-IDP, inkl.) |
Bei vergleichbarer Qualität (Premium/Agentic-Modus) ist PaperOffice AI 2- bis 4-mal günstiger. Zusätzlich gilt:
- PaperOffice: Begrenzungsrahmen, durchsuchbare PDFs, Schwärzung inklusive
- LlamaParse: Layout-Extraktion kostet +3 Credits extra pro Seite
- PaperOffice: Kein Credit-System – transparente Preisgestaltung in Cent pro Seite
- LlamaParse: Kostenlose Stufe begrenzt auf 10.000 Credits/Monat, danach Pay-as-you-go mit Obergrenzen
Bei 100.000 Seiten/Monat im Premium-Modus: LlamaParse = 5.625 USD vs. PaperOffice AI-IDP = 3.000 USD. Einsparung: 47 %.
PaperOffice AI: Was die Dokumentenverarbeitung für Unternehmen wirklich braucht
PaperOffice AI verfolgt einen grundlegend anderen Ansatz als LlamaParse. Statt als Wrapper um generische LLMs zu fungieren, kombiniert PaperOffice drei spezialisierte Technologien:
1. OCR-LLM-Fusion: Über 800 spezialisierte, feinabgestimmte LLMs – jedes trainiert auf spezifische Dokumententypen wie Rechnungen, Verträge, Ausweise, Lieferscheine. Kein generisches „Ein Modell für alle".
2. Begrenzungsrahmen als Grundlage: Jedes erkannte Element – Text, Tabelle, Bild, Handschrift – erhält exakte Pixelkoordinaten. Dies ermöglicht:
- Prohledatelné PDF: Původní sken + neviditelná textová vrstva od LLM = prohledatelné, kopírovatelné, archivovatelné
- Redakce osobních údajů (PII): Přesná redakce v souladu s GDPR – nejde o vyhledávání a nahrazování textu, ale o redakci s přesností na pixel
- Člověk v procesu (Human-in-the-Loop): Klikněte na extrahovanou hodnotu a okamžitě zobrazte její umístění v originálu
- Auditní stopy: Každý extrahovaný datový bod je vysledovatelný a ověřitelný
3. Zero-shot bez šablon: Žádné šablony, žádné trénování, žádná pravidla. Přirozené zadávání pokynů člověkem – popište přirozeným jazykem, co chcete extrahovat.
K tomu navíc: datová centra v EU, soulad s GDPR, dostupnost jako on-premise řešení. Zatímco LlamaParse vše vynucuje do cloudu (s 48hodinovou mezipamětí!), PaperOffice nabízí plnou datovou suverenitu.
| Funkce | LlamaParse | Nativní LLM | PaperOffice AI |
|---|---|---|---|
| Výstup ve formátu Markdown | ✅ | ✅ | ✅ |
| Ohraničující rámečky (Bounding boxes) | ⚠️ Chybové | ❌ | ✅ S přesností na pixel |
| Prohledatelné PDF | ❌ | ❌ | ✅ |
| Redakce PII | ❌ | ❌ | ✅ |
| Tabulky (komplexní) | ⚠️ ~80 % | ⚠️ Proměnlivé | ✅ Specializované |
| Rukopis | ⚠️ Částečné | ⚠️ Proměnlivé | ✅ AI Vision |
| On-premise | ❌ | ❌ | ✅ |
| GDPR/servery v EU | ❌ | ⚠️ | ✅ |
| Cena (enterprise) | 0,056–0,113 $ | Proměnlivé | 0,01–0,03 $ |