LlamaParse および LlamaExtract が約束すること
LlamaIndex からの LlamaParse および LlamaExtract は、AI ドキュメント処理エコシステムで最もよく知られたツールの一つです。その約束は、あらゆる種類のドキュメント(PDF、スキャン、フォームなど)を、RAG パイプラインおよび LLM アプリケーションに最適化された構造化された Markdown テキストに変換することです。
LlamaParse は、異なる解析モードを提供します:Fast(1 クレジット/ページ)、Balanced(10 クレジット)、Premium(45 クレジット)、および Agentic Plus(90 クレジット)。LlamaExtract は、これにスキーマベースのデータ抽出を補完します。JSON スキーマを定義すると、ツールはドキュメントから構造化されたデータを抽出します。
一見すると魅力的に聞こえますが、詳しく見ると根本的な弱点が浮き彫りになります。さらに根本的な問いも提起されます:これらツールは本当にまだ必要なのでしょうか?
LlamaParse が陳腐化している理由:Claude、GPT などが自ら行うことができる
LlamaIndex にとっての不快な真実:現代のビジョン LLM は、LlamaParse を冗長なミドルウェア層にしています。
Claude 4、GPT-5、Gemini 2.5 Pro — これらのモデルはすべて、ドキュメントを直接処理できます。PDF や画像を入力として受け入れ、レイアウト、テーブル、構造を理解し、構造化された出力を交付します。LlamaParse が複数の解析モードを持つ複雑なパイプラインとして提供していることは、これらのモデルのネイティブ機能です。
LlamaIndex 自身も、自社のブログでこの傾向を確認しています:「最新のモデルを使用したスクリーンショットによるワンショットドキュメント解析の基準は、大幅に向上しました。」彼らは、純粋な LLM 解析の精度が劇的に向上したことを認めています。
これは実際には何を意味するのでしょうか?
- ミドルウェアは不要:Claude がドキュメントを直接理解するのだから、LlamaParse を介してドキュメントを送る必要があるのでしょうか?
- クレジットシステムは不要:Claude または GPT への単一の API 呼び出しはトークンを消費しますが、混乱を招くティアレベルを持つ独自のクレジットシステムはありません。
- ベンダーロックインは不要:LlamaParse は LlamaIndex のエコシステムに縛り付けます。ネイティブ LLM はプロバイダーに依存しません。
- メンテナンスは不要:v0.6.1 の生 OCR 問題(GitHub Issue #621)のように、LlamaParse が突然構造化された分析ではなく生 OCR テキストのみを交付するなどのバグは、ネイティブ LLM API では存在しません。
LlamaParse は本質的に LLM のラッパーであり、ラッパーは基盤技術が成熟すると陳腐化します。

バウンディングボックスの問題:単なるテキストでは不十分である理由
しかし — これが重要な点です — LlamaParse でもネイティブ LLM でも、実際の問題を解決していません:エンタープライズドキュメント処理にはテキスト以上のものが求められます。
皮肉なことに、LlamaIndex 自身もブログで 「LLM API は完全なドキュメントパーサーではありません」と主張しており、まさにその点です。純粋な LLM API は信頼スコア、バウンディングボックス、ソース引用を欠いています。しかし、彼らの独自のソリューションは、まさにここですでに大きな問題を抱えています:
| 問題 | GitHub Issue | ステータス |
|---|---|---|
| バウンディングボックスの高さが不正確 | #368 | 2024 年 8 月以来オープン |
| BBox 値 = None → Pydantic クラッシュ | #972 | 2025 年 10 月に修正 |
| テーブルに対してデフォルト値が実際の座標の代わりに使用される | #442 | オープン |
| 図の抽出がエッジケースで失敗する | #528 | オープン |
| 更新後に分析ではなく生 OCR が提供される | #621 | オープン |
| エラーメッセージなしで抽出ジョブが失敗する | #1107 | オープン(2026 年 2 月) |
根本的な問題:正確なバウンディングボックスがない場合、ドキュメント処理はエンタープライズアプリケーションにとって無意味です。なぜでしょうか?検索可能な PDF:座標なしでは、見えないテキスト層を作成できません。 PII 削除:ピクセル単位の正確な位置情報なしでは、正確な削除は不可能です。 監査証跡:ソース参照なしでは、抽出結果を検証できません。 ヒューマン・イン・ザ・ループ:レビュー担当者は、抽出された値の元となった場所を確認する必要があります。
表、スキャン画像、およびエンタープライズ要件
バウンディングボックスの問題に加え、LlamaParse および純粋な LLM アプローチは、追加のエンタープライズ要件でも失敗します。
表認識:APIScout ベンチマーク 2026 によると、LlamaParse は複雑な多カラム表、結合セル、および多ページ表において、専門ソリューションに比べて約 20% 遅れています。Undatas による独立した詳細調査では、「LlamaParse は複雑な表、特に結合セルや複雑なヘッダーを備えた表で著しく困難に直面しています」と確認されています。
スキャン画像と手書き文字:低解像度のスキャン画像では、精度が著しく低下します。スキャン画像における数式認識は「非常に信頼性が低い」とされています。手書き文字認識については、公式機能マトリックスでは「部分的」のみとされています。
公式 LlamaParse の制限事項:
- 1 ページあたりの最大画像数 35 枚(それ以外は無視されます)
- 1 ページあたりの最大テキスト量 64KB(それ以外は切り捨てられます)
- ファイルサイズ最大 512MB、抽出は 100MB まで
- 抽出ジョブあたりの最大ページ数 500 ページ
- スキーマネストは最大 7 レベルまで
- extract_stateless では DOCX 対応なし(GitHub #1077)
対照的に、PaperOffice AI:
- 800 以上の専門 LLM — ドキュメントタイプごとに 1 つ
- 行、列、結合セルを備えた表認識 — 構造化されたエクスポート
- AI Vision を活用した手書き文字認識 — 署名、注釈、フォーム
- OMR 認識 — チェックボックス、丸、マーキングに正確な座標付き
- QR コードおよびバーコード認識も含まれています
- 自動検出機能付きの 139 の言語

コスト比較:クレジット、セント、および隠れたコスト
LlamaParse はクレジットベースの価格モデルを採用しています。1,000 クレジットは 1.25 ドルです。当初は手頃な価格に思えますが、すぐに合計額が増加します:
| 機能 | LlamaParse クレジット | LlamaParse コスト/ページ | PaperOffice AI |
|---|---|---|---|
| 基本解析 | 1 クレジット(高速) | $0.00125 | $0.01(AI-OCR) |
| 高品質解析 | 10–45 クレジット | $0.013–0.056 | $0.01(AI-OCR) |
| プレミアムエージェント | 45–90 クレジット | $0.056–0.113 | $0.03(AI-AI-IDP) |
| 抽出 | 5–60 クレジット | $0.006–0.075 | $0.03(AI-IDP 含む) |
同等の品質(プレミアム/エージェントモード)において、PaperOffice AI は 2〜4 倍安価です。さらに:
- PaperOffice:バウンディングボックス、検索可能な PDF、削除機能は含まれています
- LlamaParse:レイアウト抽出には 1 ページあたり追加で 3 クレジットが必要です
- PaperOffice:クレジットシステムなし — 透明なページあたりのセント単位の価格設定
- LlamaParse:無料プランは月 10,000 クレジットまでで、それ以降は上限付きの従量課金制
プレミアムモードで月 100,000 ページの場合:LlamaParse = $5,625 対 PaperOffice AI-IDP = $3,000。節約額:47%。
PaperOffice AI:エンタープライズドキュメント処理が本当に必要とするもの
PaperOffice AI は、LlamaParse とは根本的に異なるアプローチを取ります。汎用 LLM のラッパーとして機能するのではなく、PaperOffice AI は 3 つの専門技術を組み合わせます:
1. OCR-LLM フュージョン:800 以上の専門でファインチューニングされた LLM — 請求書、契約書、ID、納品書などの特定のドキュメントタイプごとにトレーニング済み。「すべてのモデルに 1 つのモデル」のような汎用モデルはありません。
2. バウンディングボックスを基盤とする:認識されたすべての要素 — テキスト、表、画像、手書き文字 — に正確なピクセル座標が割り当てられます。これにより:
- 検索可能な PDF: オリジナルのスキャンと不可視の LLM テキスト層を組み合わせることで、検索可能、コピー可能、アーカイブ可能な状態にします。
- PII 削除: GDPR に準拠した正確な削除機能を提供します。単なるテキストの検索と置換ではなく、ピクセル単位の正確な削除を行います。
- 人間による監視: 抽出された値をクリックすると、瞬時に元の文書内の出現位置を確認できます。
- 監査証跡: 抽出されたすべてのデータポイントは追跡可能で検証可能です。
3. テンプレートなしのゼロショット: テンプレート、トレーニング、ルールは不要です。自然言語プロンプティングにより、抽出したい内容を自然な言語で記述します。
さらに、EU データセンターでの運用、GDPR 準拠、オンプレミス導入が可能です。LlamaParse はすべてクラウドに強制し(48 時間のキャッシュ付き!)、PaperOffice は完全なデータ主権を提供します。
| 機能 | LlamaParse | ネイティブ LLM | PaperOffice AI |
|---|---|---|---|
| Markdown 出力 | ✅ | ✅ | ✅ |
| 境界ボックス | ⚠️ バグあり | ❌ | ✅ ピクセル単位の正確さ |
| 検索可能な PDF | ❌ | ❌ | ✅ |
| PII 削除 | ❌ | ❌ | ✅ |
| 表(複雑な構造) | ⚠️ 約 80% | ⚠️ 変動 | ✅ 専用技術 |
| 手書き文字 | ⚠️ 部分的 | ⚠️ 変動 | ✅ AI ビジョン |
| オンプレミス | ❌ | ❌ | ✅ |
| EU サーバー/GDPR | ❌ | ⚠️ | ✅ |
| 価格(エンタープライズ) | $0.056–0.113 | 変動 | $0.01–0.03 |