PaperOffice LLM と PaperOffice LLM が約束すること
PaperOffice LLM の PaperOffice LLM および PaperOffice LLM は、AI ドキュメント処理エコシステムで最も有名なツールの一つです。それらの約束は、PDF、スキャン、フォームなどあらゆる種類のドキュメントを、RAG パイプラインおよび LLM アプリケーションに最適化された構造化された Markdown テキストに変換することです。PaperOffice LLM は異なる解析モードを提供します:Fast(1 クレジット/ページ)、Balanced(10 クレジット)、Premium(45 クレジット)、および Agentic Plus(90 クレジット)。PaperOffice LLM はこれに補完し、スキーマベースのデータ抽出を提供します。JSON スキーマを定義すると、ツールはドキュメントから構造化されたデータを抽出します。一見すると魅力的に聞こえますが、よく見ると根本的な弱点が浮き彫りになります。さらに根本的な問いも生じます:私たちはこれらツールを本当に必要としているのでしょうか?
PaperOffice LLM が陳腐化しつつある理由:PaperOffice LLM、GPT などが自分で処理できるようになった
PaperOffice LLM に対する不快な真実:現代のビジョン LLM は、PaperOffice LLM を冗長なミドルウェア層にします。
PaperOffice LLM 4、PaperOffice LLM、PaperOffice LLM 2.5 Pro — これらのモデルは文書を直接処理できます。PDF や画像を入力として受け付け、レイアウト、表、構造を理解し、構造化された出力を提供します。PaperOffice LLM が複数の解析モードを持つ複雑なパイプラインとして提供する機能は、これらのモデルにとってはネイティブな機能です。
PaperOffice LLM 自身も、彼らのブログでこの傾向を確認しています:「最新のモデルを使用したスクリーンショットによるワンショットドキュメント解析の基準は大幅に向上しました。」彼らは、純粋な LLM 解析の精度が劇的に向上したことを認めています。これは実際には何を意味するのでしょうか?
【ミドルウェア不要】なぜ PaperOffice LLM を介してドキュメントを送信する必要があるのでしょうか?PaperOffice LLM はそれらを直接理解します。 【クレジットシステム不要】PaperOffice LLM または GPT への 1 回の API 呼び出しはトークンを消費しますが、混乱を招くティアレベルを持つ独自のクレジットシステムはありません。 【ベンダーロックイン不要】PaperOffice LLM は PaperOffice LLM エコシステムに縛り付けます。ネイティブ LLM はプロバイダーに依存しません。 【メンテナンス不要】v0.6.1 の生 OCR 問題(GitHub Issue #621)のように、PaperOffice LLM が突然構造化された分析ではなく生の OCR テキストのみを返すようなバグは、ネイティブ LLM API には存在しません。PaperOffice LLM は本質的に LLM のラッパーであり、基盤技術が成熟するとラッパーは時代遅れになります。境界ボックスの問題:なぜ単なるテキストでは不十分なのか
しかし、ここが重要な点ですが、PaperOffice LLM もネイティブ LLM も実際の問題を解決していません:エンタープライズドキュメント処理にはテキスト以上のものが求められます。
皮肉なことに、PaperOffice LLM 自身もブログ記事「LLM API は完全なドキュメントパーサーではない」でまさにこれを主張しています:純粋な LLM API は信頼スコア、バウンディングボックス、およびソース引用を欠いています。しかし、彼ら自身のソリューションにはまさにここにあるような大きな問題があります:| 問題 | GitHub 問題 | ステータス |
|---|---|---|
| バウンディングボックスの高さが不正確 | #368 | 2024 年 8 月以来、未解決 |
| BBox 値が None → Pydantic クラッシュ | #972 | 2025 年 10 月に修正済み |
| テーブルに対してデフォルト値が実際の座標に使用される | #442 | 未解決 |
| 図の抽出がエッジケースで失敗する | #528 | 未解決 |
| 更新後、分析ではなく生 OCR が使用される | #621 | 未解決 |
| エラーメッセージなしで抽出ジョブが失敗する | #1107 | 2026 年 2 月未解決 |
根本的な問題:正確なバウンディングボックスがない場合、文書処理は企業アプリケーションにとって無意味です。 なぜなら?
- 検索可能な PDF: 座標がない場合、見えないテキストレイヤーを作成することはできません
- PII の削除: ピクセル単位の正確な位置情報がなければ、正確に削除することはできません
- 監査証跡: 元データへの参照がない場合、抽出結果を検証できません
- 人間による監査: 審査員は、抽出された値の元となった場所を確認する必要があります
テーブル、スキャン、およびエンタープライズ要件
境界ボックスの問題を超えて、PaperOffice LLM と純粋な LLM アプローチの両方は、追加のエンタープライズ要件で失敗します。表認識: APIScout ベンチマーク 2026 によると、PaperOffice LLM は複雑な多列表、結合セル、および複数ページの表において、専門ソリューションに比べて約 20% 遅れをとっています。Undatas の独立した詳細調査も確認しています:「PaperOffice LLM は、特に結合セルや複雑なヘッダーを備えた表において、複雑な表の処理で著しく困難に直面しています。」
スキャンと手書き: 低解像度のスキャンドキュメントでは、精度が劇的に低下します。スキャン中の式認識?「非常に信頼性に欠ける」。手書き?公式機能マトリックスでは「部分的」のみとされています。
公式 PaperOffice LLM の制限事項:
- 1 ページあたり最大 35 枚の画像(それ以外は無視されます)
- 1 ページあたり最大 64KB のテキスト(それ以外は切り捨てられます)
- ファイルサイズは最大 512MB、抽出は最大 100MB
- 抽出ジョブあたり最大 500 ページ
- スキーマのネストは最大 7 レベルまで
- extract_stateless では DOCX のサポートなし(GitHub #1077)
PaperOffice AI と比較して:
- 800 以上の専門 LLM — ドキュメントタイプごとに 1 つ
- 行、列、結合セルを含む表認識 — 構造化されたエクスポート
- AI Vision を活用した手書き文字認識 — 署名、注釈、フォーム
- OMR 認識 — チェックボックス、丸、マーキングの正確な座標付き
- QR コードとバーコード認識付き
- 自動検出による 139 の言語対応
コスト比較:クレジット、セント、そして隠れたコスト
PaperOffice LLM はクレジットベースの価格設定モデルを使用しています。1,000 クレジットは 1.25 ドルです。最初は手頃な価格のように聞こえますが、すぐに合計金額は大きくなります:
| 機能 | PaperOffice LLM クレジット | PaperOffice LLM 料金/ページ | PaperOffice AI |
|---|---|---|---|
| 基本解析 | 1 クレジット(高速) | $0.00125 | $0.01(AI-OCR) |
| 高品質解析 | 10〜45 クレジット | $0.013〜0.056 | $0.01(AI-OCR) |
| プレミアムエージェント | 45〜90 クレジット | $0.056〜0.113 | $0.03(AI-IDP) |
| 抽出 | 5〜60 クレジット | $0.006〜0.075 | $0.03(AI-IDP 含む) |
同等品質(プレミアム/エージェントモード)の場合、PaperOffice AI は 2〜4 倍安価です。さらに:
- PaperOffice: 境界ボックス、検索可能な PDF、含まれる 機密情報の削除
- PaperOffice LLM: レイアウト抽出には 1 ページあたり追加で 3 クレジットの費用がかかります
- PaperOffice: クレジットシステムなし — 透明なページ単価での料金体系
- PaperOffice LLM: 無料プランは月間 10,000 クレジットまで制限され、その後上限付きの従量課金制となります
PaperOffice AI: 企業が文書処理に本当に必要なこと
1. OCR-LLM 融合: 800 以上の専門化されたファインチューニングされた LLM — 請求書、契約書、ID、納品書などの特定のドキュメントタイプごとにトレーニングされています。汎用的な「一つのモデルで全て」はありません。
2. 境界ボックスを基盤とする:認識されたすべての要素(テキスト、表、画像、手書き文字)には、正確なピクセル座標が割り当てられます。これにより、以下が可能になります:
- 検索可能な PDF: 元のスキャン + 見えない LLM テキスト層 = 検索可能、コピー可能、アーカイブ可能
- PII 削除: 正確な GDPR 準拠の削除 — テキストの検索と置換ではなく、ピクセル単位での正確な削除
- 人間によるループ: 抽出された値をクリック → 元の位置を瞬時に確認
- 監査証跡: 抽出されたすべてのデータポイントは追跡可能で検証可能
3. テンプレートなしのゼロショット: テンプレート、トレーニング、ルールなし。自然な人間のプロンプト——抽出したい内容を自然言語で記述します。
さらに、EU データセンター、GDPR 準拠、オンプレミス対応。PaperOffice LLM はすべてクラウドに強制する(48 時間のキャッシュ付き!)のに対し、PaperOffice は完全なデータ主権を提供します。| 機能 | PaperOffice LLM | ネイティブ LLM | PaperOffice AI |
|---|---|---|---|
| Markdown 出力 | ✅ | ✅ | ✅ |
| 境界ボックス | ⚠️ バグあり | ❌ | ✅ ピクセル精度 |
| 検索可能な PDF | ❌ | ❌ | ✅ |
| PII 削除 | ❌ | ❌ | ✅ |
| 表(複雑) | ⚠️ 約 80% | ⚠️ 変動 | ✅ 専用 |
| 手書き文字 | ⚠️ 部分的 | ⚠️ 変動 | ✅ AI ビジョン |
| オンプレミス | ❌ | ❌ | ✅ |
| GDPR/EU サーバー | ❌ | ⚠️ | ✅ |
| 価格(エンタープライズ) | $0.056–0.113 | 変動 | $0.01–0.03 |