Apa yang Dijanjikan oleh LlamaParse dan LlamaExtract
LlamaParse dan LlamaExtract dari LlamaIndex merupakan salah satu alat paling terkenal dalam ekosistem pemrosesan dokumen berbasis Kecerdasan Buatan. Janji mereka: mengonversi dokumen apa pun—PDF, hasil pindaian, formulir—menjadi teks Markdown terstruktur yang dioptimalkan untuk alur kerja RAG dan aplikasi LLM.
LlamaParse menawarkan berbagai mode parsing: Cepat (1 kredit/halaman), Seimbang (10 kredit), Premium (45 kredit), dan Agentic Plus (90 kredit). LlamaExtract melengkapi hal ini dengan ekstraksi data berbasis skema; Anda cukup mendefinisikan skema JSON, dan alat tersebut akan mengekstrak data terstruktur dari dokumen Anda.
Sekilas, hal ini terdengar sangat menarik. Namun, upon pemeriksaan lebih lanjut, muncul kelemahan mendasar—bersama dengan pertanyaan yang bahkan lebih fundamental: Apakah kita masih memerlukan alat-alat ini?
Mengapa LlamaParse Menjadi Usang: Claude, GPT, dan Sejenisnya Dapat Melakukannya Sendiri
Inilah kebenaran yang kurang nyaman bagi LlamaIndex: LLM visi modern menjadikan LlamaParse sebagai lapisan middleware yang berlebihan.
Claude 4, GPT-5, Gemini 2.5 Pro—semua model ini dapat memproses dokumen secara langsung. Mereka menerima PDF dan gambar sebagai masukan, memahami tata letak, tabel, dan struktur, serta menghasilkan keluaran terstruktur. Apa yang ditawarkan LlamaParse sebagai alur kerja kompleks dengan berbagai mode parsing merupakan kemampuan bawaan bagi model-model ini.
LlamaIndex sendiri mengonfirmasi tren ini dalam blog mereka: "Dasar parsing dokumen satu kali melalui tangkapan layar menggunakan model terbaru telah menjadi jauh lebih baik." Mereka mengakui bahwa akurasi parsing murni oleh LLM telah meningkat secara dramatis.
Apa artinya ini dalam praktiknya?
- Tidak diperlukan middleware: Mengapa mengirim dokumen melalui LlamaParse apabila Claude dapat memahaminya secara langsung?
- Tidak ada sistem kredit: Satu panggilan API ke Claude atau GPT hanya memerlukan token—tanpa sistem kredit proprietari dengan tingkat tingkatan yang membingungkan.
- Tidak ada keterikatan pada satu penyedia (vendor lock-in): LlamaParse mengikat Anda pada ekosistem LlamaIndex. LLM bawaan bersifat independen terhadap penyedia.
- Tidak ada perawatan: Kutu perangkat lunak seperti masalah OCR mentah pada v0.6.1 (Isu GitHub #621), di mana LlamaParse tiba-tiba hanya mengirimkan teks OCR mentah alih-alih analisis terstruktur, tidak terjadi pada API LLM bawaan.
LlamaParse pada dasarnya adalah pembungkus (wrapper) di sekitar LLM—dan pembungkus menjadi usang ketika teknologi dasarnya matang.

Masalah Kotak Pembatas (Bounding Box): Mengapa Teks Polos Tidak Cukup
Namun—dan inilah poin krusialnya—baik LlamaParse maupun LLM bawaan tidak menyelesaikan masalah yang sebenarnya: Pemrosesan Dokumen tingkat perusahaan membutuhkan lebih dari sekadar teks.
Ironisnya, LlamaIndex sendiri berargumen dalam blog mereka berjudul "API LLM Bukanlah Parser Dokumen yang Lengkap" tepat mengenai hal ini: API LLM murni缺乏 skor kepercayaan, kotak pembatas, dan kutipan sumber. Namun, solusi mereka sendiri memiliki masalah besar tepat di sini:
| Masalah | Isu GitHub | Status |
|---|---|---|
| Tinggi kotak pembatas tidak tepat | #368 | Terbuka sejak Agustus 2024 |
| Nilai BBox = None → Kerusakan Pydantic | #972 | Diperbaiki Oktober 2025 |
| Nilai default, bukan koordinat nyata untuk tabel | #442 | Terbuka |
| Ekstraksi gambar gagal pada kasus-kasus ekstrem | #528 | Terbuka |
| OCR mentah alih-alih analisis setelah pembaruan | #621 | Terbuka |
| Pekerjaan ekstraksi gagal tanpa pesan kesalahan | #1107 | Terbuka (Februari 2026) |
Masalah mendasarnya adalah: Tanpa kotak pembatas yang tepat, pemrosesan dokumen tidak berguna untuk aplikasi tingkat perusahaan. Mengapa?
- PDF yang Dapat Dicari: Tanpa koordinat, lapisan teks tak terlihat tidak dapat dibuat
- Pengaburan PII: Tanpa pemosisian yang presisi hingga tingkat piksel, tidak ada yang dapat diaburkan secara akurat
- Jalur Audit: Tanpa referensi sumber, ekstraksi tidak dapat diverifikasi
- Manusia dalam Lingkaran (Human-in-the-Loop): Peninjau perlu melihat dari mana nilai yang diekstrak berasal
Tabel, Pindai, dan Persyaratan Perusahaan
Melampaui masalah kotak pembatas (bounding box), baik LlamaParse maupun pendekatan LLM murni gagal memenuhi persyaratan perusahaan tambahan:
Pengenalan tabel: Menurut tolok ukur APIScout tahun 2026, LlamaParse tertinggal sekitar 20% dibandingkan solusi khusus pada tabel multi-kolom yang kompleks, sel yang digabungkan, dan tabel multi-halaman. Sebuah analisis mendalam independen oleh Undatas mengonfirmasi: "LlamaParse mengalami kesulitan signifikan dengan tabel kompleks, terutama yang memiliki sel yang digabungkan atau header yang rumit."
Pindai dan tulisan tangan: Dengan dokumen hasil pindai beresolusi rendah, akurasi menurun drastis. Pengenalan rumus dalam pindai? "Sangat tidak dapat diandalkan." Tulisan tangan? Hanya "Sebagian" menurut matriks fitur resmi.
Keterbatasan resmi LlamaParse:
- Maks. 35 gambar per halaman (sisanya diabaikan)
- Maks. 64KB teks per halaman (sisanya dipotong)
- Maks. ukuran file 512MB, ekstraksi hanya 100MB
- Maks. 500 halaman per pekerjaan ekstraksi
- Pembuatan skema bersarang hanya hingga 7 tingkat
- Tidak ada dukungan DOCX dalam extract_stateless (GitHub #1077)
PaperOffice AI sebagai perbandingan:
- 800+ LLM khusus — satu untuk setiap jenis dokumen
- Pengenalan tabel dengan baris, kolom, sel yang digabungkan — ekspor terstruktur
- Pengenalan tulisan tangan melalui AI Vision — tanda tangan, anotasi, formulir
- Pengenalan OMR — kotak centang, lingkaran, tanda dengan koordinat yang tepat
- Pengenalan QR dan kode batang disertakan
- 139 bahasa dengan deteksi otomatis

Perbandingan Biaya: Kredit, Sen, dan Biaya Tersembunyi
LlamaParse menggunakan model harga berbasis kredit. 1.000 kredit berharga $1,25. Apa yang awalnya terdengar terjangkau akan bertambah dengan cepat:
| Fungsi | Kredit LlamaParse | Biaya LlamaParse per Halaman | PaperOffice AI |
|---|---|---|---|
| Penguraian dasar | 1 kredit (Cepat) | $0,00125 | $0,01 (AI-OCR) |
| Penguraian berkualitas | 10–45 kredit | $0,013–0,056 | $0,01 (AI-OCR) |
| Agentic Premium | 45–90 kredit | $0,056–0,113 | $0,03 (AI-AI-IDP) |
| Ekstraksi | 5–60 kredit | $0,006–0,075 | $0,03 (AI-IDP, termasuk) |
Pada kualitas yang sebanding (mode Premium/Agentic), PaperOffice AI 2–4 kali lebih murah. Selain itu:
- PaperOffice: Kotak pembatas, PDF yang dapat dicari, pengaburan termasuk
- LlamaParse: Ekstraksi tata letak dikenakan biaya tambahan +3 kredit per halaman
- PaperOffice: Tidak ada sistem kredit — harga transparan per sen per halaman
- LlamaParse: Tingkat gratis terbatas pada 10.000 kredit/bulan, kemudian bayar sesuai pemakaian dengan batasan
Pada 100.000 halaman/bulan dalam mode Premium: LlamaParse = $5.625 vs. PaperOffice AI-IDP = $3.000. Penghematan: 47%.
PaperOffice AI: Apa yang Sebenarnya Dibutuhkan oleh Pemrosesan Dokumen Perusahaan
PaperOffice AI mengambil pendekatan yang fundamentally berbeda dibandingkan LlamaParse. Alih-alih bertindak sebagai pembungkus di sekitar LLM generik, PaperOffice menggabungkan tiga teknologi khusus:
1. Fusi OCR-LLM: 800+ LLM khusus yang disetel secara halus — masing-masing dilatih pada jenis dokumen spesifik seperti faktur, kontrak, ID, catatan pengiriman. Tidak ada model generik "satu untuk semua".
2. Kotak Pembatas sebagai Fondasi: Setiap elemen yang dikenali — teks, tabel, gambar, tulisan tangan — menerima koordinat piksel yang tepat. Hal ini memungkinkan:
- PDF yang Dapat Dicari: Pindai asli + lapisan teks LLM tak terlihat = dapat dicari, dapat disalin, dapat diarsipkan
- Penyensoran Data Pribadi (PII): Penyensoran presisi yang sesuai dengan GDPR — bukan pencarian dan penggantian teks, melainkan penyensoran akurat tingkat piksel
- Manusia dalam Lingkaran (Human-in-the-Loop): Klik pada nilai yang diekstrak → langsung lihat di mana nilai tersebut muncul dalam dokumen asli
- Jalur Audit: Setiap titik data yang diekstrak dapat dilacak dan diverifikasi
3. Zero-Shot tanpa Templat: Tanpa templat, tanpa pelatihan, tanpa aturan. Prompting Manusia Alami — jelaskan dalam bahasa alami apa yang ingin Anda ekstrak.
Di atas semua itu: pusat data Uni Eropa, sesuai GDPR, tersedia untuk penerapan lokal (on-premise). Sementara LlamaParse memaksa segala sesuatu ke dalam cloud (dengan cache 48 jam!), PaperOffice menawarkan kedaulatan data penuh.
| Fitur | LlamaParse | LLM Native | PaperOffice AI |
|---|---|---|---|
| Keluaran Markdown | ✅ | ✅ | ✅ |
| Kotak Pembatas (Bounding boxes) | ⚠️ Bermasalah | ❌ | ✅ Presisi piksel |
| PDF yang Dapat Dicari | ❌ | ❌ | ✅ |
| Penyensoran PII | ❌ | ❌ | ✅ |
| Tabel (kompleks) | ⚠️ ~80% | ⚠️ Bervariasi | ✅ Terspesialisasi |
| Tulisan Tangan | ⚠️ Sebagian | ⚠️ Bervariasi | ✅ Visi AI |
| On-premise | ❌ | ❌ | ✅ |
| Server GDPR/Uni Eropa | ❌ | ⚠️ | ✅ |
| Harga (perusahaan) | $0,056–0,113 | Bervariasi | $0,01–0,03 |