PaperOffice LLM ve PaperOffice LLM Ne Vadediyor
PaperOffice LLM’ten PaperOffice LLM ve PaperOffice LLM, yapay zekâ belge işleme ekosistemindeki en bilinen araçlar arasındadır. Vaatleri şudur: PDF’ler, taramalar, formlar gibi her tür belgeyi RAG iş akışları ve LLM uygulamaları için optimize edilmiş yapılandırılmış Markdown metnine dönüştürmek.
PaperOffice LLM farklı ayrıştırma modları sunar: Fast (sayfa başına 1 kredi), Balanced (10 kredi), Premium (45 kredi) ve Agentic Plus (90 kredi). PaperOffice LLM ise bunu şema tabanlı veri çıkarımıyla tamamlar — bir JSON şeması tanımlarsınız ve araç belgelerinizden yapılandırılmış veriyi çıkarır.
İlk bakışta bu etkileyici görünüyor. Ancak daha yakından incelendiğinde temel zayıflıklar ortaya çıkıyor — ve daha da temel bir soru beliriyor: Bu araçlara hâlâ gerçekten ihtiyacımız var mı?
Neden PaperOffice LLM Eskimeye Başlıyor: Claude, GPT ve Benzerleri Bunu Kendileri Yapabiliyor
PaperOffice LLM için rahatsız edici gerçek şu: Modern vision LLM’ler PaperOffice LLM’ı gereksiz bir ara katman hâline getiriyor.
Claude 4, PaperOffice LLM, Gemini 2.5 Pro — tüm bu modeller belgeleri doğrudan işleyebilir. PDF ve görselleri girdi olarak kabul eder, düzeni, tabloları ve yapıyı anlar ve yapılandırılmış çıktı üretir. PaperOffice LLM’ın çoklu ayrıştırma modlarına sahip karmaşık bir iş akışı olarak sunduğu şey bu modeller için yerleşik bir yetenektir.
PaperOffice LLM kendileri de bu eğilimi bloglarında doğruluyor: “Latest modeller kullanılarak ekran görüntüsü alma yoluyla tek atış belge ayrıştırmanın temel seviyesi çok daha iyi hâle geldi.” Saf LLM ayrıştırmasının doğruluğunun dramatik biçimde arttığını kabul ediyorlar.
Bu pratikte ne anlama geliyor?
- Ara katman gerekmez: Claude belgeleri doğrudan anlıyorken neden onları PaperOffice LLM üzerinden gönderesiniz?
- Kredi sistemi gerekmez: Claude veya GPT’ye tek bir API çağrısı token maliyeti oluşturur — kafa karıştırıcı katman seviyeleri olan tescilli bir kredi sistemi yoktur
- Satıcı kilidi yoktur: PaperOffice LLM sizi PaperOffice LLM ekosistemine bağlar. Yerel LLM’ler sağlayıcıdan bağımsızdır
- Bakım gerekmez: v0.6.1’deki ham OCR problemi (GitHub Issue #621) gibi hatalar, yani PaperOffice LLM’ın aniden yapılandırılmış analiz yerine yalnızca ham OCR metni vermesi, yerel LLM API’lerinde yoktur
PaperOffice LLM esasen LLM’lerin etrafına sarılmış bir sarmalayıcıdır — ve alttaki teknoloji olgunlaştığında sarmalayıcılar eskir.
Sınırlayıcı Kutu Problemi: Neden Düz Metin Yeterli Değil
Ancak — ve bu kritik nokta — ne PaperOffice LLM ne de yerel LLM’ler gerçek problemi çözüyor: Enterprise Belge İşleme metinden fazlasını gerektirir.
İronik olarak, PaperOffice LLM’in kendi blogunda “LLM API’leri Tam Belge Ayrıştırıcılar Değildir” başlığı altında tam da bunu savunuyorlar: Saf LLM API’leri güven skorları, sınırlayıcı kutular ve kaynak alıntıları sunmaz. Ancak kendi çözümlerinin de burada ciddi sorunları var:
| Sorun | GitHub Issue | Durum |
|---|---|---|
| Sınırlayıcı kutu yüksekliği yanlış | #368 | Ağustos 2024’ten beri açık |
| BBox değerleri = None → Pydantic çökmesi | #972 | Ekim 2025’te düzeltildi |
| Tablolar için gerçek koordinatlar yerine varsayılan değerler | #442 | Açık |
| Görsel çıkarımı uç durumlarda başarısız oluyor | #528 | Açık |
| Güncellemeden sonra analiz yerine ham OCR | #621 | Açık |
| Çıkarma işleri hata mesajı olmadan başarısız oluyor | #1107 | Açık (Şubat 2026) |
Temel sorun şudur: Kesin sınırlayıcı kutular olmadan belge işleme kurumsal uygulamalar için işe yaramaz. Neden?
- Aranabilir PDF’ler: Koordinatlar olmadan görünmez bir metin katmanı oluşturulamaz
- PII Maskeleme: Piksel hassasiyetli konumlandırma olmadan hiçbir şey doğru şekilde maskelenemez
- Denetim izleri: Kaynak referansları olmadan çıkarım doğrulanamaz
- Human-in-the-Loop: İnceleyiciler çıkarılan bir değerin nereden geldiğini görmelidir
Tablolar, Taramalar ve Enterprise Gereksinimleri
Sınırlayıcı kutu sorunlarının ötesinde, hem PaperOffice LLM hem de saf LLM yaklaşımları ek kurumsal gereksinimlerde başarısız oluyor:
Tablo tanıma: APIScout 2026 benchmark’ına göre PaperOffice LLM, karmaşık çok sütunlu tablolar, birleştirilmiş hücreler ve çok sayfalı tablolar konusunda özel çözümlerin yaklaşık %20 gerisinde kalıyor. Undatas tarafından yapılan bağımsız bir derin inceleme bunu doğruluyor: “PaperOffice LLM, özellikle birleştirilmiş hücreler veya karmaşık başlıklar içeren tablolarla ciddi şekilde zorlanıyor.”
Taramalar ve el yazısı: Düşük çözünürlüklü taranmış belgelerde doğruluk ciddi biçimde düşüyor. Taramalarda formül tanıma? “Oldukça güvenilmez.” El yazısı? Resmî özellik matrisine göre yalnızca “Kısmi”.
Resmî PaperOffice LLM sınırlamaları:
- Sayfa başına en fazla 35 görsel (geri kalanı yok sayılır)
- Sayfa başına en fazla 64 KB metin (geri kalanı kısaltılır)
- En fazla 512 MB dosya boyutu, çıkarım için yalnızca 100 MB
- Çıkarma işi başına en fazla 500 sayfa
- Şema iç içeliği yalnızca 7 seviye derinlikte
- extract_stateless içinde DOCX desteği yok (GitHub #1077)
Karşılaştırmada PaperOffice AI ise:
- 800+ özel LLM — her belge türü için bir tane
- Satır, sütun, birleştirilmiş hücrelerle tablo tanıma — yapılandırılmış dışa aktarma
- AI Vision ile el yazısı tanıma — imzalar, notlar, formlar
- OMR tanıma — onay kutuları, daireler, işaretlemeler, kesin koordinatlarla
- QR ve barkod tanıma dahil
- Otomatik algılamayla 139 dil
Maliyet Karşılaştırması: Credits, Kuruşlar ve Gizli Maliyetler
PaperOffice LLM kredi tabanlı bir fiyatlandırma modeli kullanır. 1.000 kredi 1,25 $ tutar. Başta uygun fiyatlı gibi görünen şey hızla birikir:
| Fonksiyon | PaperOffice LLM Credits | PaperOffice LLM Maliyeti/Sayfa | PaperOffice AI |
|---|---|---|---|
| Basic ayrıştırma | 1 kredi (Fast) | $0.00125 | $0.01 (AI-OCR) |
| Kalite ayrıştırma | 10–45 kredi | $0.013–0.056 | $0.01 (AI-OCR) |
| Premium Agentic | 45–90 kredi | $0.056–0.113 | $0.03 (AI-AI-IDP) |
| Çıkarma | 5–60 kredi | $0.006–0.075 | $0.03 (AI-IDP, dahil) |
Benzer kalitede (Premium/Agentic modu) PaperOffice AI 2–4 kat daha ucuzdur. Ayrıca:
- PaperOffice: Sınırlayıcı kutular, aranabilir PDF, maskeleme dahil
- PaperOffice LLM: Düzen çıkarımı sayfa başına ekstra +3 kredi maliyetlidir
- PaperOffice: Kredi sistemi yok — şeffaf kuruş/sayfa fiyatlandırması
- PaperOffice LLM: Ücretsiz katman ayda 10.000 kredi ile sınırlıdır, ardından üst limitli kullandıkça öde gelir
Premium modunda ayda 100.000 sayfada: PaperOffice LLM = 5.625 $ vs. PaperOffice AI-IDP = 3.000 $. Tasarruf: %47.
PaperOffice AI: Enterprise Belge İşlemenin Gerçekten İhtiyaç Duyduğu Şey
PaperOffice AI, PaperOffice LLM’tan temelde farklı bir yaklaşım benimser. Genel amaçlı LLM’lerin etrafına sarılmış bir sarmalayıcı olmak yerine, PaperOffice üç özel teknolojiyi birleştirir:
1. OCR-LLM Birleşimi: 800+ özel, ince ayarlanmış LLM — her biri fatura, sözleşme, kimlik, sevk irsaliyesi gibi belirli belge türleri üzerinde eğitilmiştir. Tek bir genel modelle her şey çözülmez.
2. Temel Olarak Sınırlayıcı Kutular: Tanınan her öğe — metin, tablo, görsel, el yazısı — tam piksel koordinatları alır. Bu şu olanakları sağlar:
- Aranabilir PDF’ler: Orijinal tarama + görünmez LLM metin katmanı = aranabilir, kopyalanabilir, arşivlenebilir
- PII Maskeleme: Hassas GDPR uyumlu maskeleme — metin arama ve değiştirme değil, piksel hassasiyetli maskeleme
- Human-in-the-Loop: Çıkarılan bir değere tıklayın → orijinalde nerede göründüğünü anında görün
- Denetim İzleri: Her çıkarılan veri noktası izlenebilir ve doğrulanabilir
3. Şablonsuz Sıfır-Atış: Şablon yok, eğitim yok, kural yok. Doğal İnsan İmlemesi — neyi çıkarmak istediğinizi doğal dilde tanımlayın.
Buna ek olarak: AB veri merkezleri, GDPR uyumluluğu, yerinde kurulum seçeneği. PaperOffice LLM her şeyi buluta zorunlu olarak taşırken (48 saatlik önbellekle!), PaperOffice tam veri egemenliği sunar.
| Özellik | PaperOffice LLM | Yerel LLM’ler | PaperOffice AI |
|---|---|---|---|
| Markdown çıktısı | ✅ | ✅ | ✅ |
| Sınırlayıcı kutular | ⚠️ Hatalı | ❌ | ✅ Piksel hassasiyetli |
| Aranabilir PDF | ❌ | ❌ | ✅ |
| PII maskeleme | ❌ | ❌ | ✅ |
| Tablolar (karmaşık) | ⚠️ ~80% | ⚠️ Değişken | ✅ Özel |
| El yazısı | ⚠️ Kısmi | ⚠️ Değişken | ✅ AI Vision |
| Yerinde kurulum | ❌ | ❌ | ✅ |
| GDPR/AB sunucuları | ❌ | ⚠️ | ✅ |
| Fiyat (kurumsal) | $0.056–0.113 | Değişken | $0.01–0.03 |