Bukan hanya membaca. |
OCR sudah ketinggalan zaman. LLM kami memahami dokumen – mengekstrak teks, mengenali struktur, memberikan bounding boxes. Output Markdown untuk data yang siap RAG.
Dipercaya oleh perusahaan terkemuka di seluruh dunia
OCR Klasik sudah mati.
Kecerdasan Dokumen mulai dari 1 sen.
Tanpa langganan. Tanpa biaya dasar. Anda hanya membayar apa yang Anda gunakan – 3 tingkatan untuk setiap kebutuhan.
Dasar
Pengenalan teks cepat
- Pengenalan teks berbasis LLM
- 139 bahasa + deteksi otomatis
- Output Markdown
- Skor keyakinan
- Tidak ada bounding boxes
- Tidak ada PDF yang dapat dicari
Terbaik untuk: Ekstraksi teks cepat, email, dokumen sederhana
Uji sekarangPremium
Kotak pembatas + QR/kode batang
- Semua dari Dasar
- Bounding boxes (akurat piksel)
- Deteksi QR & barcode
- Tidak ada deteksi tabel
- Tidak ada analisis tata letak
- Tidak ada PDF yang dapat dicari
Terbaik untuk: Alur kerja berbasis koordinat, penyuntingan, pemindaian QR
Uji sekarangUltra
Kecerdasan dokumen lengkap
- Semua dari Premium
- Deteksi tabel (terstruktur)
- Deteksi tata letak + urutan baca
- PDF yang dapat dicari (PDF sandwich)
- Pengenalan tulisan tangan
- Kecerdasan dokumen lengkap
Terbaik untuk: Faktur, kontrak, arsip lama, PDF yang dapat dicari
Uji sekarangCara kerjanya – setiap saat
Unggah dokumen
PDF, pindaian, gambar – format apa pun
Pilih tingkatan OCR
dasar · premium · ultra
{
"text": "Rechnung #2024-0847",
"bbox": [112,84,186,32],
"confidence": 1.0
} Hasil terstruktur
Markdown + Bounding Boxes + PDF yang Dapat Dicari
Bagaimana kami dibandingkan
Harga berdasarkan data yang tersedia untuk umum. Harga awal tipikal per halaman.
OCR dibayangkan ulang: LLM + Bounding Boxes
OCR klasik hanya memberikan teks. LLM kami memahami dokumen – mengenali tata letak, tabel, hierarki, dan memberikan koordinat yang tepat untuk setiap elemen. Sempurna untuk RAG, kepatuhan, dan verifikasi.
OCR Klasik sudah mati.
Siapa pun yang masih mengandalkan pengenalan karakter berbasis aturan yang bodoh berisiko mengalami kesalahan katastropik dalam pipeline AI, akuntansi, dan kepatuhan.
Akuntansi & Keuangan
"8" alih-alih "3" yang salah dikenali dalam jumlah faktur dapat menyebabkan kerugian ribuan dolar. OCR klasik tidak memiliki konteks – ia menebak.
$ 8.340,00$ 3.340,00Kepatuhan & Hukum
Nomor IBAN yang salah, data kontrak yang membingungkan, nomor identifikasi pajak yang salah – satu kesalahan OCR dapat menyebabkan denda dan sengketa hukum.
DE89 3704 0044 O532DE89 3704 0044 0532Pipeline AI & IDP
Sampah Masuk, Sampah Keluar. Jika pipeline AI Anda diberi teks OCR yang cacat, semua keputusan selanjutnya tidak berharga. LLM tidak dapat mengubah sampah menjadi emas.
Kesehatan & Kedokteran
Dosis yang membingungkan, data pasien yang salah, temuan yang salah – di bidang medis, OCR yang cacat bisa mengancam jiwa.
Dosis: 15mgDosis: 1.5mgMemotong biaya OCR berarti memotong di tempat yang salah.
OCR klasik mengenali karakter secara membabi buta – tanpa konteks, tanpa pemahaman, tanpa jaminan kualitas. OCR berbasis LLM memahami dokumen, mengenali hubungan, dan memperbaiki kesalahan secara otomatis. Perbedaan harga? Sangat murah. Perbedaan kualitas? Sangat berbeda.
Apa yang dapat dilakukan
PaperOffice AI-OCR
LLM + Kotak Pembatas
LLM lain hanya memberikan teks. Kami memberikan koordinat yang tepat untuk setiap elemen yang dikenali – fondasi untuk PDF yang dapat dicari dan penyuntingan.
PDF yang Dapat Dicari
Pindaian asli + lapisan teks LLM tak terlihat = dapat dicari, dapat disalin, dapat diarsipkan. Tidak ada orang lain yang bisa melakukan ini.
Penyuntingan dimungkinkan
Berkat bounding boxes: penyuntingan yang tepat untuk GDPR & kepatuhan. Temukan Penyuntingan PII →
QR & Kode Batang
Deteksi otomatis kode QR, barcode, DataMatrix – ideal untuk faktur, surat pengiriman, label.
Pengenalan Tabel
Mengenali tabel kompleks dengan baris, kolom, sel gabungan dan mengekspornya secara terstruktur.
Deteksi Tata Letak
Header, footer, kolom, paragraf, daftar – struktur dokumen lengkap dikenali.
Tulisan Tangan
Catatan tulisan tangan, tanda tangan, anotasi dikenali dan diekstrak dengan andal.
Markdown Terstruktur
Sempurna untuk pipeline RAG: hierarki, tabel, daftar – semuanya terstruktur rapi.
139 Bahasa
Dari Arab hingga Cina. Deteksi otomatis, campuran multi-bahasa dalam satu dokumen.
Mengapa OCR tanpa bounding boxes
tidak berharga
Banyak LLM dan sistem OCR hanya memberikan "teks mengalir" – tanpa koordinat. Itu seperti buku tanpa nomor halaman: tidak berguna untuk aplikasi profesional.
Tanpa Bounding Boxes
Penyedia lain"John Smith, IBAN: DE89370400440532013000, Jumlah: 1.250,00 EUR" Dari mana informasi ini berasal? Posisi mana? Halaman mana?
- Tidak ada keterlacakan – dari mana data berasal?
- Tidak ada penyuntingan yang dimungkinkan – apa yang harus disunting?
- Tidak ada PDF yang dapat dicari – teks mengambang di mana-mana
- Tidak ada manusia dalam lingkaran – pengguna tidak dapat memverifikasi
- Tidak ada validasi – apakah nilai cocok dengan bidang?
Dengan Bounding Boxes
PaperOffice AI-OCR{
"text": "DE89...",
"label": "IBAN",
"bbox": [120, 340, 380, 365],
"page": 1,
"confidence": 1.0
} Posisi tepat, jenis bidang, halaman, keyakinan!
- 100% dapat dilacak – klik nilai, lihat aslinya
- Penyuntingan tepat – secara otomatis menyunting IBAN
- PDF yang benar-benar dapat dicari – teks terletak tepat di atas gambar
- Manusia dalam lingkaran – pengguna mengklik, melihat, memverifikasi, mengonfirmasi
- Validasi otomatis – jenis bidang cocok dengan nilai
Tidak mungkin tanpa bounding boxes:
Setiap format. Setiap sumber.
PDF yang Dipindai
Dokumen yang dipindai, juga multi-halaman
File Gambar
PNG, JPG, TIFF, BMP, WebP
Word / Office
DOCX, XLSX, PPTX dengan gambar
URL & HTML
Tangkapan layar situs web
139 Bahasa.
Satu API.
Deteksi bahasa otomatis, pemilihan bahasa manual, atau campuran multi-bahasa – semuanya dalam satu dokumen.
PDF yang dapat dicari dari dokumen analog –
tidak ada orang lain yang bisa melakukan ini.
Mengapa? LLM lain (GPT-4V, Claude, Gemini) dapat membaca teks, tetapi tidak dapat memberikan bounding boxes yang andal. Tanpa koordinat yang tepat → tidak ada lapisan teks tak terlihat → tidak ada PDF yang dapat dicari.
Hanya kami yang membuat PDF yang dapat dicari berbasis LLM dari dokumen yang dipindai – dapat dicari, dapat disalin, sesuai arsip.
Untuk apa AI-OCR digunakan?
Digitalisasi arsip faktur
Ubah ribuan faktur yang dipindai menjadi arsip yang dapat dicari. Setiap faktur diindeks dan dapat ditemukan.
Manajemen kontrak
Digitalisasi kontrak lama, ekstrak klausul, buat PDF yang dapat dicari untuk kepatuhan.
Buka arsip lama
Ubah arsip file lama menjadi basis pengetahuan yang dapat dicari. Arsip sesuai GoBD.
Kepatuhan & Audit
Digitalisasi dokumen secara tahan audit. Bounding boxes memungkinkan bukti untuk setiap nilai yang diekstrak.
Pipeline RAG
Konversi dokumen menjadi markdown terstruktur – sempurna sebagai input untuk sistem berbasis LLM.
Anonimisasi GDPR
Dengan bounding boxes: penyuntingan yang tepat data pribadi. Pelajari lebih lanjut →
Setiap format. Setiap kasus penggunaan.
Markdown
Output terstruktur untuk RAG, LLM, dan dokumentasi.
JSON
Dengan bounding boxes, skor keyakinan, dan metadata.
PDF Sandwich
Asli + lapisan teks tak terlihat untuk arsip.
Teks Biasa
Teks murni untuk pemrosesan sederhana.
Satu panggilan API. Semua yang Anda butuhkan.
Inilah yang dikembalikan oleh mode 'lengkap' – respons OCR paling komprehensif yang tersedia di mana saja.
{
"ocr_text": "Rechnung Nr. RE-2024-0847...",
"ocr_markdown": "# Rechnung\n| Pos | Artikel | Preis |\n...",
"bounding_boxes": [
{ "text": "RE-2024-0847", "bbox": [112, 84, 186, 32],
"confidence": 1.0, "page": 1 }
],
"table_data": [
{ "rows": 5, "cols": 4, "cells": [...] }
],
"layout_data": [
{ "type": "Header", "bbox": [0, 0, 595, 120] },
{ "type": "Table", "bbox": [40, 200, 555, 450] }
],
"language": "de",
"qr_barcode": [
{ "type": "QR", "data": "https://...", "bbox": [...] }
],
"summary": "Rechnung der Telekom AG über 1.234,56€",
"searchable_pdf": "base64://...",
"pages_processed": 3,
"processing_time_ms": 2847
} Teks OCR
Teks lengkap yang diekstrak dengan urutan baca dipertahankan.
Markdown Terstruktur
Judul, tabel, daftar – sempurna untuk pipeline RAG.
Kotak Pembatas
Koordinat akurat piksel untuk setiap elemen teks.
Data Tabel
Ekstraksi tabel terstruktur dengan baris, kolom, sel.
Analisis Tata Letak
Header, Footer, Tabel, Gambar – struktur dokumen lengkap.
QR & Kode Batang
Deteksi otomatis QR, barcode, DataMatrix dengan data yang didekode.
PDF yang Dapat Dicari
Lapisan teks tak terlihat di atas asli – siap arsip.
Pengenalan Tulisan Tangan
Catatan tulisan tangan dan tanda tangan diekstrak dengan andal.
API-First. Integrasi dalam hitungan menit.
Tanpa kartu kredit. Tanpa pembatalan. Tanpa syarat. Mulai dan uji saja. API RESTful dengan OpenAPI 3.0, Webhook, dan Koleksi Postman lengkap.
# OCR with Bounding Boxes
curl -X POST https://api.paperoffice.ai/v1/ocr \
-H "Authorization: Bearer $API_KEY" \
-F "file=@document.pdf" \
-F "mode=complete"
# Response
{
"confidence_avg": 1.0,
"markdown": "# Rechnung\n**Vendor:** ...",
"bounding_boxes": [
{"text": "Rechnung", "bbox": [112, 84, 186, 32]}
],
"searchable_pdf": "base64...",
"layout": ["Header", "Table", "Footer"]
} Data Anda. Tanggung jawab kami.
Pusat Data UE
100% infrastruktur sendiri di UE. Tanpa cloud AS.
Enkripsi Ujung ke Ujung
AES-256 saat istirahat, TLS 1.3 saat transit.
Bersertifikat
GDPR, SOC 2 Tipe II, ISO 27001, HIPAA.
Penghapusan Otomatis
Dokumen dihapus segera setelah diproses.
Pertanyaan yang Sering Diajukan
Apa itu OCR berbasis LLM dan bagaimana perbedaannya dengan OCR tradisional?
Format file apa saja yang didukung?
Apa itu Kotak Pembatas dan mengapa saya membutuhkannya?
Seberapa akurat pengenalan OCR?
Berapa banyak bahasa yang didukung oleh OCR?
Berapa biaya pemrosesan OCR?
Apakah dokumen saya diproses dengan aman?
Dapatkah saya mengintegrasikan API OCR ke dalam perangkat lunak saya sendiri?
Apa perbedaan antara PDF yang dapat dicari dan output Markdown?
Bagaimana tabel dalam dokumen dikenali?
Kisah Sukses Pelanggan
Temukan bagaimana bisnis mentransformasi proses mereka dengan PaperOffice AI.
Bukti Keberhasilan Pelanggan yang Terukur
"Manajemen dokumen perusahaan untuk semua operasi pertambangan kami. Kelas dunia."
"Label farmasi yang diatur FDA memerlukan dokumentasi yang lengkap tanpa celah. PaperOffice telah mengurangi proses persetujuan kami dari hitungan hari menjadi jam."
"Dokumentasi teknis dan pemrosesan pesanan kini berjalan sepenuhnya otomatis."
"Digitalisasi telah merevolusi administrasi kami. Pertanyaan warga kini diproses dalam hitungan menit, bukan hari."
"Rekam medis pasien, hasil pemeriksaan, dan surat rujukan ditangkap dan diklasifikasikan secara otomatis. Tim praktik kami akhirnya memiliki waktu untuk pasien."
"8.000 karyawan, ribuan dokumen tamu setiap hari. PaperOffice telah mendigitalisasi sepenuhnya proses back-office kami."
"Pengajuan kredit dan dokumen kepatuhan kini diproses dalam hitungan menit, bukan jam. Pemeriksaan regulasi berjalan sepenuhnya otomatis."
"Dokumentasi proyek konstruksi dan kepatuhan kini digital dan dapat dilacak."
"Formulir check-in, faktur, dan komunikasi dengan tamu sepenuhnya digital. Tim concierge kami kini berfokus pada layanan yang luar biasa."
"Tagihan pompa bensin, dokumen pemasok, dan dokumen kepatuhan dari lebih dari 250 stasiun diproses dan diarsipkan secara otomatis."
"Dokumentasi yang sesuai GMP untuk label fungsional farmasi kini berjalan sepenuhnya otomatis. Jejak audit lengkap dan dapat diakses segera."
"Denah bangunan, izin, dan dossier pelanggan untuk rumah kayu kami kini dikelola secara terpusat. Akhirnya bebas kertas di generasi ke-6."
"Kontrak pemasok, sertifikat, dan dokumen bea cukai untuk ratusan tempat pemanggangan di seluruh dunia ditangkap secara otomatis dan ditugaskan ke produk yang tepat."
"Bukti suhu, surat jalan CMR, dan sertifikat makanan dipindai secara otomatis dan ditugaskan ke pesanan. Kesalahan penugasan adalah masa lalu."
"Izin transportasi berat, rencana rute, dan dokumentasi proyek kini dapat diakses secara digital dengan segera. Tidak ada lagi pencarian map."
"Dokumen bea cukai, surat gudang, dan pesanan pengiriman untuk jaringan Eropa Timur kami diklasifikasikan secara otomatis. Empat generasi logistik, akhirnya digital."
"Spesifikasi pencetakan, persetujuan pelanggan, dan sertifikat material kini dapat diakses secara terpusat. Tingkat kesalahan dalam produksi telah turun hingga mendekati nol."
"Sertifikat keberlanjutan, kontrak pemasok, dan spesifikasi pelanggan diproses secara otomatis. Presisi Swiss, kini juga digital."
"Izin konstruksi, kontrak subkontraktor, dan berita acara serah terima untuk properti komersial kami kini terdokumentasi secara digital tanpa celah."
"Kontrak jual beli, eksposé, dan dossier pelanggan untuk kepemimpinan pasar selama 30+ tahun kini dapat dicari secara digital. Setiap agen properti menemukan semuanya dalam hitungan detik."
"Dokumen pengiriman laut, deklarasi bea cukai, dan konosemen ditangkap secara otomatis. Logistik Laut Baltik belum pernah seefisien ini."
"Ribuan pesanan kemasan kustom per minggu dengan persetujuan desain, data cetak, dan dokumen pengiriman. PaperOffice menyatukan semuanya."
"Dokumentasi laboratorium patologi dan sertifikasi peralatan kini berjalan sepenuhnya otomatis. Ketertelusuran lengkap untuk setiap preparat."
"Dokumen kredit, dokumen jaminan, dan korespondensi pelanggan diproses dalam hitungan menit, bukan jam. Pemeriksaan regulasi lengkap tanpa celah."
"Spesifikasi teknis, sertifikat kualitas, dan protokol daur ulang untuk produksi baja kami terpusat dan dapat diakses segera."
"Spesifikasi label farmasi dan kosmetik dengan persyaratan regulasi diperiksa dan disetujui secara otomatis. Tidak ada lagi daftar periksa manual."
"Dokumen KYC, laporan investasi, dan pengajuan regulasi diklasifikasikan dalam hitungan detik. Sebagai penasihat robo yang diatur MAS, kepatuhan yang lengkap tanpa celah sangat penting."
"Lembar data keselamatan, izin transportasi, dan dokumen ADR untuk logistik kimia ditugaskan secara otomatis. Toleransi nol terhadap kesalahan."
"Sertifikat keaslian, bukti pemasok, dan garansi pelanggan untuk koleksi mutiara kami diarsipkan secara otomatis dan dapat diakses segera."
"Pengajuan kredit UKM, dokumen jaminan, dan laporan regulasi diklasifikasikan secara otomatis. Konsultan kami memiliki lebih banyak waktu untuk konsultasi pelanggan."
"Rekam nasabah dari lebih dari 135 tahun sejarah bank didigitalisasi secara bertahap. 5.000 karyawan kini dapat mengakses semua dokumen dengan segera."
"Pengajuan kredit mikro dan dokumen kepatuhan untuk jutaan pelanggan kini diproses dalam hitungan menit, bukan hari. Sebuah perubahan besar bagi inklusi keuangan."
"Ratusan ribu surat jalan dan bukti retur per hari diproses secara otomatis. Perusahaan logistik e-commerce terkemuka di Vietnam, kini bebas kertas."
"Protokol manufaktur CNC, sertifikat material, dan spesifikasi pelanggan untuk proyek minyak, gas, dan penerbangan kini terdokumentasi secara digital tanpa celah."
"Visi 2030 memerlukan digitalisasi penuh. PaperOffice memproses dokumen pemerintah untuk tulang punggung digital Arab Saudi."
"Sertifikat material, protokol pengerasan, dan spesifikasi pelanggan ditugaskan secara otomatis ke pesanan yang tepat. Satu-satunya produsen Q&T di Australia, kini bebas kertas."
"Protokol las, perhitungan statis, dan rencana proyek dikelola secara digital. Tim bengkel kami memiliki akses secara real-time."
"Sertifikat dirgantara, program CNC, dan toleransi pelanggan diklasifikasikan secara otomatis. Kepatuhan AS9100 belum pernah semudah ini."
"Kontrak pedagang, dokumen KYC, dan bukti transaksi untuk ratusan ribu UKM diproses dalam hitungan detik. Revolusi pembayaran Meksiko, bebas kertas."
"Dokumentasi panen, sertifikat ekspor, dan protokol kualitas untuk anggur Malbec dataran tinggi kami diarsipkan secara otomatis. 120 tahun tradisi pembuatan anggur, kini digital."
"Jutaan verifikasi pengguna dan dokumen regulasi diproses sepenuhnya otomatis. Skalasi tanpa kertas."
"Dokumen onboarding pedagang dan bukti kepatuhan untuk penyedia pembayaran terkemuka di Afrika diproses dalam hitungan menit, bukan hari."
"Sertifikat organik, audit pemasok, dan label produk untuk ribuan produk alami diperiksa dan diarsipkan secara otomatis."
"Dokumen regulasi dari 33 negara Afrika, kontrak mitra, dan jejak audit dikelola sepenuhnya otomatis. DMS tingkat perusahaan untuk Fintech senilai $3 miliar."
"Resep dan manajemen obat kini berjalan sepenuhnya otomatis. Lebih banyak waktu untuk pasien kami."
"Dokumen berusia berabad-abad kini dapat dicari secara digital. Tonggak penting bagi arsip historis kami."
"Pengasuh kami akhirnya punya lebih banyak waktu untuk penghuni daripada pekerjaan kertas."
"500.000+ berkas terdigitalisasi. Petugas kami kini menemukan semua informasi seketika."
"Manajemen rekam medis kini sangat mudah. Semuanya otomatis ditangkap dan diarsipkan."
"Dokumentasi warisan dan harta benda kini efisien dan bebas kesalahan."
"Manajemen properti digital untuk semua kompleks perumahan kami. Penyewa dan pemilik sangat puas."
"Dengan PaperOffice, kami telah mempercepat pemrosesan faktur kami sebesar 99%. AI secara otomatis mengenali semua data yang relevan dan menetapkannya dengan benar."
"PaperOffice tidak dapat dipisahkan dari rutinitas kerja kami. Pesanan, penawaran, dan faktur kini berjalan secara otomatis."
"Dokumentasi layanan perawatan kami kini digital dan otomatis. Lebih banyak waktu untuk pasien kami."
"Gambar teknis, daftar bahan, dan protokol kualitas segera ditemukan. Pencarian yang dulu memakan waktu 30 menit, kini hanya butuh 30 detik."
"Bukti klien, keputusan pajak, dan laporan tahunan disortir secara otomatis dan ditugaskan ke klien yang tepat. Kekacauan dokumen adalah masa lalu."
"Dokumentasi proyek, SLA, dan komunikasi pelanggan untuk proyek konsultasi IT kami diklasifikasikan dan diarsipkan secara otomatis."
Siap untuk OCR Berbasis LLM?
Mulai dalam 2 menit. Tanpa kartu kredit, tanpa instalasi.