Niet alleen lezen. |
OCR is gisteren. Onze LLM's begrijpen documenten – extraheren tekst, herkennen structuur, leveren bounding boxes. Markdown-uitvoer voor RAG-klare gegevens.
Klassieke OCR is dood.
Document Intelligence vanaf 1 cent.
Geen abonnement. Geen basistarief. U betaalt alleen wat u gebruikt – 3 niveaus voor elke behoefte.
Basic
Snelle tekstherkenning
- LLM-gebaseerde tekstherkenning
- 139 talen + automatische detectie
- Markdown-uitvoer
- Vertrouwensscores
- Geen bounding boxes
- Geen doorzoekbare PDF
Beste voor: Snelle teksextractie, e-mails, eenvoudige documenten
Nu testenPremium
Bounding Boxes + QR/barcode
- Alles van Basic
- Bounding Boxes (pixel-nauwkeurig)
- QR & barcode detectie
- Geen tabeldetectie
- Geen lay-out analyse
- Geen doorzoekbare PDF
Beste voor: Coördinaat-gebaseerde workflows, redactie, QR-scanning
Nu testenUltra
Volledige documentintelligentie
- Alles van Premium
- Tabeldetectie (gestructureerd)
- Lay-out detectie + leesvolgorde
- Doorzoekbare PDF (sandwich PDF)
- Handschriftherkenning
- Volledige documentintelligentie
Beste voor: Facturen, contracten, legacy-archieven, doorzoekbare PDF's
Nu testenHoe het werkt – elke keer weer
Document uploaden
PDF, scan, afbeelding – elk formaat
OCR-niveau kiezen
basic · premium · ultra
{
"text": "Invoice #2024-0847",
"bbox": [112, 84, 186, 32],
"confidence": 1.0
} Gestructureerd resultaat
Markdown + Bounding Boxes + Doorzoekbare PDF
Hoe wij vergelijken
Prijzen gebaseerd op publiek beschikbare gegevens. Typische instap-prijzen per pagina.
AI-OCR in actie
Bekijk hoe PaperOffice AI-OCR documenten omzet naar doorzoekbare PDFs, Markdown en gestructureerde teksten — meer dan 120 talen.
OCR opnieuw uitgevonden: LLM + Bounding Boxes
Klassieke OCR levert alleen tekst. Onze LLM's begrijpen het document – herkennen lay-out, tabellen, hiërarchieën en leveren exacte coördinaten voor elk element. Perfect voor RAG, compliance en verificatie.
Klassieke OCR is dood.
Iedereen die nog steeds vertrouwt op op regels gebaseerde, domme karakterherkenning, loopt het risico op catastrofale fouten in AI-pipelines, boekhouding en compliance.
Boekhouding & Financiën
Een verkeerd herkend "8" in plaats van "3" in een factuurbedrag kan duizenden euro's schade veroorzaken. Klassieke OCR heeft geen context – het gokt.
€ 8.340,00€ 3.340,00Compliance & Juridisch
Verkeerde IBAN-nummers, verwarde contractgegevens, onjuiste belastingnummers – een enkele OCR-fout kan leiden tot boetes en juridische geschillen.
DE89 3704 0044 O532DE89 3704 0044 0532AI & AI-IDP-pijpleinen
Garbage In, Garbage Out. Als uw AI-pipeline wordt gevoed met defecte OCR-tekst, zijn alle daaropvolgende beslissingen waardeloos. LLM's kunnen geen afval in goud veranderen.
Gezondheidszorg & Geneeskunde
Verwarde doseringen, verkeerde patiëntgegevens, onjuiste bevindingen – in de medische sector kan defecte OCR levensbedreigend zijn.
Dosering: 15mgDosering: 1.5mgKosten besparen op OCR betekent op de verkeerde plaats besparen.
Klassieke OCR herkent blindelings karakters – zonder context, zonder begrip, zonder kwaliteitsborging. LLM-gebaseerde OCR begrijpt het document, herkent verbanden en corrigeert fouten automatisch. Het prijsverschil? Centen. Het kwaliteitsverschil? Werelden van verschil.
Wat PaperOffice AI-OCR
kan doen
LLM + begrenzingsvakken
Andere LLM's leveren alleen tekst. Wij leveren exacte coördinaten voor elk herkend element – de basis voor doorzoekbare PDF en redactie.
Doorzoekbare PDF
Originele scan + onzichtbare LLM-tekstlaag = doorzoekbaar, kopieerbaar, archiveerbaar. Niemand anders kan dit.
Redactie mogelijk
Dankzij bounding boxes: nauwkeurige redactie voor AVG & compliance. Ontdek PII Redactie →
QR- & barcode
Automatische detectie van QR-codes, barcodes, DataMatrix – ideaal voor facturen, leveringsbonnen, labels.
Tabelherkenning
Herkent complexe tabellen met rijen, kolommen, samengevoegde cellen en exporteert ze gestructureerd.
Lay-out Detectie
Kop, voettekst, kolommen, paragrafen, lijsten – volledige documentstructuur wordt herkend.
Handschrift
Handgeschreven notities, handtekeningen, annotaties worden betrouwbaar herkend en geëxtraheerd.
Gestructureerde Markdown
Perfect voor RAG-pipelines: hiërarchieën, tabellen, lijsten – alles netjes gestructureerd.
139 Talen
Van Arabisch tot Chinees. Automatische detectie, meertalige mix in één document.
Waarom OCR zonder bounding boxes
waardeloos is
Veel LLM's en OCR-systemen leveren alleen "doorlopende tekst" – zonder coördinaten. Dat is als een boek zonder paginanummers: nutteloos voor professionele toepassingen.
Zonder Bounding Boxes
Andere aanbieders"Jan Jansen, IBAN: NL91 ABNA 0123 4567 89, Bedrag: 1.250,00 EUR" Waar komt deze informatie vandaan? Welke positie? Welke pagina?
- Geen traceerbaarheid – waar komt de data vandaan?
- Geen redactie mogelijk – wat moet er geredigeerd worden?
- Geen doorzoekbare PDF's – tekst zweeft nergens
- Geen human-in-the-loop – gebruiker kan niet verifiëren
- Geen validatie – komt de waarde overeen met het veld?
Met Bounding Boxes
PaperOffice AI-OCR{
"text": "DE89...",
"label": "IBAN",
"bbox": [120, 340, 380, 365],
"page": 1,
"confidence": 1.0
} Exacte positie, veldtype, pagina, vertrouwen!
- 100% traceerbaar – klik op de waarde, zie het origineel
- Nauwkeurige redactie – IBAN automatisch redigeren
- Echte doorzoekbare PDF's – tekst ligt precies over de afbeelding
- Human-in-the-loop – gebruiker klikt, ziet, verifieert, bevestigt
- Automatische validatie – veldtype komt overeen met de waarde
Onmogelijk zonder bounding boxes:
Elk formaat. Elke bron.
Gescande PDF's
Gescande documenten, ook meerpagina's
Afbeeldingsbestanden
PNG, JPG, TIFF, BMP, WebP
Word / Office
DOCX, XLSX, PPTX met afbeeldingen
URL's & HTML
Screenshots van websites
139 Talen.
Eén API.
Automatische taaldetectie, handmatige taalkeuze of meertalige mix – alles in één document.
Doorzoekbare PDF van analoge documenten –
niemand anders kan dit.
Waarom? Andere LLM's (GPT-4V, Claude, Gemini) kunnen tekst lezen, maar kunnen geen betrouwbare bounding boxes leveren. Zonder exacte coördinaten → geen onzichtbare tekstlaag → geen doorzoekbare PDF.
Alleen wij creëren LLM-gebaseerde doorzoekbare PDF's van gescande documenten – doorzoekbaar, kopieerbaar, archiefconform.
Waar wordt AI-OCR voor gebruikt?
Factuurarchieven digitaliseren
Duizenden gescande facturen omzetten in doorzoekbare archieven. Elke factuur is geïndexeerd en vindbaar.
Contractbeheer
Legacy contracten digitaliseren, clausules extraheren, doorzoekbare PDF's maken voor compliance.
Legacy archieven ontsluiten
Oude bestandsarchieven omzetten in doorzoekbare kennisbanken. Archiveren GoBD-conform.
Compliance & Audit
Documenten audit-proof digitaliseren. Bounding boxes maken bewijs mogelijk voor elke geëxtraheerde waarde.
RAG-pijplijnen
Documenten converteren naar gestructureerde markdown – perfect als input voor LLM-gebaseerde systemen.
AVG Anonimisering
Met bounding boxes: nauwkeurige redactie van persoonsgegevens. Meer informatie →
Elk formaat. Elke use case.
Markdown
Gestructureerde uitvoer voor RAG, LLM's en documentatie.
JSON
Met bounding boxes, vertrouwensscores en metadata.
Sandwich-PDF
Origineel + onzichtbare tekstlaag voor archieven.
Platte Tekst
Pure tekst voor eenvoudige verwerking.
Eén API-aanroep. Alles wat u nodig heeft.
Dit is wat de 'complete' modus retourneert – de meest uitgebreide OCR-reactie die overal beschikbaar is.
{
"ocr_text": "Factuur Nr. RE-2024-0847...",
"ocr_markdown": "# Factuur\n| Pos | Item | Prijs |\n...",
"bounding_boxes": [
{ "text": "RE-2024-0847", "bbox": [112, 84, 186, 32],
"confidence": 1.0, "page": 1 }
],
"table_data": [
{ "rows": 5, "cols": 4, "cells": [...] }
],
"layout_data": [
{ "type": OCR Tekst
Volledige geëxtraheerde tekst met behoud van leesvolgorde.
Gestructureerde Markdown
Koppen, tabellen, lijsten – perfect voor RAG-pipelines.
Begrenzingsvakken
Pixel-perfecte coördinaten voor elk tekstelement.
Tabelgegevens
Gestructureerde tabel extractie met rijen, kolommen, cellen.
Lay-out Analyse
Kop, Voettekst, Tabel, Afbeelding – volledige documentstructuur.
QR & Barcode
Automatische detectie van QR, barcodes, DataMatrix met gedecodeerde gegevens.
Doorzoekbare PDF
Onzichtbare tekstlaag over origineel – archiefklaar.
Handschriftherkenning
Handgeschreven notities en handtekeningen betrouwbaar geëxtraheerd.
API-First. Integratie in minuten.
Geen creditcard. Geen annulering. Geen verplichtingen. Begin gewoon en test. RESTful API met OpenAPI 3.0, Webhooks en complete Postman Collection.
# OCR with Bounding Boxes
curl -X POST https://api.paperoffice.ai/v1/ocr \
-H "Authorization: Bearer $API_KEY" \
-F "[email protected]" \
-F "mode=complete"
# Response
{
"confidence_avg": 1.0,
"markdown": "# Invoice\n**Vendor:** ...",
"bounding_boxes": [
{"text": "Invoice", "bbox": [112, 84, 186, 32]}
],
"searchable_pdf": "base64...",
"layout": ["Header", "Table", "Footer"]
} Uw gegevens. Onze verantwoordelijkheid.
EU-datacenter
100% eigen infrastructuur in de EU. Geen Amerikaanse cloud.
End-to-end Encryptie
AES-256 in rust, TLS 1.3 onderweg.
Gecertificeerd ISO 27001 en SOC 2 Type II in certificering. Tussentijdse audits op aanvraag beschikbaar onder NDA.
AVG, SOC 2 Type II, ISO 27001, HIPAA.
Automatische Verwijdering
Documenten worden onmiddellijk na verwerking verwijderd.
Veelgestelde vragen
Wat is LLM-gebaseerde OCR en hoe verschilt dit van traditionele OCR?
Welke bestandsformaten worden ondersteund?
Wat zijn Begrenzingskaders en waarom heb ik ze nodig?
Hoe accuraat is de OCR-herkenning?
Hoeveel talen ondersteunt de OCR?
Wat kost OCR-verwerking?
Worden mijn documenten veilig verwerkt?
Kan ik de OCR-API integreren in mijn eigen software?
Wat is het verschil tussen doorzoekbare PDF en Markdown-uitvoer?
Hoe worden tabellen in documenten herkend?
Succesverhalen van klanten
Ontdek hoe bedrijven hun processen transformeerden met PaperOffice AI.
Meetbaar Klant Succes
"Enterprise documentbeheer voor al onze mijnbouwoperaties. Wereldklasse."
"Door de FDA gereguleerde farmaceutische labels vereisen een naadloze documentatie. PaperOffice heeft ons goedkeuringsproces teruggebracht van dagen naar uren."
"Technische documentatie en orderverwerking verlopen nu volledig automatisch."
"Digitalisering heeft ons bestuur revolutionair veranderd. Burgervragen worden nu in minuten verwerkt in plaats van dagen."
"Patiëntendossiers, medische rapporten en verwijzingen worden automatisch vastgelegd en geclassificeerd. Ons praktijkteam heeft eindelijk tijd voor de patiënten."
"8.000 medewerkers en dagelijks duizenden gastendocumenten. PaperOffice heeft onze backofficeprocessen volledig gedigitaliseerd."
"Leningaanvragen en compliancedocumenten worden nu in minuten in plaats van uren verwerkt. De regelgevende toetsing verloopt volledig automatisch."
"Bouwprojectdocumentatie en compliance zijn nu digitaal en traceerbaar."
"Check-in formulieren, facturen en gastencommunicatie zijn volledig digitaal. Ons conciergeteam richt zich nu op het verlenen van uitstekende service."
"Tankstationafrekeningen, leveranciersdocumenten en compliancerecords van meer dan 250 stations worden automatisch verwerkt en gearchiveerd."
"GMP-conforme documentatie voor farmaceutische functionele labels is nu volledig geautomatiseerd. Audit trails zijn naadloos en direct toegankelijk."
"Blauwdrukken, vergunningen en klantendossiers voor onze houten huizen worden nu centraal beheerd. Na zes generaties zijn we eindelijk papierloos."
"Leverancierscontracten, certificaten en douanepapieren voor honderden branderijen wereldwijd worden automatisch vastgelegd en aan het juiste product gekoppeld."
"Temperatuurlogboeken, CMR-vrachtbrieven en voedselcertificaten worden automatisch gescand en aan de bestelling gekoppeld. Misallocaties behoren tot het verleden."
"Vergunningen voor zwaar transport, routeplannen en projectdocumentatie zijn nu direct digitaal toegankelijk. Nooit meer zoeken in mappen."
"Douanedocumenten, magazijnbonnen en verzendopdrachten voor ons Oost-Europese netwerk worden automatisch geclassificeerd. Vier generaties logistiek, eindelijk digitaal."
"Printspecificaties, klantgoedkeuringen en materiaalcertificaten zijn nu centraal toegankelijk. Het foutpercentage in de productie is tot bijna nul gedaald."
"Duurzaamheidscertificaten, leverancierscontracten en klantenspecificaties worden automatisch verwerkt. Zwitserse precisie, nu ook digitaal."
"Bouwvergunningen, onderaannemerscontracten en acceptatieprotocollen voor onze commerciële vastgoedobjecten zijn nu volledig digitaal gedocumenteerd."
"Koopovereenkomsten, exposés en klantendossiers van ruim 30 jaar marktleiderschap zijn nu digitaal doorzoekbaar. Elke makelaar vindt alles binnen enkele seconden."
"Zeevrachtdocumenten, douaneaangiften en cognossementen worden automatisch vastgelegd. De logistiek op de Oostzee is nog nooit zo efficiënt geweest."
"Duuzenden aangepaste verpakkingsorders per week met ontwerpkunsten, printgegevens en leveringsdocumenten. PaperOffice houdt alles bij elkaar."
"Pathologie laboratoriumdocumentatie en apparaatcertificeringen verlopen nu volledig automatisch. Naadloze traceerbaarheid voor elk preparaat."
"Leningstukken, zekerheidsdocumenten en klantcorrespondentie worden in minuten in plaats van uren verwerkt. De regelgevende toetsing verloopt naadloos."
"Technische specificaties, kwaliteitscertificaten en recyclingprotocollen voor onze staalproductie zijn centraal en direct toegankelijk."
"Farmaceutische en cosmetische labelspecificaties met regelgevende vereisten worden automatisch gecontroleerd en goedgekeurd. Geen handmatige checklists meer."
"KYC-documenten, investeringsrapporten en regelgevende aanvragen worden in enkele seconden geclassificeerd. Als een door de MAS gereguleerde robo-advisor is naadloze compliance essentieel."
"Veiligheidsinformatiebladen, transportvergunningen en ADR-documenten voor chemische logistiek worden automatisch toegewezen. Nultolerantie voor fouten."
"Certificaten van echtheid, leveranciersgegevens en klantengaranties voor onze parelcollecties worden automatisch gearchiveerd en zijn direct toegankelijk."
"MKB-leningaanvragen, zekerheidsdocumenten en regelgevende rapporten worden automatisch geclassificeerd. Onze adviseurs hebben meer tijd voor klantadvies."
"Klantendossiers uit ruim 135 jaar bankgeschiedenis worden geleidelijk gedigitaliseerd. 5.000 medewerkers hebben nu direct toegang tot alle documenten."
"Microkredietaanvragen en compliancedocumenten voor miljoenen klanten worden nu in minuten in plaats van dagen verwerkt. Een gamechanger voor financiële inclusie."
"Honderdduizenden pakbonnen en retourbonnen per dag worden automatisch verwerkt. Vietnam's toonaangevende e-commerce logistieke dienstverlener, nu papierloos."
"CNC-fabricageprotocollen, materiaalcertificaten en klantenspecificaties voor olie-, gas- en luchtvaartprojecten zijn nu volledig digitaal gedocumenteerd."
"Vision 2030 vereist volledige digitalisering. PaperOffice verwerkt overheidsdocumenten voor de digitale ruggengraat van Saoedi-Arabië."
"Materiaalcertificaten, uithardingsprotocollen en klantenspecificaties worden automatisch aan de juiste bestelling gekoppeld. Australië's enige Q&T-fabrikant, nu papierloos."
"Lasnaadprotocollen, statische berekeningen en projectplannen worden digitaal beheerd. Onze werkplaatsteams hebben in realtime toegang."
"Luchtvaartcertificaten, CNC-programma's en klanttoleranties worden automatisch geclassificeerd. AS9100-compliance was nog nooit zo eenvoudig."
"Handelaarscontracten, KYC-documenten en transactiebewijzen voor honderdduizenden MKB's worden in seconden verwerkt. Mexico's betalingsrevolutie, papierloos."
"Oogstdocumentatie, exportcertificaten en kwaliteitsprotocollen voor onze hooggelegen Malbecs worden automatisch gearchiveerd. 120 jaar wijnbouwtraditie, nu digitaal."
"Miljoenen gebruikersverificaties en regelgevende documenten worden volledig automatisch verwerkt. Opschalen zonder papier."
"Onboardingdocumenten van verkopers en compliancerecords voor Afrika's toonaangevende betalingsprovider worden in minuten in plaats van dagen verwerkt."
"Biologische certificaten, leveranciersaudits en productlabels voor duizenden natuurlijke producten worden automatisch gecontroleerd en gearchiveerd."
"Regelgevende documenten uit 33 Afrikaanse landen, partnercontracten en audit trails worden volledig automatisch beheerd. Een enterprise DMS voor een fintech van $3 miljard."
"Recepten en medicijnbeheer verlopen nu volledig automatisch. Meer tijd voor onze patiënten."
"Eeuwenoude documenten zijn nu digitaal doorzoekbaar. Een mijlpaal voor onze historische archieven."
"Onze verzorgers hebben eindelijk meer tijd voor bewoners in plaats van papierwerk."
"500.000+ dossiers gedigitaliseerd. Onze medewerkers vinden nu alle informatie direct."
"Patiëntdossiers beheren is nu een fluitje van een cent. Alles automatisch vastgelegd en gearchiveerd."
"Erfenis- en nalatenschapsdocumentatie is nu efficiënt en foutloos."
"Digitaal vastgoedbeheer voor al onze wooncomplexen. Huurders en eigenaren zijn enthousiast."
"Met PaperOffice hebben we onze factuurverwerking met 99% versneld. De AI herkent automatisch alle relevante gegevens en wijst deze correct toe."
"PaperOffice is onmisbaar geworden in ons dagelijks werk. Bestellingen, offertes en facturen verlopen nu automatisch."
"De documentatie van onze zorgverlening is nu digitaal en geautomatiseerd. Meer tijd voor onze patiënten."
"Technische tekeningen, stuklijsten en kwaliteitsprotocollen zijn direct doorzoekbaar. Een zoekopdracht die vroeger 30 minuten duurde, duurt nu 30 seconden."
"Kwitanties van klanten, belastingaanslagen en jaarrekeningen worden automatisch gesorteerd en aan de juiste klant toegewezen. Factuurchaos behoort tot het verleden."
"Projectdocumentatie, SLA's en klantcommunicatie voor onze IT-consultingprojecten worden automatisch geclassificeerd en gearchiveerd."
Klaar voor LLM-gebaseerde OCR?
Begin binnen 2 minuten. Geen creditcard, geen installatie.