Nicht nur lesen. |
OCR war gestern. Unsere LLMs verstehen Dokumente – extrahieren Text, erkennen Struktur, liefern Bounding Boxes. Markdown Output für RAG-ready Daten.
Klassisches OCR ist tot.
Document Intelligence ab 1 Cent.
Kein Abo. Keine Grundgebühr. Sie zahlen nur was Sie nutzen – 3 Tiers für jeden Bedarf.
Basic
Schnelle Texterkennung
- LLM-basierte Texterkennung
- 139 Sprachen + Auto-Detection
- Markdown-Output
- Zuverlässigkeitswerte
- Keine Bounding Boxes
- Kein Searchable PDF
Ideal für: Schnelle Textextraktion, E-Mails, einfache Dokumente
Jetzt testenPremium
Bounding Boxes + QR/Barcode
- Alles aus Basic
- Bounding Boxes (pixelgenau)
- QR- & Barcode-Erkennung
- Keine Tabellenerkennung
- Keine Layout-Analyse
- Kein Searchable PDF
Ideal für: Koordinaten-basierte Workflows, Redaction, QR-Scanning
Jetzt testenUltra
Volle Document Intelligence
- Alles aus Premium
- Tabellenerkennung (strukturiert)
- Layout Detection + Lesereihenfolge
- Searchable PDF (Sandwich-PDF)
- Handschrifterkennung
- Volle Dokumentenintelligenz
Ideal für: Rechnungen, Verträge, Legacy-Archive, Searchable PDFs
Jetzt testenSo funktioniert's – jedes Mal
Dokument hochladen
PDF, Scan, Bild – jedes Format
OCR-Tier wählen
basic · premium · ultra
{
"text": "Rechnung #2024-0847",
"bbox": [112, 84, 186, 32],
"confidence": 1.0
} Strukturiertes Ergebnis
Markdown + Bounding Boxes + Durchsuchbares PDF
So vergleichen wir uns
Preise basierend auf öffentlich verfügbaren Daten. Typische Einstiegspreise pro Seite.
OCR neu gedacht: LLM + Bounding Boxes
Klassische OCR liefert nur Text. Unsere LLMs verstehen das Dokument – erkennen Layout, Tabellen, Hierarchien und liefern exakte Koordinaten für jedes Element. Perfekt für RAG, Compliance und Verification.
Klassisches OCR ist tot.
Wer heute noch auf regelbasierte, stumpfe Zeichenerkennung setzt, riskiert katastrophale Fehler in AI-Pipelines, Buchhaltung und Compliance.
Buchhaltung & Finanzen
Eine falsch erkannte „8“ statt „3“ in einem Rechnungsbetrag kann tausende Euro Schaden verursachen. Klassisches OCR kennt keinen Kontext – es rät.
€ 8.340,00€ 3.340,00Compliance & Recht
Falsche IBAN-Nummern, verwechselte Vertragsdaten, fehlerhafte Steuer-IDs – ein einziger OCR-Fehler kann zu Bußgeldern und Rechtsstreitigkeiten führen.
DE89 3704 0044 O532DE89 3704 0044 0532AI & AI-IDP Pipelines
Garbage In, Garbage Out. Wenn Ihre AI-Pipeline mit fehlerhaftem OCR-Text gefüttert wird, sind alle nachfolgenden Entscheidungen wertlos. LLMs können Müll nicht in Gold verwandeln.
Healthcare & Medizin
Verwechselte Dosierungen, falsche Patientendaten, fehlerhafte Befunde – im medizinischen Bereich kann fehlerhaftes OCR lebensgefährlich sein.
Dosierung: 15mgDosierung: 1,5mgWer bei OCR spart, spart an der falschen Stelle.
Klassisches OCR erkennt stumpf Zeichen – ohne Kontext, ohne Verständnis, ohne Qualitätssicherung. LLM-basierte OCR versteht das Dokument, erkennt Zusammenhänge und korrigiert Fehler automatisch. Der Preisunterschied? Centbeträge. Der Qualitätsunterschied? Welten.
Was PaperOffice AI-OCR
alles kann
LLM + Begrenzungsrahmen
Andere LLMs liefern nur Text. Wir liefern exakte Koordinaten für jedes erkannte Element – die Basis für Searchable PDF und Redaction.
Durchsuchbares PDF
Original-Scan + unsichtbare LLM-Textschicht = durchsuchbar, kopierbar, archivierbar. Das kann sonst niemand.
Redaction möglich
Dank Bounding Boxes: präzise Schwärzung für DSGVO & Compliance. PII Redaction entdecken →
QR & Barcode
Automatische Erkennung von QR-Codes, Barcodes, DataMatrix – ideal für Rechnungen, Lieferscheine, Etiketten.
Tabellen-Erkennung
Erkennt komplexe Tabellen mit Zeilen, Spalten, Merged Cells und exportiert sie strukturiert.
Layout-Erkennung
Header, Footer, Spalten, Absätze, Listen – vollständige Dokumentstruktur wird erkannt.
Handschrift
Handgeschriebene Notizen, Unterschriften, Anmerkungen werden erkannt und extrahiert.
Strukturierter Markdown
Perfekt für RAG-Pipelines: Hierarchien, Tabellen, Listen – alles sauber strukturiert.
139 Sprachen
Von Arabisch bis Chinesisch. Automatische Erkennung, Multi-Language-Mix in einem Dokument.
Warum OCR ohne Bounding Boxes
wertlos ist
Viele LLMs und OCR-Systeme liefern nur "Fließtext" – ohne Koordinaten. Das ist wie ein Buch ohne Seitenzahlen: nutzlos für professionelle Anwendungen.
Ohne Bounding Boxes
Andere Anbieter"Max Mustermann, IBAN: DE89370400440532013000, Betrag: 1.250,00 EUR" Woher stammt diese Info? Welche Position? Welche Seite?
- Keine Nachvollziehbarkeit – woher stammen die Daten?
- Keine Schwärzung möglich – was soll geschwärzt werden?
- Keine durchsuchbaren PDFs – Text schwebt im Nichts
- Kein Human-in-the-Loop – Anwender kann nicht prüfen
- Keine Validierung – passt der Wert zum Feld?
Mit Bounding Boxes
PaperOffice AI-OCR{
"text": "DE89...",
"label": "IBAN",
"bbox": [120, 340, 380, 365],
"page": 1,
"confidence": 1.0
} Exakte Position, Feldtyp, Seite, Confidence!
- 100% nachvollziehbar – Wert anklicken, Original sehen
- Präzise Schwärzung – IBAN automatisch schwärzen
- Echte durchsuchbare PDFs – Text liegt exakt über dem Bild
- Human-in-the-Loop – Anwender klickt, sieht, prüft, bestätigt
- Automatische Validierung – Feldtyp passt zum Wert
Ohne Bounding Boxes unmöglich:
Jedes Format. Jede Quelle.
Gescannte PDFs
Gescannte Dokumente, auch mehrseitig
Bilddateien
PNG, JPG, TIFF, BMP, WebP
Word / Office
DOCX, XLSX, PPTX mit Bildern
URLs & HTML
Screenshots von Webseiten
139 Sprachen.
Eine API.
Automatische Spracherkennung, manuelle Sprachauswahl oder Multi-Language-Mix – alles in einem Dokument.
Searchable PDF aus analogen Dokumenten –
das kann sonst niemand.
Warum? Andere LLMs (GPT-4V, Claude, Gemini) können zwar Text lesen, aber keine zuverlässigen Bounding Boxes liefern. Ohne exakte Koordinaten → keine unsichtbare Textschicht → kein Searchable PDF.
Nur wir erstellen LLM-basierte Searchable PDFs aus gescannten Dokumenten – durchsuchbar, kopierbar, archivkonform.
Wofür wird AI-OCR eingesetzt?
Rechnungsarchive digitalisieren
Tausende gescannte Rechnungen in durchsuchbare Archive verwandeln. Jede Rechnung wird indexiert und findbar.
Vertragsmanagement
Legacy-Verträge digitalisieren, Klauseln extrahieren, Searchable PDFs für Compliance erstellen.
Legacy-Archive erschließen
Alte Aktenbestände in durchsuchbare Wissensbasen transformieren. GoBD-konform archivieren.
Compliance & Audit
Dokumente revisionssicher digitalisieren. Bounding Boxes ermöglichen Nachweis für jeden extrahierten Wert.
RAG-Pipelines
Dokumente in strukturierten Markdown umwandeln – perfekt als Input für LLM-basierte Systeme.
DSGVO-Anonymisierung
Mit Bounding Boxes: präzise Schwärzung personenbezogener Daten. Mehr erfahren →
Jedes Format. Jeder Anwendungsfall.
Markdown
Strukturierter Output für RAG, LLMs und Dokumentation.
JSON
Mit Bounding Boxes, Confidence Scores und Metadaten.
Sandwich-PDF
Original + unsichtbare Textschicht für Archive.
Klartext
Reiner Text für einfache Weiterverarbeitung.
Ein API-Call. Alles was Sie brauchen.
Das liefert der 'Ultra'-Tier zurück – die umfassendste OCR-Response die es gibt.
{
"ocr_text": "Rechnung Nr. RE-2024-0847...",
"ocr_markdown": "# Rechnung\n| Pos | Artikel | Preis |\n...",
"bounding_boxes": [
{ "text": "RE-2024-0847", "bbox": [112, 84, 186, 32],
"confidence": 1.0, "page": 1 }
],
"table_data": [
{ "rows": 5, "cols": 4, "cells": [...] }
],
"layout_data": [
{ "type": "Header", "bbox": [0, 0, 595, 120] },
{ "type": "Table", "bbox": [40, 200, 555, 450] }
],
"language": "de",
"qr_barcode": [
{ "type": "QR", "data": "https://...", "bbox": [...] }
],
"summary": "Rechnung der Telekom AG über 1.234,56€",
"searchable_pdf": "base64://...",
"pages_processed": 3,
"processing_time_ms": 2847
} OCR-Text
Vollständig extrahierter Text mit erhaltener Lesereihenfolge.
Strukturierter Markdown
Überschriften, Tabellen, Listen – perfekt für RAG-Pipelines.
Begrenzungsrahmen
Pixel-genaue Koordinaten für jedes Textelement.
Tabellen-Daten
Strukturierte Tabellenextraktion mit Zeilen, Spalten, Zellen.
Layout-Analyse
Header, Footer, Tabelle, Bild – vollständige Dokumentstruktur.
QR & Barcode
Auto-Erkennung von QR, Barcodes, DataMatrix mit dekodierten Daten.
Durchsuchbares PDF
Unsichtbare Textschicht über dem Original – archivbereit.
Handschrift-Erkennung (Experimentell)
Handgeschriebene Notizen und Unterschriften werden erkannt – als experimentelles Feature.
AI-First API. Start in 5 Minuten.
Keine Kreditkarte. Keine Kündigung. Keine Verpflichtung. Einfach starten und testen. RESTful API mit OpenAPI 3.0, Webhooks und vollständiger Postman Collection.
# OCR with Bounding Boxes
curl -X POST https://api.paperoffice.ai/v1/ocr \
-H "Authorization: Bearer $API_KEY" \
-F "file=@document.pdf" \
-F "mode=complete"
# Response
{
"confidence_avg": 1.0,
"markdown": "# Rechnung\n**Vendor:** ...",
"bounding_boxes": [
{"text": "Rechnung", "bbox": [112, 84, 186, 32]}
],
"searchable_pdf": "base64...",
"layout": ["Header", "Table", "Footer"]
} Ihre Daten. Unsere Verantwortung.
EU-Datacenter
100% eigene Infrastruktur in der EU (Spanien). Keine US-Cloud, kein AWS, kein Azure.
Ende-zu-Ende Verschlüsselung
AES-256 im Ruhezustand, TLS 1.3 während der Übertragung.
Zertifiziert
DSGVO, SOC 2 Type II, ISO 27001, HIPAA.
Automatische Löschung
Dokumente werden sofort nach Verarbeitung gelöscht.
Häufig gestellte Fragen
Was ist LLM-basierte OCR und wie unterscheidet sie sich von klassischer OCR?
Welche Dateiformate werden unterstützt?
Was sind Bounding Boxes und wofür brauche ich sie?
Wie genau ist die OCR-Erkennung?
In wie vielen Sprachen funktioniert die OCR?
Was kostet die OCR-Verarbeitung?
Werden meine Dokumente sicher verarbeitet?
Kann ich die OCR-API in meine eigene Software integrieren?
Was ist der Unterschied zwischen durchsuchbarem PDF und Markdown-Output?
Wie werden Tabellen in Dokumenten erkannt?
Erfolgsgeschichten unserer Kunden
Entdecken Sie, wie Unternehmen mit PaperOffice AI ihre Prozesse transformiert haben.
Messbare Erfolge unserer Kunden
"Enterprise-Dokumentenmanagement für unsere gesamten Bergbauoperationen. Weltklasse."
"FDA-regulierte Pharma-Labels erfordern lückenlose Dokumentation. PaperOffice hat unseren Freigabeprozess von Tagen auf Stunden reduziert."
"Technische Dokumentation und Auftragsverarbeitung laufen jetzt vollautomatisch."
"Die Digitalisierung hat unsere Verwaltung revolutioniert. Bürgeranfragen werden jetzt in Minuten statt Tagen bearbeitet."
"Patientenakten, Befunde und Überweisungen werden automatisch erfasst und klassifiziert. Unser Praxisteam hat endlich Zeit für die Patienten."
"8.000 Mitarbeiter, täglich tausende Gäste-Dokumente. PaperOffice hat unsere Back-Office-Prozesse komplett digitalisiert."
"Kreditanträge und Compliance-Dokumente werden jetzt in Minuten statt Stunden verarbeitet. Die regulatorische Prüfung läuft vollautomatisch."
"Bauprojektdokumentation und Compliance sind jetzt digital und nachvollziehbar."
"Check-in-Formulare, Rechnungen und Gästekommunikation sind volldigital. Unser Concierge-Team konzentriert sich jetzt auf exzellenten Service."
"Tankstellenabrechnungen, Lieferantendokumente und Compliance-Unterlagen aus 250+ Stationen werden automatisch verarbeitet und archiviert."
"GMP-konforme Dokumentation für pharmazeutische Funktionsetiketten läuft jetzt vollautomatisch. Audit-Trails sind lückenlos und sofort abrufbar."
"Baupläne, Genehmigungen und Kundendossiers für unsere Holzhäuser werden jetzt zentral verwaltet. In der 6. Generation endlich papierlos."
"Lieferantenverträge, Zertifikate und Zollpapiere für hunderte Röstereien weltweit werden automatisch erfasst und dem richtigen Produkt zugeordnet."
"Temperaturnachweise, CMR-Frachtbriefe und Lebensmittel-Zertifikate werden automatisch gescannt und dem Auftrag zugeordnet. Fehlzuordnungen sind Geschichte."
"Schwertransport-Genehmigungen, Routenpläne und Projektdokumentation sind jetzt sofort digital abrufbar. Kein Ordner-Suchen mehr."
"Zolldokumente, Lagerscheine und Speditionsaufträge für unser Osteuropa-Netzwerk werden automatisch klassifiziert. Vier Generationen Logistik, endlich digital."
"Druckspezifikationen, Kundenfreigaben und Materialzertifikate sind jetzt zentral abrufbar. Die Fehlerquote in der Produktion ist gegen Null gesunken."
"Nachhaltigkeitszertifikate, Lieferantenverträge und Kundenspezifikationen werden automatisch verarbeitet. Schweizer Präzision, jetzt auch digital."
"Baugenehmigungen, Subunternehmer-Verträge und Abnahmeprotokolle für unsere Gewerbeimmobilien sind jetzt lückenlos digital dokumentiert."
"Kaufverträge, Exposés und Kundendossiers für 30+ Jahre Marktführerschaft sind jetzt digital durchsuchbar. Jeder Makler findet alles in Sekunden."
"Seefracht-Dokumente, Zollerklärungen und Konnossemente werden automatisch erfasst. Die Ostsee-Logistik war noch nie so effizient."
"Tausende Custom-Packaging-Aufträge pro Woche mit Designfreigaben, Druckdaten und Lieferdokumenten. PaperOffice hält alles zusammen."
"Pathologie-Labordokumentation und Gerätezertifizierungen laufen jetzt vollautomatisch. Lückenlose Rückverfolgbarkeit für jedes Präparat."
"Kreditunterlagen, Sicherheitendokumente und Kundenkorrespondenz werden in Minuten statt Stunden verarbeitet. Die regulatorische Prüfung ist lückenlos."
"Technische Spezifikationen, Qualitätszeugnisse und Recycling-Protokolle für unsere Stahlproduktion sind zentral und sofort abrufbar."
"Pharma- und Kosmetik-Labelspezifikationen mit regulatorischen Anforderungen werden automatisch geprüft und freigegeben. Keine manuellen Checklisten mehr."
"KYC-Dokumente, Anlageberichte und regulatorische Filings werden in Sekunden klassifiziert. Als MAS-regulierter Robo-Advisor ist lückenlose Compliance essenziell."
"Sicherheitsdatenblätter, Transportgenehmigungen und ADR-Dokumente für Chemie-Logistik werden automatisch zugeordnet. Null Toleranz für Fehler."
"Echtheitszertifikate, Lieferantennachweise und Kundengarantien für unsere Perlen-Kollektionen werden automatisch archiviert und sofort abrufbar."
"KMU-Kreditanträge, Sicherungsdokumente und regulatorische Reports werden automatisch klassifiziert. Unsere Berater haben mehr Zeit für Kundenberatung."
"Kundenakten aus 135+ Jahren Bankgeschichte werden sukzessive digitalisiert. 5.000 Mitarbeiter greifen jetzt sofort auf alle Dokumente zu."
"Mikrokredit-Anträge und Compliance-Dokumente für Millionen von Kunden werden jetzt in Minuten statt Tagen verarbeitet. Ein Gamechanger für Financial Inclusion."
"Hunderttausende Lieferscheine und Retourenbelege pro Tag werden automatisch verarbeitet. Vietnams führender E-Commerce-Logistiker, jetzt papierlos."
"CNC-Fertigungsprotokolle, Materialzertifikate und Kundenspezifikationen für Öl-, Gas- und Luftfahrtprojekte sind jetzt lückenlos digital dokumentiert."
"Vision 2030 erfordert vollständige Digitalisierung. PaperOffice verarbeitet Regierungsdokumente für den digitalen Backbone Saudi-Arabiens."
"Werkstoffzeugnisse, Härtungsprotokolle und Kundenspezifikationen werden automatisch dem richtigen Auftrag zugeordnet. Australiens einziger Q&T-Hersteller, jetzt papierlos."
"Schweißnahtprotokolle, Statikberechnungen und Projektpläne werden digital verwaltet. Unsere Werkstatt-Teams haben Zugriff in Echtzeit."
"Aerospace-Zertifikate, CNC-Programme und Kundentoleranzen werden automatisch klassifiziert. AS9100-Compliance war noch nie so einfach."
"Händlerverträge, KYC-Dokumente und Transaktionsbelege für hunderttausende KMU werden in Sekunden verarbeitet. Mexikos Payment-Revolution, papierlos."
"Erntedokumentation, Exportzertifikate und Qualitätsprotokolle für unsere Höhen-Malbecs werden automatisch archiviert. 120 Jahre Weinbau-Tradition, jetzt digital."
"Millionen von Nutzer-Verifizierungen und regulatorische Dokumente werden vollautomatisch verarbeitet. Skalierung ohne Papier."
"Händler-Onboarding-Dokumente und Compliance-Nachweise für Afrikas führenden Payment-Anbieter werden in Minuten statt Tagen verarbeitet."
"Bio-Zertifikate, Lieferanten-Audits und Produktlabels für tausende Naturprodukte werden automatisch geprüft und archiviert."
"Regulatorische Dokumente aus 33 afrikanischen Ländern, Partner-Verträge und Audit-Trails werden vollautomatisch verwaltet. Enterprise-DMS für ein $3-Mrd.-Fintech."
"Rezepte und Medikamentenverwaltung laufen jetzt vollautomatisch. Mehr Zeit für unsere Patienten."
"Jahrhundertealte Dokumente sind jetzt digital durchsuchbar. Ein Meilenstein für unsere historischen Archive."
"Unsere Pflegekräfte haben endlich mehr Zeit für die Bewohner statt für Papierkram."
"500.000+ Akten digitalisiert. Unsere Deputies finden jetzt alle Informationen sofort."
"Patientenakten-Verwaltung ist jetzt ein Kinderspiel. Alles automatisch erfasst und archiviert."
"Erbschafts- und Nachlassdokumentation ist jetzt effizient und fehlerfrei."
"Digitale Hausverwaltung für alle unsere Wohnanlagen. Mieter und Eigentümer sind begeistert."
"Mit PaperOffice haben wir unsere Rechnungsverarbeitung um 99% beschleunigt. Die KI erkennt automatisch alle relevanten Daten und ordnet sie korrekt zu."
"PaperOffice ist aus unserem Arbeitsalltag nicht mehr wegzudenken. Aufträge, Angebote und Rechnungen laufen jetzt automatisch."
"Die Dokumentation unserer Pflegeleistungen ist jetzt digital und automatisiert. Mehr Zeit für unsere Patienten."
"Technische Zeichnungen, Stücklisten und Qualitätsprotokolle sind sofort auffindbar. Die Suche, die früher 30 Minuten dauerte, braucht jetzt 30 Sekunden."
"Mandantenbelege, Steuerbescheide und Jahresabschlüsse werden automatisch sortiert und dem richtigen Mandanten zugeordnet. Belegchaos gehört der Vergangenheit an."
"Projektdokumentation, SLAs und Kundenkommunikation für unsere IT-Beratungsprojekte werden automatisch klassifiziert und archiviert."
Bereit für LLM-basierte OCR?
Starten Sie in 2 Minuten. Keine Kreditkarte, keine Installation.