Ne tik skaitymas. |
DI-OCR yra praeitis. Mūsų LLM supranta dokumentus – išskiria tekstą, atpažįsta struktūrą, pateikia Bounding Boxes. Markdown išvestis RAG paruoštiems duomenims.
Klasikinė DI-OCR yra mirusi.
Dokumentų intelektas nuo 1 cento.
Nėra prenumeratos. Nėra bazinio mokesčio. Mokate tik už tai, ką naudojate – 3 lygiai kiekvienam poreikiui.
Basic
Greitas teksto atpažinimas
- LLM pagrįstas teksto atpažinimas
- 139 kalbos + automatinis aptikimas
- Markdown išvestis
- Pasitikėjimo balai
- Nėra Bounding Boxes
- Nėra PDF failų
Geriausia: Greitam teksto išskyrimui, el. laiškams, paprastiems dokumentams
Bandykite dabarPremium
Bounding Boxes + QR/brūkšninis kodas
- Viskas iš Basic
- Bounding Boxes (pikselių tikslumu)
- QR ir brūkšninių kodų aptikimas
- Nėra lentelių atpažinimo
- Nėra išdėstymo analizės
- Nėra PDF failų
Geriausia: Koordinačių pagrindu veikiantiems procesams, redagavimui, QR skenavimui
Bandykite dabarUltra
Visas dokumentų intelektas
- Viskas iš Premium
- Lentelių atpažinimas (struktūrizuotas)
- Išdėstymo atpažinimas + skaitymo tvarka
- PDF failas (sandwich PDF)
- Rankraščio atpažinimas
- Visas dokumentų intelektas
Geriausia: Sąskaitoms, sutartims, seniesiems archyvams, PDF failams
Bandykite dabarKaip tai veikia – kiekvieną kartą
Įkelkite dokumentą
PDF, skenavimas, vaizdas – bet koks formatas
Pasirinkite DI-OCR lygį
pagrindinis · premium · ultra
{
"text": "Rechnung #2024-0847",
"bbox": [112, 84, 186, 32],
"confidence": 1.0
} Struktūrizuotas rezultatas
Markdown + Bounding Boxes + PDF failas
Kaip mes lyginamės
Kainos remiasi viešai prieinamais duomenimis. Tipinės pradinio lygio kainos už puslapį.
AI-OCR in Aktion
Sehen Sie, wie PaperOffice AI-OCR Dokumente in durchsuchbare PDFs, Markdown und strukturierte Texte verwandelt — über 120 Sprachen.
DI-OCR iš naujo: LLM + Bounding Boxes
Klasikinė DI-OCR pateikia tik tekstą. Mūsų LLM supranta dokumentą – atpažįsta išdėstymą, lenteles, hierarchijas ir pateikia tikslias kiekvieno elemento koordinates. Puikiai tinka RAG, atitikčiai ir patvirtinimui.
Klasikinė DI-OCR yra mirusi.
Kiekvienas, vis dar pasitikintis taisyklėmis pagrįstu, kvailu simbolių atpažinimu, rizikuoja katastrofiškomis klaidomis DI procesuose, apskaitoje ir atitiktyje.
Apskaita ir Finansai
Neteisingai atpažintas "8" vietoj "3" sąskaitos sumoje gali sukelti tūkstančių dolerių žalą. Klasikinė DI-OCR neturi konteksto – ji spėja.
$ 8,340.00$ 3,340.00Atitiktis ir Teisė
Neteisingi IBAN numeriai, supainioti sutarties duomenys, neteisingi mokesčių identifikatoriai – viena DI-OCR klaida gali sukelti baudas ir teisinius ginčus.
DE89 3704 0044 O532DE89 3704 0044 0532AI ir AI-IDP vamzdynai
Šlamštas į vidų, šlamštas lauk. Jei jūsų DI procesas maitinamas neteisingu DI-OCR tekstu, visi vėlesni sprendimai yra bevertis. LLM negali paversti šlamšto auksu.
Sveikatos priežiūra ir Medicina
Supainiotos dozės, neteisingi pacientų duomenys, neteisingi radiniai – medicinos srityje klaidinga DI-OCR gali būti pavojinga gyvybei.
Dozė: 15mgDozė: 1.5mgSumažinti DI-OCR išlaidas reiškia taupyti netinkamoje vietoje.
Klasikinė DI-OCR aklai atpažįsta simbolius – be konteksto, be supratimo, be kokybės užtikrinimo. LLM pagrįsta DI-OCR supranta dokumentą, atpažįsta ryšius ir automatiškai taiso klaidas. Kainos skirtumas? Centai. Kokybės skirtumas? Pasauliai skiriasi.
Ką gali PaperOffice AI-OCR
LLM + ribojantys laukeliai
Kiti LLM pateikia tik tekstą. Mes pateikiame tikslias kiekvieno atpažinto elemento koordinates – pagrindą PDF failams ir redagavimui.
PDF failas
Originalus skenavimas + nematomas LLM teksto sluoksnis = ieškomas, kopijuojamas, archyvuojamas. Niekas kitas to negali padaryti.
Galimas Redagavimas
Dėl Bounding Boxes: tikslus redagavimas GDPR ir atitikčiai. Atraskite PII Redagavimą →
QR ir Brūkšninis Kodas
Automatinis QR kodų, brūkšninių kodų, DataMatrix aptikimas – idealiai tinka sąskaitoms, pristatymo lapeliams, etiketėms.
Lentelių Atpažinimas
Atpažįsta sudėtingas lenteles su eilutėmis, stulpeliais, sujungtomis langeliais ir eksportuoja jas struktūrizuotas.
Išdėstymo Atpažinimas
Antraštė, poraštė, stulpeliai, pastraipos, sąrašai – visa dokumento struktūra yra atpažįstama.
Rankraštis
Rankraštiniai užrašai, parašai, anotacijos patikimai atpažįstami ir išskiriami.
Struktūrizuotas Markdown
Puikiai tinka RAG procesams: hierarchijos, lentelės, sąrašai – viskas tvarkingai struktūrizuota.
139 Kalbos
Nuo Arabų iki Kinų. Automatinis aptikimas, kelių kalbų mišinys viename dokumente.
Kodėl DI-OCR be Bounding Boxes
yra bevertė
Daugelis LLM ir DI-OCR sistemų pateikia tik „tekantį tekstą“ – be koordinačių. Tai kaip knyga be puslapių numerių: nenaudinga profesionalioms reikmėms.
Be Bounding Boxes
Kiti tiekėjai"John Smith, IBAN: DE89370400440532013000, Suma: 1,250.00 EUR" Iš kur šie duomenys? Kokioje pozicijoje? Kuriame puslapyje?
- Nėra atsekamumo – iš kur duomenys?
- Nėra galimybės redaguoti – ką redaguoti?
- Nėra PDF failų – tekstas plaukioja niekur
- Nėra žmogaus dalyvavimo – vartotojas negali patvirtinti
- Nėra validavimo – ar vertė atitinka lauką?
Su Bounding Boxes
PaperOffice AI-OCR{
"text": "DE89...",
"label": "IBAN",
"bbox": [120, 340, 380, 365],
"page": 1,
"confidence": 1.0
} Tiksli pozicija, lauko tipas, puslapis, pasitikėjimas!
- 100% atsekamas – spustelėkite vertę, pamatykite originalą
- Tikslus redagavimas – automatiškai redaguokite IBAN
- Tikri PDF failai – tekstas tiksliai ant vaizdo
- Žmogaus dalyvavimas – vartotojas spustelėja, mato, patvirtina, sutinka
- Automatinis validavimas – lauko tipas atitinka vertę
Neįmanoma be Bounding Boxes:
Kiekvienas formatas. Kiekvienas šaltinis.
Skenuoti PDF
Skenuoti dokumentai, taip pat daugialapiai
Vaizdo Failai
PNG, JPG, TIFF, BMP, WebP
Word / Office
DOCX, XLSX, PPTX su vaizdais
URL ir HTML
Svetainių ekrano nuotraukos
139 Kalbos.
Vienas API.
Automatinis kalbos aptikimas, rankinis kalbos pasirinkimas arba kelių kalbų mišinys – viskas viename dokumente.
PDF failai iš analoginių dokumentų –
niekas kitas to negali padaryti.
Kodėl? Kiti LLM (GPT-4V, Claude, Gemini) gali skaityti tekstą, bet negali pateikti patikimų Bounding Boxes. Be tikslių koordinačių → nėra nematomo teksto sluoksnio → nėra PDF failų.
Tik mes kuriame LLM pagrįstus PDF failus iš nuskenuotų dokumentų – ieškomus, kopijuojamus, archyvams tinkamus.
Kam naudojamas AI-OCR?
Sąskaitų archyvų skaitmeninimas
Tūkstančius nuskenuotų sąskaitų paverskite ieškomais archyvais. Kiekviena sąskaita yra indeksuota ir randama.
Sutarčių valdymas
Skaitmeninkite senas sutartis, išskirkite punktus, kurkite PDF failus atitikčiai.
Senųjų archyvų atlaisvinimas
Senus failų archyvus paverskite ieškomomis žinių bazėmis. Archyvuokite GoBD atitiktimi.
Atitiktis ir Auditas
Skaitmeninkite dokumentus audito atžvilgiu. Bounding Boxes leidžia įrodyti kiekvieną išskirtą vertę.
RAG Procesai
Konvertuokite dokumentus į struktūrizuotą markdown – puikiai tinka LLM pagrįstoms sistemoms.
GDPR Animizacija
Su Bounding Boxes: tikslus asmens duomenų redagavimas. Sužinokite daugiau →
Kiekvienas formatas. Kiekvienas naudojimo atvejis.
Markdown
Struktūrizuota išvestis RAG, LLM ir dokumentacijai.
JSON
Su Bounding Boxes, pasitikėjimo balais ir metaduomenimis.
Sluoksniuotas PDF
Originalas + nematomas teksto sluoksnis archyvams.
Grynas Tekstas
Grynas tekstas paprastam apdorojimui.
Vienas API kvietimas. Viskas, ko jums reikia.
Štai ką grąžina „pilnas“ režimas – išsamiausias DI-OCR atsakymas bet kur.
{
"ocr_text": "Sąskaita-faktūra Nr. RE-2024-0847...",
"ocr_markdown": "# Sąskaita-faktūra\n| Poz | Prekyba | Kaina |\n...",
"bounding_boxes": [
{ "text": "RE-2024-0847", "bbox": [112, 84, 186, 32],
"confidence": 1.0, "page": 1 }
],
"table_data": [
{ "rows": 5, "cols": 4, "cells": [...] }
],
"layout_data": [
{ "type": „Antraštė", "bbox": [0, 0, 595, 120] },
{ "type": „Lentelė", "bbox": [40, 200, 555, 450] }
],
"language": "lt",
"qr_barcode": [
{ "type": „QR", "data": „https://...", "bbox": [...] }
],
"summary": „Telekom AB sąskaita-faktūra už 1.234,56 €“,
"searchable_pdf": „base64://...",
"pages_processed": 3,
"processing_time_ms": 2847
} DI-OCR Tekstas
Visas išskirtas tekstas su išsaugotu skaitymo tvarka.
Struktūrizuotas Markdown
Antraštės, lentelės, sąrašai – puikiai tinka RAG procesams.
Ribojimo dėžutės
Pikselių tikslumo koordinatės kiekvienam teksto elementui.
Lentelių Duomenys
Struktūrizuotas lentelių išskyrimas su eilutėmis, stulpeliais, langeliais.
Išdėstymo Analizė
Antraštė, Poraštė, Lentelė, Vaizdas – visa dokumento struktūra.
QR ir Brūkšninis Kodas
Automatinis QR, brūkšninių kodų, DataMatrix aptikimas su dekoduotais duomenimis.
PDF failas
Originalas + nematomas teksto sluoksnis archyvams.
Rankraščio Atpažinimas
Rankraštiniai užrašai ir parašai patikimai išskiriami.
API-First. Integracija per kelias minutes.
Nėra kreditinės kortelės. Nėra atšaukimo. Nėra sąlygų.Tiesiog pradėkite ir testuokite.RESTful API su OpenAPI 3.0, webhooks ir pilnas Postman Collection.
# OCR with Bounding Boxes
curl -X POST https://api.paperoffice.ai/v1/ocr \
-H "Authorization: Bearer $API_KEY" \
-F "[email protected]" \
-F "mode=complete"
# Response
{
"confidence_avg": 1.0,
"markdown": "# Invoice\n**Vendor:** ...",
"bounding_boxes": [
{"text": "Invoice", "bbox": [112, 84, 186, 32]}
],
"searchable_pdf": "base64...",
"layout": ["Header", "Table", "Footer"]
} Jūsų duomenys. Mūsų atsakomybė.
ES Duomenų Centras
100% nuosava infrastruktūra ES. Jokių JAV debesų.
Pilna Šifravimo Sistema
AES-256 saugant, TLS 1.3 perdavimui.
Sertifikuota ISO 27001 ir SOC 2 Type II sertifikavimo procese. Tarpiniai auditai pateikiami pagal užklausą pagal NDA.
GDPR; SOC 2 Type II and ISO 27001 in certification; HIPAA.
Automatinis Ištrynimas
Dokumentai ištrinami iškart po apdorojimo.
Dažniausiai užduodami klausimai
Kas yra LLM pagrindu veikiantis OCR ir kuo jis skiriasi nuo tradicinio OCR?
Kokie failų formatai yra palaikomi?
Kas yra ribinės dėžutės ir kodėl jų man reikia?
Kokia yra OCR atpažinimo tikslumas?
Kiek kalbų palaiko OCR?
Kiek kainuoja OCR apdorojimas?
Ar mano dokumentai apdorojami saugiai?
Ar galiu integruoti OCR API į savo programinę įrangą?
Koks skirtumas tarp paieškai tinkamo PDF ir Markdown išvesties?
Kaip dokumentuose atpažįstamos lentelės?
Klientų sėkmės istorijos
Sužinokite, kaip įmonės transformavo savo procesus su PaperOffice AI.
Pamatuojama Klientų Sėkmė
"Įmonės dokumentų valdymas visoms mūsų kasybos operacijoms. Pasaulinio lygio."
"FDA reguliuojamoms farmacinių produktų etiketėms reikalinga nuosekli dokumentacija. „PaperOffice“ sutrumpino mūsų patvirtinimo procesą nuo kelių dienų iki valandų."
"Techninė dokumentacija ir užsakymų apdorojimas dabar veikia visiškai automatiškai."
"Skaitmenizacija sukėlė revoliuciją mūsų administracijoje. Piliečių užklausos dabar apdorojamos per minutes, o ne dienas."
"Pacientų kortelės, išvadas ir siuntimai registruojami bei klasifikuojami automatiškai. Mūsų klinikos personalas pagaliau turi laiko pacientams."
"8 000 darbuotojų, tūkstančiai svečių dokumentų kasdien. „PaperOffice“ visiškai suskaitmenino mūsų vidinius procesus."
"Paskolų paraiškos ir atitikties dokumentai dabar apdorojami per kelias minutes, o ne valandas. Reguliavimo patikra vyksta visiškai automatiškai."
"Statybos projektų dokumentacija ir atitiktis dabar yra skaitmeniniai ir atsekamu."
"Įsiregistravimo formos, sąskaitos faktūros ir bendravimas su svečiais yra visiškai skaitmeniniai. Mūsų konsjeržų komanda dabar susikoncentravusi į puikų aptarnavimą."
"Degalinių ataskaitos, tiekėjų dokumentai ir atitikties dokumentacija iš daugiau nei 250 stotelių apdorojami ir archyvuojami automatiškai."
"GMP atitinkanti farmacinių funkcinių etikečių dokumentacija dabar tvarkoma visiškai automatiškai. Audito seka yra nuosekli und iškart prieinama."
"Mūsų medinių namų brėžiniai, leidimai ir klientų bylos dabar tvarkomi centralizuotai. Šeštoji karta pagaliau tapo skaitmeninė."
"Tiekėjų sutartys, sertifikatai ir muitinės dokumentai šimtams skrudyklų visame pasaulyje registruojami automatiškai ir priskiriami tinkamam produktui."
"Temperatūros ataskaitos, CMR važtaraščiai ir maisto sertifikatai skenuojami automatiškai bei priskiriami užsakymui. Klaidingi priskyrimai – jau praeitis."
"Negabaritinių krovinių gabenimo leidimai, maršrutų planai ir projektų dokumentacija dabar iškart pasiekiami skaitmeniniu būdu. Nebereikia ieškoti segtuvuose."
"Muitinės dokumentai, sandėlio kvitai ir ekspedijavimo užsakymai mūsų Rytų Europos tinklui klasifikuojami automatiškai. Keturios logistikos kartos pagaliau tapo skaitmeninės."
"Spaudos specifikacijos, klientų patvirtinimai und medžiagų sertifikatai dabar pasiekiami centralizuotai. Gamybos klaidų skaičius sumažėjo beveik iki nulio."
"Tvarumo sertifikatai, tiekėjų sutartys ir klientų specifikacijos apdorojami automatiškai. Šveicariškas tikslumas dabar ir skaitmeninėje erdvėje."
"Leidimai statyboms, subrangos sutartys ir mūsų komercinio nekilnojamojo turto priėmimo protokolai dabar nuosekliai dokumentuojami skaitmeniniu būdu."
"Pardavimo sutartys, ekspozė ir klientų bylos, sukauptos per daugiau nei 30 lyderystės rinkoje metų, dabar yra skaitmeniniu būdu ieškomos. Kiekvienas brokeris viską randa per kelias sekundes."
"Jūrų krovinių dokumentai, muitinės deklaracijos ir konosamentai fiksuojami automatiškai. Baltijos jūros logistika dar niekada nebuvo tokia efektyvi."
"Tūkstančiai individualių pakuočių užsakymų per savaitę su dizaino patvirtinimais, spaudos duomenimis ir pristatymo dokumentais. „PaperOffice“ viską sujungia į visumą."
"Patologijos laboratorijos dokumentacija ir prietaisų sertifikavimas dabar vyksta visiškai automatiškai. Užtikrinamas visiškas kiekvieno preparato atsekamumas."
"Paskolų dokumentai, užtikrinimo dokumentai ir klientų korespondencija apdorojami per kelias minutes, o ne valandas. Reguliacinė patikra yra visapusiška."
"Mūsų plieno gamybos techninės specifikasjoner, kokybės sertifikatai ir perdirbimo protokolai yra pasiekiami centralizuotai ir akimirksniu."
"Farmacijos ir kosmetikos etikečių specifikacijos su reguliaciniais reikalavimais tikrinamos ir patvirtinamos automatiškai. Daugiau jokių rankinių kontrolinių sąrašų."
"KYC dokumentai, investicijų ataskaitos ir reguliacinės ataskaitos suklasifikuojamos per kelias sekundes. Kaip MAS reguliuojamam „Robo-Advisor“, visiškas atitikties užtikrinimas yra būtinas."
"Saugos duomenų lapai, transportavimo leidimai ir ADR dokumentai chemijos logistikai priskiriami automatiškai. Klaidoms taikoma nulinė tolerancija."
"Mūsų perlų kolekcijų autentiškumo sertifikatai, tiekėjų įrodymai ir klientų garantijos archyvuojami automatiškai ir yra pasiekiami akimirksniu."
"Mažų ir vidutinių įmonių paskolų paraiškos, užtikrinimo dokumentai ir reguliacinės ataskaitos klasifikuojami automatiškai. Mūsų konsultantai turi daugiau laiko klientų konsultavimui."
"Klientų bylos, sukauptos per daugiau nei 135 bankininkystės istorijos metus, palaipsniui skaitmeninamos. 5 000 darbuotojų dabar gali akimirksniu pasiekti visus dokumentus."
"Milijonų klientų mikrokreditų paraiškos ir atitikties dokumentai dabar apdorojami per kelias miunutes, o ne dienas. Tai proveržis siekiant finansinės įtraukties."
"Šimtai tūkstančių važtaraščių ir grąžinimo kvitų per dieną apdorojami automatiškai. Pirmaujantis Vietnamo el. prekybos logistikos paslaugų teikėjas dabar dirba be popieriaus."
"CNC gamybos protokolai, medžiagų sertifikatai ir klientų specifikacijos naftos, dujų ir aviacijos projektams dabar yra visapusiškai skaitmeniniu būdu dokumentuojami."
"„Vision 2030“ reikalauja visiškos skaitmenizacijos. „PaperOffice“ apdoroja vyriausybinius dokumentus Saudo Arabijos skaitmeniniam pagrindui."
"Medžiagų sertifikatai, grūdinimo protokolai ir klientų specifikacijos automatiškai priskiriamos reikiamam užsakymui. Vienintelis Australijos Q&T gamintojas dabar dirba be popieriaus."
"Suvirinimo siūlių protokolai, statiniai skaičiavimai ir projektų planai valdomi skaitmeniniu būdu. Mūsų dirbtuvių komandos turi prieigą realiuoju laiku."
"Aviacijos sertifikatai, CNC programos ir klientų tolerancijos klasifikuojami automatiškai. AS9100 atitiktis dar niekada nebuvo tokia paprasta."
"Prekybininkų sutartys, KYC dokumentai ir šimtų tūkstančių MVĮ operacijų kvitai apdorojami per kelias sekundes. Meksikos mokėjimų revoliucija – be popieriaus."
"Mūsų aukštikalnių Malbec vynuogių derliaus dokumentacija, eksporto sertifikatai ir kokybės protokolai archyvuojami automatiškai. 120 metų vynininkystės tradicijų dabar skaitmeniniu formatu."
"Milijonai vartotojų patvirtinimų ir reguliavimo dokumentų apdorojami visiškai automatiškai. Mastelio keitimas be popieriaus."
"Pagrindinio Afrikos mokėjimų teikėjo prekybininkų prijungimo dokumentai ir atitikties įrodymai apdorojami per kelias minutes, o ne dienas."
"Automatiškai tikrinami ir archyvuojami tūkstančių natūralių produktų ekologiški sertifikatai, tiekėjų auditai ir produktų etiketės."
"Reguliavimo dokumentai iš 33 Afrikos šalių, partnerių sutartys ir audito sekos valdomi visiškai automatiškai. Verslo DMS 3 mlrd. JAV dolerių vertės finansinių technologijų įmonei."
"Receptai ir vaistų valdymas dabar veikia visiškai automatiškai. Daugiau laiko mūsų pacientams."
"Šimtmečių senumo dokumentai dabar ieškomi skaitmeniškai. Svarbus etapas mūsų istoriniams archyvams."
"Mūsų slaugytojai pagaliau turi daugiau laiko gyventojams, o ne popierizmo darbams."
"500 000+ bylų suskaitmeninta. Mūsų pareigūnai dabar randa visą informaciją akimirksniu."
"Pacientų kortelių valdymas dabar paprastas. Viskas automatiškai užfiksuota ir archyvuota."
"Paveldėjimo dokumentacija dabar yra efektyvi ir be klaidų."
"Skaitmeninis nekilnojamojo turto valdymas visiems mūsų gyvenamiesiems kompleksams. Nuomininkai ir savininkai patenkinti."
"Su „PaperOffice“ sąskaitų apdorojimą paspartinome 99 %. Dirbtinis intelektas automatiškai atpažįsta visus svarbius duomenis ir teisingai juos priskiria."
"„PaperOffice“ tapo neatsiejama mūsų kasdienio darbo dalimi. Užsakymai, pasiūlymai ir sąskaitos dabar apdorojami automatiškai."
"Mūsų priežiūros paslaugų dokumentacija dabar yra skaitmeninė ir automatizuota. Daugiau laiko mūsų pacientams."
"Techniniai brėžiniai, komplektavimo žiniaraščiai ir kokybės protokolai surandami akimirksniu. Paieška, kuri anksčiau trukdavo 30 minučių, dabar užtrunka 30 sekundžių."
"Klientų dokumentai, mokesčių pranešimai ir metinės finansinės ataskaitos automatiškai surūšiuojami ir priskiriami reikiamam klientui. Dokumentų chaosas liko praeityje."
"Projekto dokumentacija, SLA ir klientų komunikacija mūsų IT konsultacijų projektams yra automatiškai klasifikuojami ir archyvuojami."
Pasiruošę LLM pagrįstai DI-OCR?
Pradėkite per 2 minutes. Nėra kredito kortelės, nėra įdiegimo.