단순히 읽는 것을 넘어. |
OCR은 과거입니다. 저희 LLM은 문서를 이해하고 텍스트를 추출하며 구조를 인식하고 바운딩 박스를 제공합니다. RAG 준비 데이터를 위한 마크다운 출력.
기존 OCR은 죽었습니다.
문서 지능, 1센트부터.
구독 없음. 기본 요금 없음. 사용한 만큼만 지불합니다 – 모든 요구에 맞는 3가지 등급.
Basic
빠른 텍스트 인식
- LLM 기반 텍스트 인식
- 139개 언어 + 자동 감지
- 마크다운 출력
- 신뢰도 점수
- 바운딩 박스 없음
- 검색 가능한 PDF 없음
최적: 빠른 텍스트 추출, 이메일, 간단한 문서
지금 테스트Premium
Bounding Boxes + QR/바코드
- Basic의 모든 기능
- Bounding Boxes (픽셀 정확도)
- QR 및 바코드 감지
- 표 감지 없음
- 레이아웃 분석 없음
- 검색 가능한 PDF 없음
최적: 좌표 기반 워크플로우, 마스킹, QR 스캔
지금 테스트Ultra
완전한 문서 지능
- Premium의 모든 기능
- 표 감지 (구조화)
- 레이아웃 감지 + 읽기 순서
- 검색 가능한 PDF (샌드위치 PDF)
- 필기 인식
- 완전한 문서 지능
최적: 송장, 계약서, 레거시 아카이브, 검색 가능한 PDF
지금 테스트작동 방식 – 매번
문서 업로드
PDF, 스캔, 이미지 – 모든 형식
OCR 등급 선택
기본 · 프리미엄 · 울트라
{
"text": "Invoice #2024-0847",
"bbox": [112, 84, 186, 32],
"confidence": 1.0
} 구조화된 결과
마크다운 + 바운딩 박스 + 검색 가능한 PDF
우리의 비교
가격은 공개된 데이터를 기반으로 합니다. 일반적인 엔트리 레벨 가격/페이지 기준.
AI-OCR 작동 모습
PaperOffice AI-OCR 이 문서를 검색 가능한 PDF, Markdown 과 구조화된 텍스트로 변환하는 모습을 확인하세요 — 120 개 이상의 언어 지원.
재정의된 OCR: LLM + 바운딩 박스
기존 OCR은 텍스트만 제공합니다. 저희 LLM은 문서를 이해하고 레이아웃, 표, 계층 구조를 인식하며 모든 요소에 대한 정확한 좌표를 제공합니다. RAG, 규정 준수 및 검증에 완벽합니다.
기존 OCR은 죽었습니다.
규칙 기반의 멍청한 문자 인식에 의존하는 사람은 AI 파이프라인, 회계 및 규정 준수에서 치명적인 오류를 겪을 위험이 있습니다.
회계 및 재무
송장 금액에서 "3" 대신 "8"로 잘못 인식하면 수천 달러의 손실이 발생할 수 있습니다. 기존 OCR은 문맥이 없으며 단순히 추측할 뿐입니다.
$ 8,340.00$ 3,340.00준수 및 법률
잘못된 IBAN 번호, 혼동된 계약 데이터, 잘못된 세금 ID – 단 하나의 OCR 오류도 벌금과 법적 분쟁으로 이어질 수 있습니다.
DE89 3704 0044 O532DE89 3704 0044 0532AI 및 AI-IDP 파이프라인
Garbage In, Garbage Out. AI 파이프라인에 오류가 있는 OCR 텍스트가 입력되면 이후의 모든 결정은 무의미해집니다. LLM은 쓰레기를 금으로 바꿀 수 없습니다.
의료 및 의학
혼동된 복용량, 잘못된 환자 데이터, 부정확한 소견 – 의료 분야에서는 오류가 있는 OCR이 생명을 위협할 수 있습니다.
복용량: 15mg복용량: 1.5mgOCR 비용을 줄이는 것은 잘못된 곳에서 비용을 줄이는 것입니다.
기존 OCR은 맥락도 이해하지 못한 채 문자를 무작정 인식합니다 – 이해도 없이, 품질 보증도 없이 말입니다. LLM 기반 OCR은 문서를 이해하고, 연결 관계를 인식하며, 오류를 자동으로 수정합니다. 가격 차이요? 아주 미미합니다. 품질 차이요? 하늘과 땅 차이입니다.
PaperOffice AI-OCR이
할 수 있는 것
LLM + 바운딩 박스
다른 LLM은 텍스트만 제공합니다. 저희는 인식된 모든 요소에 대한 정확한 좌표를 제공합니다 – 검색 가능한 PDF 및 마스킹의 기반입니다.
검색 가능한 PDF
원본 스캔 + 투명 LLM 텍스트 레이어 = 검색 가능, 복사 가능, 보관 가능. 다른 곳에서는 할 수 없습니다.
마스킹 가능
바운딩 박스 덕분에: GDPR 및 규정 준수를 위한 정확한 마스킹. PII 마스킹 알아보기 →
QR 및 바코드
QR 코드, 바코드, DataMatrix 자동 감지 – 송장, 배송 메모, 라벨에 이상적입니다.
표 인식
행, 열, 병합된 셀을 포함한 복잡한 표를 인식하고 구조화하여 내보냅니다.
레이아웃 감지
머리글, 바닥글, 열, 단락, 목록 – 완전한 문서 구조가 인식됩니다.
필기
손으로 쓴 메모, 서명, 주석이 안정적으로 인식되고 추출됩니다.
구조화된 마크다운
RAG 파이프라인에 완벽합니다: 계층 구조, 표, 목록 – 모든 것이 깔끔하게 구조화됩니다.
139개 언어
아랍어부터 중국어까지. 자동 감지, 한 문서 내 다국어 혼합.
바운딩 박스 없는 OCR이
쓸모없는 이유
많은 LLM과 OCR 시스템은 좌표 없이 "흐르는 텍스트"만 제공합니다. 이는 페이지 번호 없는 책과 같습니다: 전문적인 응용 프로그램에는 쓸모가 없습니다.
바운딩 박스 없음
다른 제공업체"John Smith, IBAN: DE89370400440532013000, 금액: 1,250.00 EUR" 이 정보는 어디서 왔는가? 어떤 위치? 어떤 페이지?
- 추적 불가능 – 데이터 출처는 어디인가?
- 마스킹 불가능 – 무엇을 마스킹해야 하는가?
- 검색 가능한 PDF 없음 – 텍스트가 아무데나 떠다님
- 인간 검토 불가 – 사용자가 확인할 수 없음
- 검증 불가 – 값이 필드와 일치하는가?
바운딩 박스 있음
PaperOffice AI-OCR{
"text": "DE89...",
"label": "IBAN",
"bbox": [120, 340, 380, 365],
"page": 1,
"confidence": 1.0
} 정확한 위치, 필드 유형, 페이지, 신뢰도!
- 100% 추적 가능 – 값을 클릭하면 원본 확인
- 정확한 마스킹 – IBAN 자동 마스킹
- 실제 검색 가능한 PDF – 텍스트가 이미지 위에 정확하게 위치
- 인간 검토 – 사용자가 클릭하고 보고 확인하고 승인
- 자동 검증 – 필드 유형이 값과 일치
바운딩 박스 없이는 불가능한 것:
모든 형식. 모든 소스.
스캔된 PDF
다중 페이지 포함 스캔 문서
이미지 파일
PNG, JPG, TIFF, BMP, WebP
워드 / 오피스
이미지가 포함된 DOCX, XLSX, PPTX
URL 및 HTML
웹사이트 스크린샷
139개 언어.
하나의 API.
자동 언어 감지, 수동 언어 선택 또는 다국어 혼합 – 모두 한 문서 내에서 가능합니다.
아날로그 문서에서 검색 가능한 PDF 생성 –
다른 곳에서는 할 수 없습니다.
이유는? 다른 LLM(GPT-4V, Claude, Gemini)은 텍스트를 읽을 수 있지만 신뢰할 수 있는 바운딩 박스를 제공할 수 없습니다. 정확한 좌표 없이는 → 투명 텍스트 레이어 없음 → 검색 가능한 PDF 없음.
스캔 문서에서 LLM 기반 검색 가능한 PDF를 만드는 것은 오직 우리뿐입니다 – 검색 가능하고, 복사 가능하며, 아카이브 규정을 준수합니다.
AI-OCR은 무엇에 사용되나요?
송장 아카이브 디지털화
수천 개의 스캔된 송장을 검색 가능한 아카이브로 변환합니다. 모든 송장이 색인화되어 찾을 수 있습니다.
계약 관리
레거시 계약서를 디지털화하고 조항을 추출하며 규정 준수를 위한 검색 가능한 PDF를 생성합니다.
레거시 아카이브 잠금 해제
오래된 파일 아카이브를 검색 가능한 지식 기반으로 변환합니다. GoBD 규정 준수 아카이브.
규정 준수 및 감사
감사 증명 문서 디지털화. 바운딩 박스는 모든 추출된 값에 대한 증거를 제공합니다.
RAG 파이프라인
문서를 구조화된 마크다운으로 변환 – LLM 기반 시스템 입력에 완벽합니다.
GDPR 익명화
바운딩 박스를 사용하여 개인 데이터를 정확하게 마스킹합니다. 더 알아보기 →
모든 형식. 모든 사용 사례.
마크다운
RAG, LLM 및 문서화를 위한 구조화된 출력.
JSON
바운딩 박스, 신뢰도 점수 및 메타데이터 포함.
샌드위치 PDF
아카이브를 위한 원본 + 투명 텍스트 레이어.
일반 텍스트
간단한 처리를 위한 순수 텍스트.
하나의 API 호출. 필요한 모든 것.
이것이 '완전 모드'가 반환하는 것입니다 – 어디에서나 사용 가능한 가장 포괄적인 OCR 응답입니다.
{
"ocr_text": "송장 번호 RE-2024-0847...",
"ocr_markdown": "# 송장\n| 항목 | 품목 | 가격 |\n...",
"bounding_boxes": [
{ "text": "RE-2024-0847", "bbox": [112, 84, 186, 32],
"confidence": 1.0, "page": 1 }
],
"table_data": [
{ "rows": 5, "cols": 4, "cells": [...] }
],
"layout_data": [
{ "type": "Header", "bbox": [0, 0, 595, 120] },
{ "type": "Table", "bbox": [40, 200, 555, 450] }
],
"language": "ko",
"qr_barcode": [
{ "type": "QR", "data": "https://...", "bbox": [...] }
],
"summary": "Acme Corp 에서 발행한 $1,234.56 송장입니다.",
"searchable_pdf": "base64://...",
"pages_processed": 3,
"processing_time_ms": 2847 OCR 텍스트
읽기 순서가 유지된 완전한 추출 텍스트.
구조화된 마크다운
제목, 표, 목록 – RAG 파이프라인에 완벽합니다.
바운딩 박스
모든 텍스트 요소에 대한 픽셀 단위 정확한 좌표.
표 데이터
행, 열, 셀을 포함한 구조화된 표 추출.
레이아웃 분석
머리글, 바닥글, 표, 이미지 – 완전한 문서 구조.
QR 및 바코드
QR, 바코드, DataMatrix의 자동 감지 및 디코딩된 데이터.
검색 가능한 PDF
원본 위에 투명 텍스트 레이어 – 아카이브 준비 완료.
필기 인식
손으로 쓴 메모 및 서명을 안정적으로 추출합니다.
API 우선. 몇 분 안에 통합.
신용카드 없음. 해지 없음. 조건 없음. 바로 시작하고 테스트하세요.RESTful API 과 OpenAPI 3.0, 웹훅 및 완전한 Postman Collection.
# OCR with Bounding Boxes
curl -X POST https://api.paperoffice.ai/v1/ocr \
-H "Authorization: Bearer $API_KEY" \
-F "[email protected]" \
-F "mode=complete"
# Response
{
"confidence_avg": 1.0,
"markdown": "# Invoice\n**Vendor:** ...",
"bounding_boxes": [
{"text": "Invoice", "bbox": [112, 84, 186, 32]}
],
"searchable_pdf": "base64...",
"layout": ["Header", "Table", "Footer"]
} 귀하의 데이터. 저희의 책임.
EU 데이터 센터
100% 자체 인프라를 EU에 보유. 미국 클라우드 없음.
종단 간 암호화
저장 시 AES-256, 전송 시 TLS 1.3.
인증됨 ISO 27001 및 SOC 2 Type II 인증 진행 중입니다. NDA 하에 요청 시 중간 감사를 제공합니다.
GDPR; SOC 2 Type II and ISO 27001 in certification; HIPAA.
자동 삭제
처리 후 즉시 문서가 삭제됩니다.
자주 묻는 질문
LLM 기반 OCR 이란 무엇이며 기존 OCR 과 어떻게 다른가요?
어떤 파일 형식이 지원되나요?
바운딩 박스란 무엇이며 왜 필요한가요?
OCR 인식의 정확도는 얼마나 됩니까?
OCR 은 몇 개의 언어를 지원하나요?
OCR 처리 비용은 얼마인가요?
내 문서는 안전하게 처리되나요?
OCR API 를 내 소프트웨어에 통합할 수 있나요?
검색 가능한 PDF 와 Markdown 출력의 차이점은 무엇인가요?
문서의 표는 어떻게 인식되나요?
고객 성공 사례
PaperOffice AI로 비즈니스 프로세스를 혁신한 기업 사례를 확인하세요.
측정 가능한 고객 성공
"모든 광업 운영을 위한 기업 문서 관리. 세계적 수준입니다."
"FDA 규제 제약 라벨은 완벽한 문서화를 요구합니다. PaperOffice 는 승인 프로세스를 며칠에서 몇 시간으로 단축했습니다."
"기술 문서와 주문 처리가 이제 완전 자동화되었습니다."
"디지털화가 우리의 행정을 혁신했습니다. 시민 문의가 이제 몇 일이 아닌 몇 분 만에 처리됩니다."
"환자 기록, 진단서 및 의뢰서는 자동으로 캡처 및 분류됩니다. 우리 진료 팀은 마침내 환자를 돌볼 시간이 생겼습니다."
"8,000 명의 직원, 매일 수천 개의 게스트 문서. PaperOffice 는 백오피스 프로세스를 완전히 디지털화했습니다."
"대출 신청서 및 준수 문서가 이제 몇 시간 대신 몇 분 내에 처리됩니다. 규제 검사는 완전히 자동으로 실행됩니다."
"건설 프로젝트 문서와 규정 준수가 이제 디지털화되어 추적 가능합니다."
"체크인 양식, 청구서 및 게스트 커뮤니케이션이 완전히 디지털화되었습니다. 우리 컨시어지 팀은 이제 우수한 서비스에 집중합니다."
"주유소 계산서, 공급업체 문서 및 250+ 지점의 준수 서류가 자동으로 처리 및 보관됩니다."
"제약 기능 라벨에 대한 GMP 준수 문서화가 이제 완전히 자동으로 실행됩니다. 감사 추적이 완벽하며 즉시 검색 가능합니다."
"목조 주택을 위한 건축 도면, 허가 및 고객 문서가 이제 중앙에서 관리됩니다. 6 세대에서 마침내 페이퍼리스."
"전 세계 수백 개의 로스터리 공급업체 계약, 인증서 및 세관 서류가 자동으로 캡처되어 올바른 제품에 할당됩니다."
"온도 증명서, CMR 화물 운송장 및 식품 인증서가 자동으로 스캔되어 주문에 할당됩니다. 잘못된 할당은 과거의 일입니다."
"중량 수송 허가, 경로 계획 및 프로젝트 문서화가 이제 즉시 디지털로 검색 가능합니다. 더 이상 폴더를 찾을 필요가 없습니다."
"동유럽 네트워크를 위한 세관 문서, 창고 영수증 및 운송 주문이 자동으로 분류됩니다. 4 세대의 물류, 마침내 디지털."
"인쇄 사양, 고객 승인 및 자재 인증서를 이제 중앙에서 조회할 수 있습니다. 생산 불량률이 거의 0으로 감소했습니다."
"지속 가능성 인증서, 공급업체 계약 및 고객 사양이 자동으로 처리됩니다. 스위스의 정밀함이 이제 디지털로도 구현됩니다."
"상업용 부동산을 위한 건축 허가, 하도급 계약 및 인수 확인서가 이제 완벽하게 디지털로 문서화되었습니다."
"30 년 이상 시장 선도地位的인 구매 계약서, 물품 소개서 및 고객 dossiers 가 이제 디지털로 검색 가능합니다. 모든 부동산 중개인이 몇 초 만에 모든 것을 찾을 수 있습니다."
"해상 운송 서류, 세관 신고서 및 선하증권이 자동으로 캡처됩니다. 발트해 물류가 그 어느 때보다 효율적이게 되었습니다."
"매주 수천 건의 맞춤형 포장 주문이 디자인 승인, 인쇄 데이터 및 배송 서류와 함께 처리됩니다. PaperOffice 가 모든 것을 통합합니다."
"병리학 실험실 문서화 및 장비 인증이 이제 완전히 자동으로 수행됩니다. 모든 표본에 대해 완벽한 추적성이 보장됩니다."
"대출 서류, 담보 문서 및 고객 correspondence 가 시간 대신 몇 분 내에 처리됩니다. 규제 심사가 완벽하게 이루어집니다."
"강철 생산을 위한 기술 사양, 품질 증명서 및 재활용 기록이 중앙에서 즉시 조회 가능합니다."
"규제 요구사항을 포함한 제약 및 화장품 라벨 사양이 자동으로 검토 및 승인됩니다. 더 이상 수동 체크리스트가 필요 없습니다."
"KYC 문서, 투자 보고서 및 규제 제출 서류가 몇 초 내에 분류됩니다. MAS 규제를 받는 로보어드바이저로서 완벽한 규정 준수가 필수적입니다."
"화학 물류를 위한 안전 데이터 시트, 운송 허가 및 ADR 문서가 자동으로 할당됩니다. 오류에 대한 관용은 전혀 없습니다."
"진품 인증서, 공급업체 증빙 자료 및 진주 컬렉션에 대한 고객 보증은 자동으로 보관되며 즉시 조회할 수 있습니다."
"중소기업 대출 신청서, 담보 문서 및 규제 보고서가 자동으로 분류됩니다. 당사의 상담사들은 고객 상담에 더 많은 시간을 할애할 수 있습니다."
"135 년 이상의 은행 역사를 담은 고객 기록이 순차적으로 디지털화되고 있습니다. 5,000 명의 직원이 이제 모든 문서에 즉시 접근할 수 있습니다."
"수백만 고객을 위한 소액 대출 신청서와 준수 문서가 이제 며칠이 아닌 몇 분 내에 처리됩니다. 이는 금융 포용성을 위한 게임 체인저입니다."
"하루에 수십만 장의 납품서와 반품 영수증이 자동으로 처리됩니다. 베트남 최고의 전자상거래 물류 기업이 이제 무종이 사무실을 실현했습니다."
"석유, 가스 및 항공우주 프로젝트를 위한 CNC 제조 프로토콜, 자재 인증서 및 고객 사양이 이제 완벽하게 디지털로 문서화되었습니다."
"비전 2030 은 완전한 디지털화를 요구합니다. PaperOffice 는 사우디아라비아의 디지털 백본을 위해 정부 문서를 처리합니다."
"자재 증명서, 담금질 프로토콜 및 고객 사양이 올바른 주문에 자동으로 할당됩니다. 호주의 유일한 열처리 (Q&T) 제조사가 이제 무종이 사무실을 실현했습니다."
"용접부 프로토콜, 정적 계산서 및 프로젝트 계획이 디지털로 관리됩니다. 당사의 작업장 팀은 실시간으로 접근할 수 있습니다."
"항공우주 인증서, CNC 프로그램 및 고객 공차가 자동으로 분류됩니다. AS9100 준수가 그 어느 때보다 쉬워졌습니다."
"수십만 중소기업에 대한 판매자 계약, KYC 문서 및 거래 증빙 자료가 수초 내에 처리됩니다. 멕시코의 결제 혁명, 이제 무종이로 이루어집니다."
"고산지대 말벡 와인을 위한 수확 문서, 수출 인증서 및 품질 프로토콜이 자동으로 보관됩니다. 120 년의 와인 양조 전통, 이제 디지털로 이어집니다."
"수백만 건의 사용자 검증 및 규제 문서가 완전히 자동으로 처리됩니다. 종이 없는 확장성."
"아프리카 선도 결제 제공업체를 위한 판매자 온보딩 문서 및 준수 증빙 자료가 며칠이 아닌 몇 분 내에 처리됩니다."
"수천 종의 천연 제품에 대한 유기농 인증서, 공급업체 감사 및 제품 라벨이 자동으로 검증 및 보관됩니다."
"33 개 아프리카 국가의 규제 문서, 파트너 계약 및 감사 추적이 완전히 자동으로 관리됩니다. 30 억 달러 규모 핀기업을 위한 엔터프라이즈 DMS."
"처방전과 약품 관리가 이제 완전 자동화되었습니다. 환자를 위한 시간이 늘어났습니다."
"수백 년 된 문서가 이제 디지털로 검색 가능합니다. 역사적 기록 보관소의 이정표입니다."
"간호사들이 드디어 서류 작업 대신 입주자를 위한 시간을 더 확보했습니다."
"50만 건 이상의 기록이 디지털화되었습니다. 담당자들이 이제 모든 정보를 즉시 찾습니다."
"환자 기록 관리가 이제 간편해졌습니다. 모든 것이 자동으로 수집 및 보관됩니다."
"상속 및 유산 문서가 이제 효율적이고 오류 없이 처리됩니다."
"모든 주거 단지의 디지털 부동산 관리. 세입자와 소유주 모두 만족합니다."
"PaperOffice 를 도입하여 청구서 처리 속도를 99% 향상시켰습니다. AI 가 모든 관련 데이터를 자동으로 인식하고 정확하게 분류합니다."
"이제 PaperOffice 는 우리의 일상 업무에서 없어서는 안 될 존재가 되었습니다. 주문, 견적 및 청구서가 이제 자동으로 처리됩니다."
"간호 서비스 문서화가 이제 디지털화되고 자동화되었습니다. 환자를 돌볼 시간이 더 많아졌습니다."
"기술 도면, 부품 목록 및 품질 프로토콜을 즉시 찾을 수 있습니다. 이전에는 30 분이 걸리던 검색이 이제 30 초면 충분합니다."
"위임장 증빙 자료, 세금 통지서 및 연간 결산서가 자동으로 분류되어 적절한 위임인에게 할당됩니다. 영수증 혼란은 이제 과거의 일이 되었습니다."
"IT 컨설팅 프로젝트를 위한 프로젝트 문서화, SLA 및 고객 커뮤니케이션이 자동으로 분류 및 보관됩니다."
LLM 기반 OCR을 사용할 준비가 되셨나요?
2분 안에 시작하세요. 신용카드 불필요, 설치 불필요.