LlamaParse 대 PaperOffice AI: 마크다운 파서가 구식이 되는 이유

LlamaParse 과 LlamaExtract 는 문서를 마크다운으로 변환하지만, 현대 LLM(Claude, GPT 등) 은 이미 이를 네이티브로 처리할 수 있습니다. 왜 이것이 충분하지 않은지, 그리고 엔터프라이즈 문서 처리가 진정으로 요구하는 것이 무엇인지 보여드립니다.

LlamaParse 과 LlamaExtract 의 약속

LlamaIndex 에서 제공하는 LlamaParse 과 LlamaExtract 는 AI 문서 처리 생태계에서 가장 잘 알려진 도구들 중 하나입니다. 그들의 약속은 PDF, 스캔 이미지, 양식 등 모든 종류의 문서를 구조화된 Markdown 텍스트로 변환하여 RAG 파이프라인 및 LLM 애플리케이션에 최적화하는 것입니다.

LlamaParse 은 다양한 파싱 모드를 제공합니다: Fast(1 크레딧/페이지), Balanced(10 크레딧), Premium(45 크레딧), 그리고 Agentic Plus(90 크레딧). LlamaExtract 는 이를 보완하여 스키마 기반의 데이터 추출을 제공합니다. JSON 스키마를 정의하면 도구가 문서에서 구조화된 데이터를 추출합니다.

일단 보면 매우 유망해 보이지만, 자세히 살펴보면 근본적인 약점이 드러납니다. 더 근본적인 질문도 제기됩니다: 우리는 이제 이런 도구들이 정말 필요한가요?

LlamaParse 이 구식화되는 이유: Claude, GPT 등이 스스로 할 수 있기 때문입니다

LlamaIndex 에 대한 불편한 진실은 다음과 같습니다: 최신 비전 LLM 은 LlamaParse 을 불필요한 중간 계층으로 만듭니다.

Claude 4, GPT-5, Gemini 2.5 Pro — 이 모든 모델은 문서를 직접 처리할 수 있습니다. PDF 와 이미지를 입력으로 받아 레이아웃, 표, 구조를 이해하고 구조화된 출력을 제공합니다. LlamaParse 이 제공하는 복잡한 파이프라인과 여러 파싱 모드는 이러한 모델들의 기본 기능입니다.

LlamaIndex 자체도 블로그에서 이 경향을 인정합니다: "최신 모델을 사용한 스크린샷을 통한 원샷 문서 파싱의 기준선이 크게 개선되었습니다." 그들은 순수 LLM 파싱의 정확도가 급격히 증가했다고 인정합니다.

이는 실제로 무엇을 의미할까요?

중간 계층 불필요: Claude 가 문서를 직접 이해할 때 왜 LlamaParse 을 통해 문서가 전송되어야 할까요?
크레딧 시스템 불필요: Claude 나 GPT 에 대한 단일 API 호출은 토큰 비용만 발생하며, 혼란스러운 계층 구조를 가진 독점 크레딧 시스템이 없습니다.
벤더 락인 불필요: LlamaParse 은 사용자를 LlamaIndex 생태계에 묶어두지만, 네이티브 LLM 은 공급업체와 무관합니다.
유지보수 불필요: v0.6.1 에서 발생한 원시 OCR 문제와 같은 버그 (GitHub Issue #621) 는 LlamaParse 이 갑자기 구조화된 분석 대신 원시 OCR 텍스트만 제공했을 때 발생하지만, 네이티브 LLM API 에서는 이러한 문제가 존재하지 않습니다.

LlamaParse 은 사실상 LLM 을 감싸는 래퍼(wrapper) 입니다. 그리고 근본 기술이 성숙되면 래퍼는 구식이 됩니다.

문서 처리의 진화: OCR 에서 LlamaParse 을 거쳐 네이티브 LLM 기능으로

바운딩 박스 문제: 평문만으로는 부족합니다

하지만 — 이것이 핵심 포인트입니다 — LlamaParse 이든 네이티브 LLM 이든 실제 문제를 해결하지 못합니다: 기업용 문서 처리에는 텍스트 이상의 것이 필요합니다.

ironically, LlamaIndex 자체도 블로그에서 "LLM API 는 완전한 문서 파서가 아닙니다"라고 주장하며, 순수 LLM API 는 신뢰도 점수, 바운딩 박스, 출처 인용이 부족하다고 말합니다. 그러나 그들의 자체 솔루션은 바로 여기에서 심각한 문제가 있습니다:

문제	GitHub 이슈	상태
바운딩 박스 높이 불일치	#368	2024 년 8 월부터 오픈
BBox 값이 None → Pydantic 충돌	#972	2025 년 10 월 수정
표에 대한 기본값 대신 실제 좌표 사용	#442	오픈
경우에 따른 그림 추출 실패	#528	오픈
업데이트 후 분석 대신 원시 OCR 제공	#621	오픈
오류 메시지 없이 추출 작업 실패	#1107	오픈 (2026 년 2 월)

근본적인 문제는 다음과 같습니다: 정확한 바운딩 박스가 없으면 문서 처리는 기업용 애플리케이션에 무용지물입니다. 왜일까요?

검색 가능한 PDF: 좌표가 없으면 보이지 않는 텍스트 레이어를 생성할 수 없습니다.
개인정보 (PII) 삭제: 픽셀 정밀 위치 지정이 없으면 정확하게 삭제할 수 없습니다.
감사 추적: 출처 참조가 없으면 추출 결과를 검증할 수 없습니다.
인간 개입: 검토자는 추출된 값의 출처를 확인해야 합니다.

표, 스캔 및 기업 요구 사항

바운딩 박스 문제를 넘어, LlamaParse 과 순수 LLM 접근 방식 모두 추가적인 기업 요구 사항을 충족하지 못합니다:

표 인식: APIScout 벤치마크 (2026) 에 따르면, LlamaParse 은 복잡한 다열 표, 병합된 셀, 다중 페이지 표에서 전문 솔루션보다 약 20% 뒤쳐집니다. Undatas 의 독립적인 심층 분석은 "LlamaParse 은 복잡한 표, 특히 병합된 셀이나 복잡한 헤더를 가진 표에서 심각한 어려움을 겪습니다."라고 확인했습니다.

스캔 및 필기체: 저해상도 스캔 문서의 경우 정확도가 급격히 떨어집니다. 스캔 내 수식 인식은 "매우 신뢰할 수 없습니다." 필기체 인식은 공식 기능 매트릭스에 따르면 "부분적"일 뿐입니다.

공식 LlamaParse 제한 사항:

페이지당 최대 35 개의 이미지 (나머지는 무시됨)
페이지당 최대 64KB 텍스트 (나머지는 잘림됨)
파일 크기 최대 512MB, 추출은 최대 100MB
추출 작업당 최대 500 페이지
스키마 중첩은 최대 7 레벨
extract_stateless 에서 DOCX 지원 없음 (GitHub #1077)

PaperOffice AI 의 경우:

문서 유형별로 각각 800 개 이상의 전문 LLM
행, 열, 병합된 셀을 포함한 표 인식 — 구조화된 내보내기
AI Vision 을 통한 필기체 인식 — 서명, 주석, 양식
OMR 인식 — 체크박스, 원, 마킹에 정확한 좌표 포함
QR 코드 및 바코드 인식 포함
자동 감지 139 개 언어

비용 비교: 크레딧, 센트 및 숨겨진 비용

LlamaParse 은 크레딧 기반 가격 모델을 사용합니다. 1,000 개 크레딧의 비용은 1.25 달러입니다. 처음에는 합리적으로 들리지만 실제로는 비용이 빠르게 누적됩니다:

기능	LlamaParse 크레딧	LlamaParse 비용/페이지	PaperOffice AI
기본 파싱	1 개 크레딧 (빠름)	$0.00125	$0.01 (AI-OCR)
품질 파싱	10–45 개 크레딧	$0.013–0.056	$0.01 (AI-OCR)
프리미엄 에이전트	45–90 개 크레딧	$0.056–0.113	$0.03 (AI-AI-IDP)
추출	5–60 개 크레딧	$0.006–0.075	$0.03 (AI-IDP 포함)

비교 가능한 품질 (프리미엄/에이전트 모드) 에서 PaperOffice AI 는 2~4 배 저렴합니다. 또한:

PaperOffice: 바운딩 박스, 검색 가능한 PDF, 삭제 기능 포함
LlamaParse: 레이아웃 추출 비용은 페이지당 추가 3 개 크레딧
PaperOffice: 크레딧 시스템 없음 — 투명한 페이지당 센트 가격
LlamaParse: 무료 티어는 월 10,000 개 크레딧 제한, 이후 상한선이 있는即用即付 (pay-as-you-go)

월 100,000 페이지 프리미엄 모드 기준: LlamaParse = $5,625, PaperOffice AI-IDP = $3,000. 절감액: 47%.

PaperOffice AI: 기업 문서 처리가 진정으로 필요로 하는 것

PaperOffice AI 는 LlamaParse 과 근본적으로 다른 접근 방식을 취합니다. 일반적인 LLM 을 감싸는 래퍼 역할을 하는 대신, PaperOffice 는 세 가지 전문 기술을 결합합니다:

1. OCR-LLM 융합: 800 개 이상의 전문, 미세 조정된 LLM — 송장, 계약서, 신분증, 배송지 등 특정 문서 유형별로 각각 훈련됨. "하나의 모델로 모든 것을 해결"하는 일반적인 방식은 아닙니다.

2. 바운딩 박스를 기반으로: 인식된 모든 요소 — 텍스트, 표, 이미지, 필기체 — 에 정확한 픽셀 좌표가 할당됩니다. 이는 다음을 가능하게 합니다:

검색 가능한 PDF: 원본 스캔 + 보이지 않는 LLM 텍스트 레이어 = 검색 가능, 복사 가능, 보관 가능
개인정보 삭제: GDPR 준수 정밀 삭제 — 단순 텍스트 검색 및 치환이 아닌, 픽셀 단위 정밀 삭제
인간 참여: 추출된 값 클릭 → 즉시 원본에서 해당 위치 확인
감사 추적: 모든 추출 데이터 포인트는 추적 가능하고 검증 가능

3. 템플릿 없이 제로샷: 템플릿, 학습, 규칙 불필요. 자연어 프롬프팅 — 원하는 추출 내용을 자연어로 설명하세요.

또한: EU 데이터 센터, GDPR 준수, 온프레미스 제공. LlamaParse 는 모든 것을 클라우드에 강제 (48 시간 캐시!) 하는 반면, PaperOffice 는 완전한 데이터 주권을 제공합니다.

기능	LlamaParse	네이티브 LLM	PaperOffice AI
마크다운 출력	✅	✅	✅
경계 상자	⚠️ 버그 있음	❌	✅ 픽셀 정밀
검색 가능한 PDF	❌	❌	✅
개인정보 삭제	❌	❌	✅
표 (복잡한)	⚠️ 약 80%	⚠️ 변동	✅ 전문화
손글씨	⚠️ 부분적	⚠️ 변동	✅ AI 비전
온프레미스	❌	❌	✅
EU 서버/GDPR	❌	⚠️	✅
가격 (기업용)	$0.056–0.113	변동	$0.01–0.03

AI-DMS — UI · Chat Agent · API

Web · Desktop · Mobile

Claude · ChatGPT · Cursor

REST · MCP · one API key

LlamaParse 대 PaperOffice AI: 마크다운 파서가 구식이 되는 이유

The world’s exclusive sole DMS partner for QNAP and ASUSTOR.

QNAP

ASUSTOR

LlamaParse 과 LlamaExtract 의 약속

LlamaParse 이 구식화되는 이유: Claude, GPT 등이 스스로 할 수 있기 때문입니다

바운딩 박스 문제: 평문만으로는 부족합니다

표, 스캔 및 기업 요구 사항

비용 비교: 크레딧, 센트 및 숨겨진 비용

PaperOffice AI: 기업 문서 처리가 진정으로 필요로 하는 것

PaperOffice AI 팀

진정한 엔터프라이즈 문서 처리를 준비하셨나요?

Web · Desktop · Mobile

Claude · ChatGPT · Cursor

REST · MCP · one API key

LlamaParse 대 PaperOffice AI: 마크다운 파서가 구식이 되는 이유

QNAP

ASUSTOR

LlamaParse 과 LlamaExtract 의 약속

LlamaParse 이 구식화되는 이유: Claude, GPT 등이 스스로 할 수 있기 때문입니다

바운딩 박스 문제: 평문만으로는 부족합니다

표, 스캔 및 기업 요구 사항

비용 비교: 크레딧, 센트 및 숨겨진 비용

PaperOffice AI: 기업 문서 처리가 진정으로 필요로 하는 것

PaperOffice AI 팀

이것도 좋아하실 수 있습니다

LLM 대 머신러닝: 차이점은 무엇인가요?

OCR 대 AI-OCR: 궁극적인 비교

Agentic AI-IDP: Wie KI-Agenten die Dokumentenverarbeitung revolutionieren

다음 기사를 놓치지 마세요

진정한 엔터프라이즈 문서 처리를 준비하셨나요?