opendataloader-pdf

MCP Server

by emptyguo

clawhub06/10

用于解析PDF以支持RAG流水线、从PDF中提取结构化数据,或将PDF转换为带边界框的Markdown/JSON格式供AI处理

专为RAG管道设计的PDF解析工具,支持将PDF转为Markdown或含边界框坐标的JSON,便于AI精准处理文档内容

📊 商业分析

商业模式
freemium
独特价值
输出含边界框坐标的结构化JSON,精准定位PDF元素供AI溯源
竞品
1. LlamaParse(功能更强,支持复杂表格,但需付费);2. Unstructured.io(开源生态更完整,社区更活跃);3. PyMuPDF4LLM(纯Python本地化,无需联网但功能较基础)

🎯 应用场景

目标用户
RAG应用开发者企业知识库建设团队AI数据工程师

📦 安装方式

openclaw install emptyguo-opendataloader-pdf
🔗 安装/下载链接 →