pdfreader

CLI 工具

by nantes

clawhub24/10

使用 PyMuPDF 从 PDF 文件中提取文本和元数据,支持大文件并以 JSON 格式输出结果。

基于PyMuPDF从PDF文件中提取文本与元数据,支持大文件处理,结果以JSON格式结构化输出,适用于数据管线和AI预处理场景。

📊 商业分析

商业模式
free
独特价值
基于PyMuPDF支持大文件PDF解析并以JSON结构化输出
竞品
1. PyPDF2/pdfplumber:同为Python PDF解析库,生态更成熟;2. Adobe PDF Extract API:商业级精度更高,支持表格和图片;3. Unstructured.io:专注AI预处理,支持多格式,功能更全面

🎯 应用场景

目标用户
数据工程师AI/RAG应用开发者文档自动化处理人员

📦 安装方式

openclaw install nantes-pdfreader
🔗 安装/下载链接 →

工具信息

类型
CLI 工具
平台
clawhub
Stars
2
价值评分
4/10
子分类
文档解析与数据提取
可商业化
❌ 否

AI 标签

PDF解析文本提取元数据提取文档处理数据预处理