docx-toolkit

MCP Server

by zacjiang

clawhub07/10

从.docx及旧版.doc文件中提取文本、表格和图像。支持大文档、CJK文本及复杂表格结构,包含去重功能。

从docx和doc文件中提取文本、表格和图片,支持CJK文本、复杂表格结构及大文档处理,内置去重功能。

📊 商业分析

商业模式
freemium
独特价值
同时处理doc/docx格式,支持CJK与复杂表格去重提取
竞品
python-docx(仅支持docx,无图片提取)、Apache POI(Java生态,部署复杂)、Mammoth.js(轻量但不支持复杂表格和CJK)——本Skill优势在于同时支持doc/docx、CJK文本和复杂表格

🎯 应用场景

目标用户
企业数据工程师AI训练数据标注团队法律/财务文档处理人员

📦 安装方式

openclaw install zacjiang-docx-toolkit
🔗 安装/下载链接 →

工具信息

类型
MCP Server
平台
clawhub
Stars
0
价值评分
7/10
子分类
文档解析与数据提取
可商业化
✅ 是

AI 标签

文档解析DOCX提取表格识别中文文档处理数据清洗