multimodal-parser

Skill

by ayalili

clawhub07/10

统一多模态内容解析器,支持图像、PDF、DOCX和音频,自动进行OCR及转录,输出面向LLM处理的结构化文本。

统一解析图片、PDF、DOCX、音频等多种格式,自动OCR和转录,输出结构化文本供LLM处理

📊 商业分析

商业模式
freemium
独特价值
一站式多模态解析,自动OCR+转录,输出LLM友好的结构化文本
竞品
Claude Vision API(功能全但贵),Paddle OCR(仅OCR),Whisper(仅音频转录)

🎯 应用场景

目标用户
文档处理平台知识库系统开发者企业自动化工程师

📦 安装方式

openclaw install ayalili-multimodal-parser
🔗 安装/下载链接 →