minimax-image-understanding

Skill

by aidescend

clawhub07/10

使用多模态大模型理解图片内容,生成业务含义描述。支持多种模型:(1) MiniMax VLM (2) OpenAI GPT-4V (3) Claude Vision。用于理解截图、图表、文档照片等,生成精准的文字描述。

聚合MiniMax/GPT-4V/Claude三大视觉模型,专为中文业务场景优化,支持截图、表格、文档智能理解与描述生成。

📊 商业分析

商业模式
freemium
独特价值
支持三大模型切换,成本低40%,中文业务理解精准度高
竞品
Claude Vision API(功能相同但无中文优化) | GPT-4V(价格更高,响应慢) | 阿里通义视觉(本地化更强但模型能力弱)

🎯 应用场景

目标用户
财务分析师数据分析师内容运营RPA开发者企业流程自动化团队

📦 安装方式

openclaw install aidescend-minimax-image-understanding
🔗 安装/下载链接 →