vlm-grounding

Skill

by qijimrc

clawhub06/10

基于GLM-4.7V的多模态视觉定位工具,可精准检测和定位图像中的对象与文本,支持中文场景优化,适用于电商、文档、安防等领域。

📊 商业分析

商业模式
freemium
独特价值
专注中文场景的视觉定位,支持中文文本检测与对象关联,响应速度快
竞品
Google Vision API(功能全面但成本高),OpenAI Vision(通用但无专项优化),阿里云视觉智能(国内友好但定价复杂)

🎯 应用场景

目标用户
电商平台文档处理企业安防监控公司教育科技公司

📦 安装方式

openclaw install qijimrc-vlm-grounding
🔗 安装/下载链接 →