visual-grounding

Skill

by qijimrc

clawhub06/10

利用GLM-4.7V多模态能力进行图像中的对象、文本检测与定位,支持自然语言查询,适用于视觉搜索和内容分析场景。

📊 商业分析

商业模式
free
独特价值
基于国产GLM模型的视觉定位,适配中文场景理解
竞品
GPT-4V视觉定位、Claude Vision、Gemini Pro Vision

🎯 应用场景

目标用户
AI应用开发者内容审核团队智能客服系统

📦 安装方式

openclaw install qijimrc-visual-grounding
🔗 安装/下载链接 →