glm-grounding

Skill

by qijimrc

clawhub06/10

利用GLM-4.7V多模态定位能力检测并定位图像中的物体或文本。当用户要求查找、定位、检测或ground特定目标时激活。

调用GLM-4.7V多模态grounding能力,对图像中的物体或文字进行精准检测定位,返回目标边界框坐标,适用于视觉搜索与自动标注场景。

📊 商业分析

商业模式
per_use
独特价值
基于GLM-4.7V原生视觉grounding,精准返回目标坐标框,国产模型合规可控
竞品
Google Cloud Vision API(生态更全但贵)、阿里云通义千问VL(国内生态强但定位精度一般)、GPT-4o视觉(综合能力强但grounding非专长)

🎯 应用场景

目标用户
电商运营与商品图审核人员工业质检与自动化开发者AI应用开发者与集成商

📦 安装方式

openclaw install qijimrc-glm-grounding
🔗 安装/下载链接 →