qwen-vision

Skill

by perchouli

clawhub06/10

利用通义千问视觉API(阿里云灵积)分析图像和视频,支持图像理解、OCR及视觉推理。

基于阿里云通义千问视觉API,提供图像理解、OCR文字识别、视频分析和视觉推理能力的封装调用工具。

📊 商业分析

商业模式
free
独特价值
国内合规可用的视觉大模型接口,免翻墙直连阿里云
竞品
GPT-4o Vision(多模态更强、生态更全)、Google Gemini Vision(多语言优势)、Claude Vision(推理能力突出)——本Skill仅为Qwen API薄封装,无独立竞争力

🎯 应用场景

目标用户
国内AI应用开发者需要OCR和图像分析的企业用户无法访问海外API的中国团队

📦 安装方式

openclaw install perchouli-qwen-vision
🔗 安装/下载链接 →