qwen-vision

Name: qwen-vision
Author: perchouli

Skill

by perchouli

clawhub⭐ 06/10

利用通义千问视觉API（阿里云灵积）分析图像和视频，支持图像理解、OCR及视觉推理。

基于阿里云通义千问视觉API，提供图像理解、OCR文字识别、视频分析和视觉推理能力的封装调用工具。

📊 商业分析

商业模式

free

独特价值

国内合规可用的视觉大模型接口，免翻墙直连阿里云

竞品

GPT-4o Vision（多模态更强、生态更全）、Google Gemini Vision（多语言优势）、Claude Vision（推理能力突出）——本Skill仅为Qwen API薄封装，无独立竞争力

目标用户

国内AI应用开发者需要OCR和图像分析的企业用户无法访问海外API的中国团队

openclaw install perchouli-qwen-vision

图像理解OCR识别视觉推理多模态AI阿里云通义