vlm-image-helper

Skill

by testlbin

clawhub14/10

用于VLM和OCR工作流的视觉检查辅助工具。当智能体需要帮助视觉模型在重新分析前更清晰地查看图像时使用:可旋转歪斜图像、调整对比度/亮度、裁剪关键区域等。

为VLM和OCR工作流提供图像预处理辅助,自动旋转纠偏、增强图像清晰度,帮助视觉模型更准确地识别和分析图像内容。

📊 商业分析

商业模式
free
独特价值
在VLM分析前自动纠偏图像方向提升OCR识别准确率
竞品
1. LlamaIndex Vision Pipeline(功能更完整,支持多模态链路);2. LangChain Vision Tools(生态更成熟,集成度高);3. GPT-4V原生调用(无需额外处理层,直接支持旋转/OCR)

🎯 应用场景

目标用户
AI视觉应用开发者OCR流程工程师多模态Agent构建者

📦 安装方式

openclaw install testlbin-vlm-image-helper
🔗 安装/下载链接 →