screen-vision
MCP Serverby jackyun1024
clawhub⭐ 07/10
基于Apple Vision和ScreenCaptureKit,对macOS任意窗口或区域进行OCR文字提取、坐标定位与自动点击,实现屏幕级RPA自动化。
📊 商业分析
商业模式
freemium
独特价值
结合Apple Vision OCR与坐标定位实现文字驱动的精准点击自动化
竞品
1. macOS Accessibility API原生方案——无AI文字定位能力;2. Hammerspoon+OCR插件——需大量手动配置,易用性差;3. SikuliX——跨平台但macOS适配弱,依赖Java环境
🎯 应用场景
目标用户
macOS效率工具开发者RPA自动化测试工程师需要屏幕数据提取的数据分析师
工具信息
- 类型
- MCP Server
- 平台
- clawhub
- Stars
- ⭐ 0
- 价值评分
- 7/10
- 子分类
- 桌面自动化与屏幕识别
- 可商业化
- ✅ 是
AI 标签
屏幕OCRmacOS自动化Apple VisionRPA无障碍操控
相关工具推荐
deep-researchSKILL
替代普通网络搜索,对任意问题执行系统性多角度深度研究,结构化输出高质量分析报告,适用于信息调研、内容创作前置研究及竞品分析等场景
9/10⭐ 28,190
ppt-generationSKILL
根据用户需求自动生成含配图的演示文稿,逐页合成图像并输出可直接使用的PPTX文件,大幅降低制作成本
9/10⭐ 28,190
pptxSKILL
支持创建、读取、解析任意pptx文件,AI自动生成演示文稿或提取幻灯片内容,覆盖输入输出全场景
8/10⭐ 86,759
desktop-controlMCP
通过AI指令实现桌面鼠标移动点击、键盘输入、屏幕截图识别等全方位自动化控制,替代重复性人工操作,提升效率。
8/10⭐ 247
web-search-plusSKILL
统一搜索技能,通过多信号分析自动在Serper、Tavily、Querit间智能路由,覆盖通用、研究、金融等多场景搜索需求,单接口极简集成。
8/10⭐ 81