ui-element-ops

MCP Server

by murongg

clawhub07/10

将UI截图解析为结构化元素JSON(含类型、OCR文本、边界框),并可基于解析元素操作桌面UI。适用于检测或定位UI元素。

将桌面UI截图解析为含类型、OCR文本、边界框的结构化JSON,并基于解析结果直接执行桌面UI操作,实现视觉驱动的桌面自动化。

📊 商业分析

商业模式
freemium
独特价值
截图自动解析UI元素为结构化JSON并直接驱动桌面操作
竞品
1. PyAutoGUI+OpenCV(开源但无AI语义理解,需手写坐标逻辑);2. Playwright/Selenium(仅限Web,不支持桌面原生UI);3. SikuliX(基于图像匹配,无OCR结构化输出,维护停滞)

🎯 应用场景

目标用户
RPA开发者测试工程师AI Agent开发者

📦 安装方式

openclaw install murongg-ui-element-ops
🔗 安装/下载链接 →