ui-element-ops

Name: ui-element-ops
Author: murongg

MCP Server

by murongg

clawhub⭐ 07/10

将UI截图解析为结构化元素JSON（含类型、OCR文本、边界框），并可基于解析元素操作桌面UI。适用于检测或定位UI元素。

将桌面UI截图解析为含类型、OCR文本、边界框的结构化JSON，并基于解析结果直接执行桌面UI操作，实现视觉驱动的桌面自动化。

📊 商业分析

商业模式

freemium

独特价值

截图自动解析UI元素为结构化JSON并直接驱动桌面操作

竞品

1. PyAutoGUI+OpenCV（开源但无AI语义理解，需手写坐标逻辑）；2. Playwright/Selenium（仅限Web，不支持桌面原生UI）；3. SikuliX（基于图像匹配，无OCR结构化输出，维护停滞）

目标用户

RPA开发者测试工程师AI Agent开发者

openclaw install murongg-ui-element-ops

桌面自动化UI元素识别OCR解析RPA增强视觉Agent