skillprobe

Skill

by luarassassin

clawhub07/10

A/B测试评估任何AI智能体技能的实际影响,通过三角色隔离(编排器+两个子智能体)。生成技能画像、合成测试任务。

通过编排器与双子Agent三角色隔离架构,对任意AI技能进行A/B对比评估,生成技能画像与合成测试任务,量化Skill真实效果。

📊 商业分析

商业模式
freemium
独特价值
通过编排器+双子Agent隔离架构实现Skill真实效果的科学A/B对比
竞品
1. AgentBench - 侧重学术基准,SkillProbe更面向实用场景A/B测试;2. PromptFoo - 专注Prompt评估,SkillProbe聚焦多角色隔离的Skill级评估;3. Langsmith Evaluation - 平台绑定强,SkillProbe更轻量独立

🎯 应用场景

目标用户
AI Agent开发者Prompt工程师AI产品经理

📦 安装方式

openclaw install luarassassin-skillprobe
🔗 安装/下载链接 →