skillprobe

Name: skillprobe
Author: luarassassin

Skill

by luarassassin

clawhub⭐ 07/10

A/B测试评估任何AI智能体技能的实际影响，通过三角色隔离（编排器+两个子智能体）。生成技能画像、合成测试任务。

通过编排器与双子Agent三角色隔离架构，对任意AI技能进行A/B对比评估，生成技能画像与合成测试任务，量化Skill真实效果。

📊 商业分析

商业模式

freemium

独特价值

通过编排器+双子Agent隔离架构实现Skill真实效果的科学A/B对比

竞品

1. AgentBench - 侧重学术基准，SkillProbe更面向实用场景A/B测试；2. PromptFoo - 专注Prompt评估，SkillProbe聚焦多角色隔离的Skill级评估；3. Langsmith Evaluation - 平台绑定强，SkillProbe更轻量独立

目标用户

AI Agent开发者Prompt工程师AI产品经理

openclaw install luarassassin-skillprobe

AI评估Agent测试A/B实验技能基准多角色隔离