agent-scorecard

Skill

by theshadowrose

clawhub07/10

可配置的AI代理输出质量评估。定义标准、运行评估、追踪质量变化。无需LLM评判、无API调用、基于模式匹配。

可配置的AI代理输出质量评估框架。定义评估标准,追踪性能指标,无需LLM判断,基于规则模式快速评分。

📊 商业分析

商业模式
freemium
独特价值
离线评估无API依赖,成本低廉,支持自定义规则,适合国内企业合规需求
竞品
Weights & Biases(全链路ML监控,更重),Arize AI(生产监控,更贵),自建评估系统(无标准化)

🎯 应用场景

目标用户
AI应用开发者企业AI团队LLM应用运维质量保证工程师

📦 安装方式

openclaw install theshadowrose-agent-scorecard
🔗 安装/下载链接 →