agentbench

Name: agentbench
Rating: 7 (1 reviews)
Author: exe215

Skill

by exe215

clawhub⭐ 17/10

在40个真实任务中基准测试您的OpenClaw代理。测试文件创建、研究、数据分析、多步骤工作流、记忆和错误处理等能力。

为OpenClaw Agent提供40个真实任务基准测试框架,覆盖文件操作、数据分析、多步工作流、记忆管理、错误处理等维度,快速诊断Agent性能瓶颈。

📊 商业分析

商业模式

freemium

独特价值

专针对OpenClaw Agent的40个真实任务基准,覆盖文件、研究、数据、工作流、记忆、容错等全链路评估

竞品

OpenAI Evals(功能单一),Hugging Face Benchmarks(通用性强),LangChain Agent评估工具(集成度高)

目标用户

AI Agent开发者企业自动化团队AI产品经理

openclaw install exe215-agentbench

Agent评估基准测试性能诊断OpenClaw工作流自动化