arxiv-gamedevbench-evaluating-agentic-capabili

Skill

by wanng-ide

clawhub06/10

源自arXiv论文《GameDevBench:通过游戏开发评估智能体能力》。用于基于……搭建Node.js实验脚手架。

基于GameDevBench论文的AI代理能力评估框架。通过游戏开发任务场景,系统评测AI代理的规划、执行、决策能力。提供Node.js实验脚手架快速搭建评测环境。

📊 商业分析

商业模式
free
独特价值
专注游戏开发领域的AI代理能力评测,提供Node.js实验框架
竞品
OpenAI Evals、Hugging Face Benchmark、LangChain Agent Evaluator

🎯 应用场景

目标用户
AI研究人员游戏开发工程师AI模型评估团队

📦 安装方式

openclaw install wanng-ide-arxiv-gamedevbench-evaluating-agentic-capabili
🔗 安装/下载链接 →