arxiv-gamedevbench-evaluating-agentic-capabili

Name: arxiv-gamedevbench-evaluating-agentic-capabili
Author: wanng-ide

Skill

by wanng-ide

clawhub⭐ 06/10

源自arXiv论文《GameDevBench：通过游戏开发评估智能体能力》。用于基于……搭建Node.js实验脚手架。

基于GameDevBench论文的AI代理能力评估框架。通过游戏开发任务场景，系统评测AI代理的规划、执行、决策能力。提供Node.js实验脚手架快速搭建评测环境。

📊 商业分析

商业模式

free

独特价值

专注游戏开发领域的AI代理能力评测，提供Node.js实验框架

竞品

OpenAI Evals、Hugging Face Benchmark、LangChain Agent Evaluator

目标用户

AI研究人员游戏开发工程师AI模型评估团队

openclaw install wanng-ide-arxiv-gamedevbench-evaluating-agentic-capabili

AI代理评估游戏开发基准测试Node.js框架能力评测