llm-benchmark-analyst

Skill

by chekhovin

clawhub07/10

在固定基准体系中检索分析LLM测试结果,生成基于证据的模型优劣势报告或领域领先者评估。

在固定基准宇宙内搜索分析LLM评测结果,生成模型强弱点报告和领域最优模型推荐,支持多维度对标决策。

📊 商业分析

商业模式
freemium
独特价值
一站式LLM基准对标,快速定位模型优劣势,支持决策
竞品
OpenCompass(开源,功能全面但部署复杂)、SuperBench(商业化但价格高)、LMSys Chatbot Arena(众包评测但数据滞后)

🎯 应用场景

目标用户
AI模型研发团队企业AI采购决策者LLM应用开发者

📦 安装方式

openclaw install chekhovin-llm-benchmark-analyst
🔗 安装/下载链接 →