llm-benchmark-analyst

Name: llm-benchmark-analyst
Author: chekhovin

Skill

by chekhovin

clawhub⭐ 07/10

在固定基准体系中检索分析LLM测试结果，生成基于证据的模型优劣势报告或领域领先者评估。

在固定基准宇宙内搜索分析LLM评测结果,生成模型强弱点报告和领域最优模型推荐,支持多维度对标决策。

📊 商业分析

商业模式

freemium

独特价值

一站式LLM基准对标,快速定位模型优劣势,支持决策

竞品

OpenCompass(开源,功能全面但部署复杂)、SuperBench(商业化但价格高)、LMSys Chatbot Arena(众包评测但数据滞后)

目标用户

AI模型研发团队企业AI采购决策者LLM应用开发者

openclaw install chekhovin-llm-benchmark-analyst

LLM基准测试模型性能评估对标分析基准数据库AI决策支持