reddi-llm-judge

Skill

by nissan

clawhub08/10

利用采样、决胜机制和确定性验证器,构建高性价比 LLM 评估集成。经验源自 600+ 次评判本地 Olla 的生产实践...

构建成本高效的LLM评估集群,通过智能采样、多模型投票仲裁和确定性验证器,实现低成本高准确度的模型输出质量评估。

📊 商业分析

商业模式
freemium
独特价值
成本效率最优的LLM评估系统,支持多模型投票仲裁和本地离线验证
竞品
OpenAI Evals(功能完整但成本高),Ragas(开源但缺乏成本优化),LangSmith(企业级但定价昂贵)

🎯 应用场景

目标用户
AI应用开发者LLM产品团队企业AI中台模型微调工程师

📦 安装方式

openclaw install nissan-reddi-llm-judge
🔗 安装/下载链接 →