llm-evaluator-pro

Skill

by aiwithabidi

clawhub17/10

基于Langfuse的LLM裁判评估器。使用GPT-5-nano作为裁判,从相关性、准确性、幻觉和实用性对追踪记录进行评分。支持单条追踪...

基于Langfuse平台的LLM评估工具,使用GPT-5-nano作为裁判,对AI输出进行相关性、准确性、幻觉率、帮助性四维自动评分,支持单条及批量trace评估。

📊 商业分析

商业模式
freemium
独特价值
基于GPT-5-nano自动评判LLM输出的相关性准确性幻觉与帮助性四维评分
竞品
1. Ragas(开源RAG评估框架,更专注RAG场景,无Langfuse集成);2. DeepEval(功能更全但配置复杂,学习曲线陡);3. Langfuse原生评估(内置但评分维度少,缺乏LLM-as-Judge能力)

🎯 应用场景

目标用户
AI应用开发者LLM产品质量负责人MLOps工程师

📦 安装方式

openclaw install aiwithabidi-llm-evaluator-pro
🔗 安装/下载链接 →