llm-evaluator-pro

Name: llm-evaluator-pro
Rating: 7 (1 reviews)
Author: aiwithabidi

Skill

by aiwithabidi

clawhub⭐ 17/10

基于Langfuse的LLM裁判评估器。使用GPT-5-nano作为裁判，从相关性、准确性、幻觉和实用性对追踪记录进行评分。支持单条追踪...

基于Langfuse平台的LLM评估工具，使用GPT-5-nano作为裁判，对AI输出进行相关性、准确性、幻觉率、帮助性四维自动评分，支持单条及批量trace评估。

📊 商业分析

商业模式

freemium

独特价值

基于GPT-5-nano自动评判LLM输出的相关性准确性幻觉与帮助性四维评分

竞品

1. Ragas（开源RAG评估框架，更专注RAG场景，无Langfuse集成）；2. DeepEval（功能更全但配置复杂，学习曲线陡）；3. Langfuse原生评估（内置但评分维度少，缺乏LLM-as-Judge能力）

目标用户

AI应用开发者LLM产品质量负责人MLOps工程师

openclaw install aiwithabidi-llm-evaluator-pro

LLM评估幻觉检测Langfuse集成质量监控LLM-as-Judge