llm-perf-estimator

Skill

by zhangyu68

clawhub17/10

根据模型架构、GPU规格和量化格式,估算LLM推理性能指标,包括首token延迟(TTFT)、解码速度和显存占用。

根据模型架构、GPU规格和量化格式,综合预估LLM推理的首Token延迟、解码速度及显存占用,辅助硬件选型与部署规划。

📊 商业分析

商业模式
freemium
独特价值
一站式预估TTFT、解码速度与显存,辅助GPU选型决策
竞品
LLM-Viewer(开源可视化工具,侧重计算图分析)、Can it run LLM(简易网页工具,仅判断能否运行)、Hugging Face Model Memory Calculator(仅估算显存,缺少TTFT和吞吐量预测)

🎯 应用场景

目标用户
AI工程师与MLOps团队大模型创业公司技术负责人云服务GPU资源采购决策者

📦 安装方式

openclaw install zhangyu68-llm-perf-estimator
🔗 安装/下载链接 →