gpu-cluster-monitor
MCP Serverby sounderliu
clawhub⭐ 07/10
监控GPU集群的健康与使用情况,提供实时状态、性能指标和警报,以实现高效的资源管理。
实时监控GPU集群健康状态与利用率,提供性能指标采集、异常告警和资源使用分析,助力高效管理GPU算力资源。
📊 商业分析
商业模式
freemium
独特价值
通过自然语言对话实时查询GPU集群状态与异常告警
竞品
DCGM Exporter+Grafana(开源免费但需自行搭建)、Run:ai(企业级GPU编排平台,功能更全但价格高)、Nebuly(AI推理优化监控,侧重成本优化)
🎯 应用场景
目标用户
AI训练平台运维工程师GPU云服务提供商大模型研发团队负责人
工具信息
- 类型
- MCP Server
- 平台
- clawhub
- Stars
- ⭐ 0
- 价值评分
- 7/10
- 子分类
- GPU集群运维监控
- 可商业化
- ✅ 是
AI 标签
GPU监控集群管理资源调度性能告警AI基础设施
相关工具推荐
api-gatewayMCP
一键托管OAuth认证,连接Google、Microsoft、GitHub、Slack等100+主流API,让AI Agent无缝调用企业级SaaS服务
9/10⭐ 267
MCPMCP
9/10⭐ 0
proxmox-mcp-enhancedMCP
Enhanced Proxmox MCP server with 70+ tools for comprehensive infrastructure management, security automation, and lab orchestration
8/10⭐ 8
xpoz-setupMCP
一键配置Xpoz服务器与OAuth登录,自动校验连通性,供全部Xpoz技能复用。
8/10⭐ 5
simple-backupSKILL
Backup agent brain (workspace) and body (state) to local folder and optionally sync to cloud via rclone.
8/10⭐ 5