🤖 AI与机器学习 AI 工具

基于NVIDIA Parakeet的本地语音转文字工具。支持25种语言,速度比Whisper快30倍,完全离线运行保护隐私,提供OpenAI兼容API接口。

语音识别与转录

day253-volcengine-ai-audio-tts

基于火山引擎的文本转语音服务,支持多语言、多音色、自定义语速语调,适用于内容配音、智能客服、有声阅读等场景。

语音合成与音频处理

image-reader

基于豆包、Kimi等国产多模态大模型，提供图像内容识别、语义理解及OCR文字提取能力，支持多模型灵活切换。

多模态图像理解与OCR

minimax

基于MiniMax多模态API的开发工具包,支持文本、语音、视频、音乐四大能力,内置智能模型路由引擎,自动选择最优成本方案,提供SDK和安全工作流。

多模态API集成与模型路由

x402hub

为AI代理提供注册、接单、提交交付物、链上USDC收款及代理间消息通信的完整市场基础设施，基于x402协议与Base链构建。

AI智能体经济与去中心化市场

machins

为AI代理提供去中心化交易平台,支持任务、数据、API、模型买卖,内置托管保护和信用体系,实现Agent间自主协作与价值流转。

AI代理交易市场

chinese-toolkit

提供中文分词、拼音转换、中英翻译、关键词提取、文本分析等一站式NLP工具,无需调用外部API,本地化处理保护隐私。

中文NLP处理工具包

agent-training

系统化培训多Agent团队，统一目标与能力，维护培训手册，执行团队监管与进化检查，确保Agent一致性。

多Agent编排与培训管理

token-saver-skill

智能压缩AI对话上下文并实现语义级缓存，自动降低OpenClaw平台Token消耗50%-80%，显著削减API调用成本。

AI Token成本优化

hunyuan-image

基于腾讯混元大模型的文生图API,支持中文提示词,快速生成高质量AI图像,适合批量内容生产场景。

文生图/AI绘画

session-cost

解析OpenClaw会话日志，按Agent和模型维度汇总Token用量、API费用及性能指标，帮助用户掌控AI开支。

AI成本监控与用量分析

ace-banana

基于AceData Nano Banana API的图像生成编辑工具。支持nano-banana-2模型,自定义宽高比和分辨率,无需本地GPU即可快速生成和编辑图像。

图像生成与编辑

team-discuss

多智能体结构化讨论工具，支持辩证分析、随机发言顺序、共享状态与多轮对话，模拟真实团队讨论达成共识

多智能体协作框架

letta-cloud-mcp

MCP

MCP server for Letta Cloud

mcpmarket.cn

MCP 协议服务器

hugging-face-cli

CLI

通过自然语言调用HF CLI，管理Hugging Face上的AI模型、数据集、Spaces及代码仓库，简化Hub操作流程

AI模型管理与部署

jupiter-prediction-market

基于Node.js的Jupiter预测市场完整API客户端，支持AI代理自动化交易、投资组合管理与预测市场策略执行

预测市场交易自动化

inner-life-core

为OpenClaw智能体提供跨会话记忆能力，解决AI每次对话遗忘用户信息、无法持续成长的核心痛点，实现真正个性化AI体验

AI智能体记忆与个性化

alicloud-ai-audio-tts

基于阿里云DashScope通义千问TTS模型，将文本转换为高质量拟人语音，支持qwen3-tts-flash等多款模型，适合内容生产与开发集成场景。

语音合成与音频生成

xenodia

Xenodia多模态AI网关支持本地密钥对和CDP托管钱包两种身份认证模式,为Web3应用提供安全的AI推理服务集成方案。

多模态AI网关与钱包认证

ai-mother

统一监控和管理Claude Code、Codex、Gemini等多种AI智能体的执行状态，提供督导、干预和协调能力，充当AI母节点角色

AI智能体编排与监控

acp-fallback

自动按优先级（Codex、Claude、Pi、API）重试ACP厂商，故障时无缝切换，返回首个成功结果并记录日志。

多模型容错调度

architecture-evolution-coordinator

协调星型记忆架构五阶段演进,管理多插件协同,支持理念级项目分析与融合方案生成验证的AI框架系统。

智能记忆架构与多智能体协调

openviking-pro

基于韩文形态素分析的云端Context数据库,通过智能分词和压缩可节省LLM调用token成本96%,支持自动同步和团队协作。

自然语言处理与知识库管理

azure-ai-vision

Azure AI Vision集成方案,支持图像识别、OCR、对象检测等功能,可自动化数据处理和业务流程,适合企业级应用部署。

计算机视觉与图像识别

openclaw-optimizer-pro

针对OpenClaw的专业优化工具,提供token成本削减、性能调优、安全加固一体化解决方案,帮助企业降低AI推理成本30-50%。

AI成本优化与性能调优

text-to-speech-and-voice-cloning-agent

基于Verbatik API，为AI助手赋予文字转语音与声音克隆能力，支持多语言语音生成与自定义声音管理，适合内容创作与自动化配音场景。

语音合成与声音克隆

adaptive-problem-solver

检测安全权限限制，在合规框架内生成多个用户定制化替代方案，提升问题求解灵活性与安全性。

智能问题求解与约束突破

model-selector

自动分析用户查询意图与复杂度，智能路由至精英/均衡/基础三档LLM，在保证质量前提下最大化成本效益。

LLM智能路由与成本优化

kimi-agent-policy

Kimi Agent策略框架,支持步数限制、网页搜索、图像搜索、代码执行、记忆管理等完整工具调用能力,为OpenClaw生态提供原生支持。

AI Agent策略与工具调用

my-soul-upgrade-skill

通过两层模板系统管理全局和智能体级Soul定义,提供自动化重建脚本,实现跨环境配置同步与版本控制。

AI智能体管理与配置

audio-speaker-tools

提供说话人分离、声纹对比和音频处理工具。支持多人音频分离、声音克隆、说话人验证等任务,适合播客、采访、取证等场景。

音频处理与语音识别

ollama-vision

基于Ollama本地部署Qwen3-VL模型,提供图片压缩、描述、OCR和自定义信息抽取能力,完全离线运行保护隐私。

本地视觉模型服务

polymarket-resolution-lattice-trader

通过AI检测Polymarket相关合约间的逻辑矛盾,自动识别套利机会并执行交易,利用时间差和条件依赖关系获利。

金融预测与套利

governance-inheritance

为OpenClaw代理提供组织、团队、项目、会话四层级策略继承系统,支持自动化权限传播与冲突解决,满足企业级治理需求。

AI代理治理与策略管理

emotional-core

为AI代理提供情感响应生成、长期情感记忆和时间感知能力,增强人机交互的自然度和连续性

AI代理情感系统

inception-token-optimizer

针对Inception Labs模型的Token使用优化工具,通过智能提示词分析和模型成本对比,帮助用户降低API调用成本,选择最优模型方案。

AI成本优化与模型选择

pydantic-ai-tool-system

基于Pydantic的AI代理工具框架，提供类型安全的工具注册、上下文处理和文档自动生成能力，简化复杂AI系统开发。

AI代理工具系统

langgraph-code-review

针对LangGraph代码的专业审查工具，检测bug、反模式和优化建议，支持StateGraph、节点、边、检查点等核心组件。

LLM应用开发工具

knowledge-system

基于Markdown的AI Agent知识管理框架。支持人格配置、用户管理、工作规范、工具配置、长期记忆、日志记录、反思改进、定期任务等完整体系，实现多Agent协作与自我迭代。

AI Agent知识管理系统

whyhit2005-zhipu-search

智谱AI官方搜索工具,提供灵活的网页搜索能力。支持实时数据获取、多源信息聚合、中文语义理解,可集成到AI应用中增强知识库。

AI搜索与信息检索

aigc-images

基于BizyAir异步API的批量图片生成工具,支持多密钥并发执行,可从本地或远程读取密钥配置,适合分镜场景图和大批量创意生成

AIGC图片生成

grounding-anything

调用GLM-4.7V多模态能力，通过自然语言指令在图像中精准检测、定位目标对象或文字区域，支持中文指令驱动

多模态视觉定位与目标检测

agent-setup-kit

为OpenClaw Agent提供通用配置框架,支持自然语言命令安装技能、发现书籍资源、集成知识库,降低Agent部署门槛。

Agent框架与自动化

aura-a2a-marketplace

Aura是Agent间任务交易平台，支持Agent发布/执行任务、共享计算资源和存储，实现Agent协作生态。

Agent协作与任务市场

elevenlabs-music-automaton

基于ElevenLabs API的文本转音乐工具。支持歌曲、配乐、铃声等多类型音乐生成,适合视频、游戏、播客等内容创作场景。

音乐生成与音频合成

dialogflow-cx-flows

通过REST API管理Google Dialogflow CX的流程和页面,支持自动化创建和组织对话路径,简化对话代理开发流程,基于v3beta1版本。

对话AI与聊天机器人

ai-model-router-v2

根据任务复杂度与隐私需求，自动在本地与云端AI模型间路由请求，支持自动检测与上下文追踪，实现智能分流。

AI模型调度与路由

tech-news-bulletin

从多个RSS源和TLDR.tech AI通讯聚合最新科技资讯,智能合并去重,每日自动邮件推送统一摘要。

AI资讯聚合与智能推送

paper-view-skill

PaperView提供API接口,可从数据、文本或PDF论文生成ECharts交互图表、AI科学图解和词云,支持学术论文快速可视化展示。

科学可视化与数据分析

gemini-nano-images