🤖 AI与机器学习 AI 工具
共 11,367 个工具,按价值评分排序
parakeet-stt
SKILL基于NVIDIA Parakeet的本地语音转文字工具。支持25种语言,速度比Whisper快30倍,完全离线运行保护隐私,提供OpenAI兼容API接口。
day253-volcengine-ai-audio-tts
SKILL基于火山引擎的文本转语音服务,支持多语言、多音色、自定义语速语调,适用于内容配音、智能客服、有声阅读等场景。
image-reader
SKILL基于豆包、Kimi等国产多模态大模型,提供图像内容识别、语义理解及OCR文字提取能力,支持多模型灵活切换。
minimax
SKILL基于MiniMax多模态API的开发工具包,支持文本、语音、视频、音乐四大能力,内置智能模型路由引擎,自动选择最优成本方案,提供SDK和安全工作流。
x402hub
SKILL为AI代理提供注册、接单、提交交付物、链上USDC收款及代理间消息通信的完整市场基础设施,基于x402协议与Base链构建。
machins
SKILL为AI代理提供去中心化交易平台,支持任务、数据、API、模型买卖,内置托管保护和信用体系,实现Agent间自主协作与价值流转。
chinese-toolkit
SKILL提供中文分词、拼音转换、中英翻译、关键词提取、文本分析等一站式NLP工具,无需调用外部API,本地化处理保护隐私。
agent-training
SKILL系统化培训多Agent团队,统一目标与能力,维护培训手册,执行团队监管与进化检查,确保Agent一致性。
token-saver-skill
SKILL智能压缩AI对话上下文并实现语义级缓存,自动降低OpenClaw平台Token消耗50%-80%,显著削减API调用成本。
hunyuan-image
SKILL基于腾讯混元大模型的文生图API,支持中文提示词,快速生成高质量AI图像,适合批量内容生产场景。
session-cost
SKILL解析OpenClaw会话日志,按Agent和模型维度汇总Token用量、API费用及性能指标,帮助用户掌控AI开支。
ace-banana
SKILL基于AceData Nano Banana API的图像生成编辑工具。支持nano-banana-2模型,自定义宽高比和分辨率,无需本地GPU即可快速生成和编辑图像。
team-discuss
SKILL多智能体结构化讨论工具,支持辩证分析、随机发言顺序、共享状态与多轮对话,模拟真实团队讨论达成共识
letta-cloud-mcp
MCPMCP server for Letta Cloud
hugging-face-cli
CLI通过自然语言调用HF CLI,管理Hugging Face上的AI模型、数据集、Spaces及代码仓库,简化Hub操作流程
jupiter-prediction-market
SKILL基于Node.js的Jupiter预测市场完整API客户端,支持AI代理自动化交易、投资组合管理与预测市场策略执行
inner-life-core
SKILL为OpenClaw智能体提供跨会话记忆能力,解决AI每次对话遗忘用户信息、无法持续成长的核心痛点,实现真正个性化AI体验
alicloud-ai-audio-tts
SKILL基于阿里云DashScope通义千问TTS模型,将文本转换为高质量拟人语音,支持qwen3-tts-flash等多款模型,适合内容生产与开发集成场景。
xenodia
SKILLXenodia多模态AI网关支持本地密钥对和CDP托管钱包两种身份认证模式,为Web3应用提供安全的AI推理服务集成方案。
ai-mother
SKILL统一监控和管理Claude Code、Codex、Gemini等多种AI智能体的执行状态,提供督导、干预和协调能力,充当AI母节点角色
acp-fallback
SKILL自动按优先级(Codex、Claude、Pi、API)重试ACP厂商,故障时无缝切换,返回首个成功结果并记录日志。
architecture-evolution-coordinator
SKILL协调星型记忆架构五阶段演进,管理多插件协同,支持理念级项目分析与融合方案生成验证的AI框架系统。
openviking-pro
SKILL基于韩文形态素分析的云端Context数据库,通过智能分词和压缩可节省LLM调用token成本96%,支持自动同步和团队协作。
azure-ai-vision
SKILLAzure AI Vision集成方案,支持图像识别、OCR、对象检测等功能,可自动化数据处理和业务流程,适合企业级应用部署。
openclaw-optimizer-pro
SKILL针对OpenClaw的专业优化工具,提供token成本削减、性能调优、安全加固一体化解决方案,帮助企业降低AI推理成本30-50%。
text-to-speech-and-voice-cloning-agent
SKILL基于Verbatik API,为AI助手赋予文字转语音与声音克隆能力,支持多语言语音生成与自定义声音管理,适合内容创作与自动化配音场景。
adaptive-problem-solver
SKILL检测安全权限限制,在合规框架内生成多个用户定制化替代方案,提升问题求解灵活性与安全性。
model-selector
SKILL自动分析用户查询意图与复杂度,智能路由至精英/均衡/基础三档LLM,在保证质量前提下最大化成本效益。
kimi-agent-policy
SKILLKimi Agent策略框架,支持步数限制、网页搜索、图像搜索、代码执行、记忆管理等完整工具调用能力,为OpenClaw生态提供原生支持。
my-soul-upgrade-skill
SKILL通过两层模板系统管理全局和智能体级Soul定义,提供自动化重建脚本,实现跨环境配置同步与版本控制。
audio-speaker-tools
SKILL提供说话人分离、声纹对比和音频处理工具。支持多人音频分离、声音克隆、说话人验证等任务,适合播客、采访、取证等场景。
ollama-vision
SKILL基于Ollama本地部署Qwen3-VL模型,提供图片压缩、描述、OCR和自定义信息抽取能力,完全离线运行保护隐私。
polymarket-resolution-lattice-trader
SKILL通过AI检测Polymarket相关合约间的逻辑矛盾,自动识别套利机会并执行交易,利用时间差和条件依赖关系获利。
governance-inheritance
SKILL为OpenClaw代理提供组织、团队、项目、会话四层级策略继承系统,支持自动化权限传播与冲突解决,满足企业级治理需求。
emotional-core
SKILL为AI代理提供情感响应生成、长期情感记忆和时间感知能力,增强人机交互的自然度和连续性
inception-token-optimizer
SKILL针对Inception Labs模型的Token使用优化工具,通过智能提示词分析和模型成本对比,帮助用户降低API调用成本,选择最优模型方案。
pydantic-ai-tool-system
SKILL基于Pydantic的AI代理工具框架,提供类型安全的工具注册、上下文处理和文档自动生成能力,简化复杂AI系统开发。
langgraph-code-review
SKILL针对LangGraph代码的专业审查工具,检测bug、反模式和优化建议,支持StateGraph、节点、边、检查点等核心组件。
knowledge-system
SKILL基于Markdown的AI Agent知识管理框架。支持人格配置、用户管理、工作规范、工具配置、长期记忆、日志记录、反思改进、定期任务等完整体系,实现多Agent协作与自我迭代。
whyhit2005-zhipu-search
SKILL智谱AI官方搜索工具,提供灵活的网页搜索能力。支持实时数据获取、多源信息聚合、中文语义理解,可集成到AI应用中增强知识库。
aigc-images
SKILL基于BizyAir异步API的批量图片生成工具,支持多密钥并发执行,可从本地或远程读取密钥配置,适合分镜场景图和大批量创意生成
grounding-anything
SKILL调用GLM-4.7V多模态能力,通过自然语言指令在图像中精准检测、定位目标对象或文字区域,支持中文指令驱动
agent-setup-kit
SKILL为OpenClaw Agent提供通用配置框架,支持自然语言命令安装技能、发现书籍资源、集成知识库,降低Agent部署门槛。
aura-a2a-marketplace
SKILLAura是Agent间任务交易平台,支持Agent发布/执行任务、共享计算资源和存储,实现Agent协作生态。
elevenlabs-music-automaton
SKILL基于ElevenLabs API的文本转音乐工具。支持歌曲、配乐、铃声等多类型音乐生成,适合视频、游戏、播客等内容创作场景。
dialogflow-cx-flows
SKILL通过REST API管理Google Dialogflow CX的流程和页面,支持自动化创建和组织对话路径,简化对话代理开发流程,基于v3beta1版本。
ai-model-router-v2
SKILL根据任务复杂度与隐私需求,自动在本地与云端AI模型间路由请求,支持自动检测与上下文追踪,实现智能分流。
tech-news-bulletin
SKILL从多个RSS源和TLDR.tech AI通讯聚合最新科技资讯,智能合并去重,每日自动邮件推送统一摘要。
paper-view-skill
SKILLPaperView提供API接口,可从数据、文本或PDF论文生成ECharts交互图表、AI科学图解和词云,支持学术论文快速可视化展示。
gemini-nano-images
SKILL基于Gemini 2.0 Flash的超逼真图像生成工具。支持Instagram内容一键生成、批量创作、风格定制,助力社媒运营提效10倍。