clonev

Skill

by instant-picture

clawhub07/10

使用Coqui XTTS v2克隆任意声音并生成语音。只需提供6‑30秒WAV样本和文本,即可得到克隆声音的音频。支持14+语言。适用场景:①克隆本人或他人声音;②生成特定人物语音;③制作个性化语音消息;④多语言声音克隆(用克隆声音说任意语言)。

基于Coqui XTTS v2的语音克隆工具,仅需6-30秒音频样本即可克隆声音并生成多语言语音,支持14+语言。

📊 商业分析

商业模式
per_use
独特价值
6秒音频即可克隆任意声音,14语言支持,极简调用
竞品
ElevenLabs(质量更高但价格贵、不开源)、Fish Audio(中文支持更好、社区活跃)、OpenAI TTS(品牌强但不支持声音克隆)

🎯 应用场景

目标用户
内容创作者/播客主播短视频与有声书制作者多语言本地化团队

📦 安装方式

openclaw install instant-picture-clonev
🔗 安装/下载链接 →