moss-transcribe-diarize

Skill

by helloeveryworlds

clawhub07/10

MOSS 多说话人转写技能。支持 URL / 本地文件 / Base64 音频输入,输出带时间戳与 speaker 的结构化转写结果(JSON、逐段文本、按说话人汇总)。用于会议纪要、访谈录音、多人对话整理。需要 API 凭证(环境变量:MOSS_API_KEY,兼容 MOSI_TTS_API_KEY / MOS...

支持URL/本地/Base64多格式音频输入,自动识别多说话人并生成带时间戳的结构化转写,输出JSON/文本/按说话人汇总三种格式,适用会议纪要、访谈录音、多人对话整理。

📊 商业分析

商业模式
freemium
独特价值
一体化多说话人转写+按说话人汇总,会议纪要自动化生成,无需二次处理
竞品
讯飞听见(准确率高但价格贵¥1.5/分钟)、阿里云ASR(功能全但需自建说话人分离)、Google Speech-to-Text(国内访问受限)

🎯 应用场景

目标用户
企业会议记录员与HR媒体采编与访谈工作者法律/医疗行业文档整理人员

📦 安装方式

openclaw install helloeveryworlds-moss-transcribe-diarize
🔗 安装/下载链接 →