speech-recognition

Skill

by demo112

clawhub26/10

通用语音识别 Skill。支持多种音频格式(ogg/mp3/wav/m4a),使用硅基流动 SenseVoice API 进行语音转文字。当用户发送语音消息、音频文件,或需要转录音频时触发。

支持ogg/mp3/wav/m4a多格式音频,调用硅基流动SenseVoice API实现高精度语音转文字,适配中文场景,即发即转。

📊 商业分析

商业模式
per_use
独特价值
多格式音频一键转文字,国产API低延迟低成本
竞品
1. OpenAI Whisper(精度高但需自建);2. 讯飞语音(国内主流但贵);3. 阿里云语音识别(生态完善但集成复杂)

🎯 应用场景

目标用户
内容创作者/播客主企业会议记录需求方开发者/AI应用集成商

📦 安装方式

openclaw install demo112-speech-recognition
🔗 安装/下载链接 →