audio-video-to-text

Skill

by ivan830826

clawhub07/10

音视频转文字技能,使用 Whisper 进行语音识别。支持多种音视频格式,可输出纯文本、SRT/VTT 字幕或 JSON 格式。适用于会议记录、视频字幕生成、采访整理、播客转录等场景。

基于Whisper的音视频转文字工具,支持多种格式输出,可生成SRT/VTT字幕,适用于视频字幕、会议记录、播客转录等场景。

📊 商业分析

商业模式
freemium
独特价值
支持SRT/VTT/JSON多格式输出,一键生成专业字幕,降低内容创作成本
竞品
CapCut(剪辑为主)、网易见外(功能相近但收费高)、阿里云语音识别(API复杂)

🎯 应用场景

目标用户
视频创作者播客主播企业会议记录员在线教育平台新闻媒体

📦 安装方式

openclaw install ivan830826-audio-video-to-text
🔗 安装/下载链接 →