基于 OpenBMB VoxCPM2 模型的开源语音合成生态,覆盖 Android 客户端、OpenAI 兼容接口、一键命令行工具三大场景
基于 OpenAI 兼容接口的 Android 语音合成应用,只需有可访问的 vllm_omni API 地址即可使用(需要API的用户可加入QQ群321776831并联系群主获取)。支持文本转语音与参考音色克隆,内置音频播放器,提供直观的图形界面操作体验。
# 下载安装 APK 后,在设置中配置 API 地址
API 地址: http://your-server:8000
模型名称: voxcpm2
输出格式: WAV / MP3 / FLAC / OGG
兼容 OpenAI TTS API 协议的语音合成命令行工具。通过 /v1/audio/speech 接口将文本转换为语音,支持零样本合成和参考音色克隆,只需有可访问的 vllm_omni API 地址即可使用(需要API的用户可加入QQ群321776831并联系群主获取)。
# 零样本合成
python voxcpm2_speech.py "你好,欢迎使用语音合成"
# 音色克隆
python voxcpm2_speech.py "今天天气不错" --ref-audio speaker.wav
# 自定义 API 服务器
python voxcpm2_speech.py "测试" --api-base http://your-server:8000
一行命令将文本转换为自然语音,支持三种合成模式:零样本、参考音色克隆、带文本引导的语音生成,只需有可访问的 fastAPI API 地址即可使用(需要API的用户可加入QQ群321776831并联系群主获取)。开箱即用,首次运行自动安装依赖。
# 最简单用法
python voxcpm_tts.py "你好,欢迎使用语音合成"
# 音色克隆(推荐带参考文本)
python voxcpm_tts.py "今天天气不错" --prompt ref.wav --prompt-text "参考音频的文字内容"
# 自定义 API 服务器
python voxcpm_tts.py "测试" --api http://your-server:8000