OPEN SOURCE · TEXT-TO-SPEECH

VoxCPM2
语音合成工具集

基于 OpenBMB VoxCPM2 模型的开源语音合成生态,覆盖 Android 客户端、OpenAI 兼容接口、一键命令行工具三大场景

3
开源项目
2
API 协议
4
音频格式
探索项目
Open Source Projects

选择适合你的工具

📱

VoxCPM2 TTS App

基于 OpenAI 兼容接口的 Android 语音合成应用,只需有可访问的 vllm_omni API 地址即可使用(需要API的用户可加入QQ群321776831并联系群主获取)。支持文本转语音与参考音色克隆,内置音频播放器,提供直观的图形界面操作体验。

Android Java OkHttp OpenAI API
🎙️文本转语音
🧬音色克隆
🎵多格式输出
🔓允许 HTTP
🔊即时播放
💾一键保存
# 下载安装 APK 后,在设置中配置 API 地址 API 地址: http://your-server:8000 模型名称: voxcpm2 输出格式: WAV / MP3 / FLAC / OGG
🔌

VoxCPM2 OpenAI Skill

兼容 OpenAI TTS API 协议的语音合成命令行工具。通过 /v1/audio/speech 接口将文本转换为语音,支持零样本合成和参考音色克隆,只需有可访问的 vllm_omni API 地址即可使用(需要API的用户可加入QQ群321776831并联系群主获取)。

Python OpenAI Compatible CLI httpx
零样本合成
🧬音色克隆
🔗OpenAI 兼容
🌐本地/远程 API
📎多格式音频输入
📦零配置安装
# 零样本合成 python voxcpm2_speech.py "你好,欢迎使用语音合成" # 音色克隆 python voxcpm2_speech.py "今天天气不错" --ref-audio speaker.wav # 自定义 API 服务器 python voxcpm2_speech.py "测试" --api-base http://your-server:8000
🎯

VoxCPM2 TTS Skill

一行命令将文本转换为自然语音,支持三种合成模式:零样本、参考音色克隆、带文本引导的语音生成,只需有可访问的 fastAPI API 地址即可使用(需要API的用户可加入QQ群321776831并联系群主获取)。开箱即用,首次运行自动安装依赖。

Python CLI aiohttp TTS
零样本合成
🧬参考音色克隆
📝文本引导合成
🎶MP3 输出
⚙️CFG 调节
🚀开箱即用
# 最简单用法 python voxcpm_tts.py "你好,欢迎使用语音合成" # 音色克隆(推荐带参考文本) python voxcpm_tts.py "今天天气不错" --prompt ref.wav --prompt-text "参考音频的文字内容" # 自定义 API 服务器 python voxcpm_tts.py "测试" --api http://your-server:8000
Architecture

工作原理

📝 文本输入
App / CLI / Skill
VoxCPM2 Model
🔊 语音输出
所有工具均基于 OpenBMB VoxCPM2 模型,通过 vllm_omni/fastAPI 服务部署 API 接口