OmniVoice - 支持 600+ 语种的 AI 语音合成工具

小米推出了最新的开源语音克隆文本到语音（TTS）技术，支持超过600种语言和方言，为语音应用提供丰富的选择。该技术旨在提升用户体验，使语音合成更加自然流畅，助力多语言环境下的沟通和交流。

操作步骤：

下载 .7z 压缩包，推荐用 WinRAR 解压（不要用 Windows 自带的解压，也不要用 360 解压，容易报错）

解压到一个路径里没有中文字符的文件夹，例如 D:\OmniVoice（路径里的文件夹名也不能有中文）

双击文件夹里的一键启动.bat，等待启动

第一次启动会自动下载模型，默认从国内镜像站 hf-mirror.com 下载，速度还可以

等浏览器自动弹出界面，或者手动打开 http://127.0.0.1:8081

使用界面操作：

语音克隆：在文本框输入要生成的文字，上传参考音频，点击”生成”

语音设计：切换到”声音设计”模式，用文字描述声音属性，点击”生成”

生成完成后右侧会出现音频，点击下载按钮保存

语种支持
支持 600+ 语种，常用语种已汉化显示：
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称，提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。

下载地址：https://pan.quark.cn/s/87051c8f0b09

项目地址：https://github.com/k2-fsa/OmniVoice/

OmniVoice

立即下载

OmniVoice – 支持 600+ 语种的 AI 语音合成工具