小米推出了最新的开源语音克隆文本到语音(TTS)技术,支持超过600种语言和方言,为语音应用提供丰富的选择。该技术旨在提升用户体验,使语音合成更加自然流畅,助力多语言环境下的沟通和交流。
操作步骤:
下载 .7z 压缩包,推荐用 WinRAR 解压(不要用 Windows 自带的解压,也不要用 360 解压,容易报错)
解压到一个路径里没有中文字符的文件夹,例如 D:\OmniVoice(路径里的文件夹名也不能有中文)
双击文件夹里的 一键启动.bat,等待启动
第一次启动会自动下载模型,默认从国内镜像站 hf-mirror.com 下载,速度还可以
等浏览器自动弹出界面,或者手动打开 http://127.0.0.1:8081
使用界面操作:
语音克隆:在文本框输入要生成的文字,上传参考音频,点击”生成”
语音设计:切换到”声音设计”模式,用文字描述声音属性,点击”生成”
生成完成后右侧会出现音频,点击下载按钮保存

语种支持
支持 600+ 语种,常用语种已汉化显示:
中文、粤语、英语、日语、韩语、法语、德语、西班牙语、俄语、葡萄牙语、阿拉伯语、印地语、泰语、越南语、印尼语、马来语……
语种下拉框显示中文名称,提交给模型时会自动映射回原始英文参数。选择「自动检测」则由模型根据文本内容自动判断。
资源下载
OmniVoice
评论列表 (0条):
加载更多评论 Loading...