声音克隆的工具很多人问我,一直没有看到合适的,直到今天测试了下F5-TTS,觉得效果确实不错,拿来复制自己的声音很方便呀,而且提供的是整合包,大家使用也简单,来给大家分享和演示一下这款工具

本期用到的工具是F5-TTS,由上海交通大学研发,完全免费,此次带来的是整合包,先安装依赖,再运行启动器。使用很简单。

图片[1] | F5-TTS声音克隆工具,一键克隆任何人的声音! | i3综合社区

F5-TTS声音克隆(Windows)

软件特点

  • 使用简单,一键启动,克隆简单,导入15秒的音频,即可一键复刻声音
  • 软件启有点慢,时间在30s-3min左右,到时候它会自动跳转浏览器。
  • 支持克隆麦克风录制的声音,也可以上传别人的声音克隆
  • 纯本地运行,免费使用,无广告,无需安装啥东西

使用教程

软件下载后解压,运行下图中的程序,稍等一会会自动打开浏览器工作界面。

图片[2] | F5-TTS声音克隆工具,一键克隆任何人的声音! | i3综合社区

会有一个黑色的窗口,我们不要动,缩小就行了。

图片[3] | F5-TTS声音克隆工具,一键克隆任何人的声音! | i3综合社区

自动打开浏览器工作界面,我们可以上传一个音频或是自己录音都可以。

图片[4] | F5-TTS声音克隆工具,一键克隆任何人的声音! | i3综合社区

使用简单,上传一段几秒的音频,再写上一段自己要朗读的文字,点击生成即可,看下图。

图片[5] | F5-TTS声音克隆工具,一键克隆任何人的声音! | i3综合社区

顺便再说下这个项目的参数和其他玩法:

1. 合成音频的时候,可以看见有2个类型,F5和E2,两者的区别在于F5训练更快,E2还原度更好。但是我实测下来,感觉F5效果更好,大家可以自己测试下看看。

2. 生成播客功能(Podcast)
就是可以上传2个人的音频,然后输入对话的文本,可以合成语音播客。

3. 多语气音频合成
就是允许你上传不同语气,比如开心、伤心、愤怒等情绪的音频,然后你输入你要合成的文本,在文本的指定位置用花括号指定情绪,然后合成语音,这样合成的语音就带有情绪更逼真了。

这个项目总体来说非常不错,有需求的小伙伴不要错过,上面的一些功能都可以自己去测试体验一下,今天就分享到这里啦~

F5-TTS声音克隆工具:https://pan.quark.cn/s/60333d6fd83a

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。