翻译翻译,什么叫 F**king 惊喜?
原创 逛逛 2025-07-27 15:04 北京
先来看一个视频,打开声音。
这是 IndexTTS2 文本转语音模型的演示 Demo,是不是很强大?
事情是这样的,B 站之前开源了一个叫做 IndexTTS 的项目,它能把文本转成语音。
IndexTTS2 在筹备中未发布,他们就把 IndexTTS2 的效果演示视频和音频放到了一个基于 GitHub 仓库搭建的网站里。
这链接被外网网友发现了,在外网疯狂讨论传播起来。
里面罗列了 IndexTTS2 模型的效果示例,看完后,外网网友说 IndexTTS2 是目前最逼真、最具有表现力的文本转语音模型。
相当有意思,再来看看几个演示:
目前只有上一个版本 IndexTTS 开源了,现在在 GitHub 上获得了4K 的 Star。
开源地址:https://github.com/index-tts/index-tts
相比于上一个版本,IndexTTS2 不仅支持高质量的零样本语音合成,还大幅度提升情感表达的真实感和表现力,合成的语音情绪更自然和感染了。
以「可控时长+解耦情感」重构了自回归语音合成的能力边界,为影视级语音生成树立新标准。
在官方的开源主页,并没有找到 IndexTTS2 开源模型的仓库,只有公开的论文和演示Demo。
演示网页:https://index-tts.github.io/index-tts2.github.io/
论文地址:https://arxiv.org/pdf/2506.21619v1
先蹲一波吧,如果开源了再推送给大家。
都看到这了,关注下吧。
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。