原创 逛逛 2025-07-27 15:04 北京

?k=7c18ba77&u=https%3A%2F%2Fmmbiz.qpic

先来看一个视频,打开声音。

这是 IndexTTS2 文本转语音模型的演示 Demo,是不是很强大?

事情是这样的,B 站之前开源了一个叫做 IndexTTS 的项目,它能把文本转成语音。

IndexTTS2 在筹备中未发布,他们就把 IndexTTS2 的效果演示视频和音频放到了一个基于 GitHub 仓库搭建的网站里。

?k=919195df&u=https%3A%2F%2Fmmbiz.qpic

这链接被外网网友发现了,在外网疯狂讨论传播起来。

里面罗列了 IndexTTS2 模型的效果示例,看完后,外网网友说 IndexTTS2 是目前最逼真、最具有表现力的文本转语音模型。

?k=352dbff2&u=https%3A%2F%2Fmmbiz.qpic

相当有意思,再来看看几个演示:

目前只有上一个版本 IndexTTS 开源了,现在在 GitHub 上获得了4K 的 Star。

开源地址:https://github.com/index-tts/index-tts

?k=fef19135&u=https%3A%2F%2Fmmbiz.qpic

相比于上一个版本,IndexTTS2 不仅支持高质量的零样本语音合成,还大幅度提升情感表达的真实感和表现力,合成的语音情绪更自然和感染了。

以「可控时长+解耦情感」重构了自回归语音合成的能力边界,为影视级语音生成树立新标准。

在官方的开源主页,并没有找到 IndexTTS2 开源模型的仓库,只有公开的论文和演示Demo。

?k=7c0c7617&u=https%3A%2F%2Fmmbiz.qpic

演示网页:https://index-tts.github.io/index-tts2.github.io/

?k=bb34ba98&u=https%3A%2F%2Fmmbiz.qpic

论文地址:https://arxiv.org/pdf/2506.21619v1

?k=e03b00f6&u=https%3A%2F%2Fmmbiz.qpic

先蹲一波吧,如果开源了再推送给大家。

都看到这了,关注下吧。

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

#逛逛GitHub #开源 #GitHub #文本转语音 #TTS 

阅读原文

跳转微信打开