令人毛骨悚然的新AI可以在听到3秒钟后完美模拟您的声音

它是如此出色,以至于它的创建者承认它“可能会遇到滥用的潜在风险”。


现代技术彻底改变了我们完成工作的方式。 甚至是最基本的版本 大多数人的口袋里的智能手机 或我们客厅中的智能家居设备具有令人印象深刻的功能,尤其是当您认为可以通过人工智能(AI)来通过交谈来控制它们时。 但是,即使计算机进步以帮助我们的生活更轻松,他们也进入了新的领域,因为它们能够模仿人类的行为甚至为自己思考。 现在,即使听到三秒钟后,一种新的令人毛骨悚然的AI形式也可以完美地模拟您的声音。 继续阅读以了解有关开创性技术的更多信息。

接下来阅读此信息: 专家说,永远不要以这种方式为您的Android手机充电

微软开发了一种新型的AI,可以完美地模拟您的声音。

A young woman recording her voice on a computer using a microphone and headphones
百叶窗 / soloviova liudmyla

我们都依靠机器以一种或另一种方式使我们的日常生活更轻松。 但是,如果计算机可以介入,并且 模仿你说话的方式 没有其他人注意到吗?

上周,微软的研究人员宣布,他们已经开发了一种新形式的文本到语音AI,他们将其称为Vall-e。 该技术可以通过使用三秒钟的音频剪辑来模拟一个人的声音,甚至可以拾取并保留原始扬声器的情感音调和录制的环境的声音。 该团队表示,该模型可能会方便地创建文本的自动发声,即使它具有类似于Deepfake视频的高度复杂欺骗的潜在风险。

该公司表示,新技术基于“神经编解码语言模型”。

A man sitting on his computer while talking to his phone's virtual assistant
shutterstock / fizkes

在论文中 讨论新技术 ,Microsoft Dubs vall-e“神经编解码器语言模型”。 这意味着,尽管传统的文本到语音(TTS)软件采用书面文字并操纵波形以生成发声,但AI可以拾取语音和特定音频提示的微妙元素,以帮助其创建可靠的娱乐性。 说任何句子的人 根据网站有趣的工程,这已经馈入了它。 AE0FCC31AE342FD3A1346EBB1F342FCB

“为了综合个性化的语音(例如,零击中TT),VALL-E生成了在3秒注册记录的声学令牌上生成相应的声学令牌,并分别限制了说话者和内容信息的音素提示。 团队在论文中解释。 “最后,生成的声学令牌用于将最终波形与相应的神经编解码器合成。”

有关的: 有关更多最新信息,请注册我们的每日新闻通讯

该团队使用了60,000多个小时的记录演讲来训练新的AI。

author writing on computer
迈克尔·朱利叶斯的照片 / shutterstock

为了开发新模型,该团队说,它使用了大约60,000个小时的英语记录语音,这些演讲来自由Meta被称为Librilight组装的音频库中的7,000多个演讲者。 在大多数情况下,录音是从读物中提取的 公共域有声读物 ARS Technica报道,存储在Librivox上。 该团队在试验中说,Vall-E需要三秒钟样本中的声音,以与训练数据中的声音紧密相似,以产生令人信服的结果。

团队现在正在展示他们的工作 发布具体示例 在GitHub页面上使用的软件。 每个人都提供了一个三秒钟的剪辑,该剪辑读取随机文本和“地面真相”,这是录制的示例的示例的示例,读取用于比较的句子。 然后,他们提供了“基线”录制,以显示典型的TTS软件如何生成口语音频和录音的“ vall-e”版本,以与前两个进行比较。

尽管结果并不是完全完美的,但它们确实展示了一些令人信服的例子,其中机器生成的演讲听起来令人震惊。 研究人员还补充说,除了模仿拐点和情感之外,该软件还可以复制记录基本音频的环境,例如,听起来像是有人在户外,在回声室或电话上说话。

到目前为止,微软尚未发布该程序供其他人进行测试或试验。

hands typing on a laptop
iStock

研究团队结束了论文,说他们计划增加培训数据的数量,以帮助该模型改善其说话风格,并在模仿人的声音方面变得更好。 但是目前,微软还阻止了将新软件可用于开发人员或公众进行测试的新软件,这是由于其能够欺骗人们或用于邪恶目的的能力。

作者在他们的结论中写道:“由于Vall-e可以合成维护说话者身份的语音,因此它可能会在滥用模型的情况下承担潜在的风险,例如欺骗语音识别或假冒特定的说话者。” “为了减轻这种风险,可以建立一个检测模型来区分Vall-E是否合成音频剪辑。在进一步开发模型时,我们还将将Microsoft AI原则付诸实践。”


这应该是你麦当劳炸薯条盒上的翻盖真的是什么
这应该是你麦当劳炸薯条盒上的翻盖真的是什么
Publix的20个最糟糕的食物
Publix的20个最糟糕的食物
7未来的汽车奇观值得等待
7未来的汽车奇观值得等待