人工智能机器学习发展很快就能让我们拥有变声功能--人工智能技术网

据著名技术商业类期刊《麻省理工科技评论》报道，机器学习的发展很快就能让我们拥有变声功能，换成不同年龄、性别，甚至是其他人的音色都不是梦。

我是一位中年男子，不妨来听听女版的我。口音、情感和语调都是我的。但我现在听起来像一个声音高亢的年轻女子。我的女性音色其实是由一家叫做Modulate.ai的公司创造的，这家位于美国马萨诸塞州剑桥市的公司能用机器学习技术复制、建模、操纵语音属性。该技术远远超出了简单的语音滤波器，可以让你听起来像电影《星球大战》中的索洛。这种技术可以实时假设任何想要的年龄、性别和语气，或直接把用户的声音变成名人的声音。如果对方和我都愿意，我可以用某位名人的声音跟他进行长时间的电话交谈。

我走访了Modulate的总部，了解了该公司的技术和远大雄心，谈论了使用人工智能模仿他人声音的伦理意义。我还在他们公司的隔音展台上，试用了几款语音皮肤。我发现，Modulate的语音建模技术也不完美，创造出的新声音都有点别扭。但这是一个非常好的开端，在更多的语音数据的训练下，这种算法还能不断完善。它显示了机器学习的进步对数字现实的迅速改变。Modulate利用生成对抗网络（GANs）来捕获和建模语音信号的音频属性。GANs让两个神经网络相互对抗，从而真正地捕捉和再现声音数据集的属性。

随着机器学习的快速发展，两个正在视频通话的人“互换面孔”已能实现，所需软件从网上就能免费下载。人工智能研究人员正在使用GANs和其他技术来操纵视觉、听觉场景，甚至创造出完全虚假的人脸。Modulate在其网站上展示了美国前总统奥巴马的演示语音，联合创始人兼首席执行官迈克·帕帕斯表示，如果有足够的训练数据，任何人的“真声”都能生成。但他补充说，未经所有者许可，该公司不会提供名人变声器，声音欺骗不是开发该软件的初衷。“开发这款软件，并不是为了模仿人类，而是为了给人带来新的机遇。”帕帕斯说。

他们的目标是在一些网络游戏中嵌入程序，玩家可以通过麦克风，变声与陌生人聊天。这虽然可以增强游戏体验，但却也为言语侮辱和骚扰提供了可乘之机。帕帕斯说：“想来一段体验深刻的网聊，声音的作用至关重要。”但有些人不愿意暴露自己的原声，可能是因为觉得匿名更好，或是担心声音会透露出年龄或性别，招来无端骚扰。

Modulate公司也意识到，他们的技术可能会被滥用。该公司表示，他们一定会想办法确保任何用户在复制他人声音前都必须得到本人同意。他们还开发了一种音频水印技术，可以用来检测听到的声音究竟是原声还是复制品。比如说，如果有人利用伪造人声打电话，这个软件就会立刻发出警告。Modulate或许会对技术的滥用加以管制，但市面上还会有其他公司独立开发出这项技术，滥用之风可能难以彻底压制。问题是，这种变声技术的误用能有多广泛？公众对待这项技术又能有多理智呢？

帕帕斯乐观地认为，人工智能造假的潜力往往被夸大了。他表示：“AI造假虽然是每个人都在关注的问题，但这并不意味着它会动摇社会发展的方方面面，我们会有办法解决的。”

继续阅读：

人工智能技术网倡导尊重与保护知识产权。如发现本站文章存在版权等问题，烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至1851688011@qq.com我们将及时沟通与处理。！：首页 > 新闻 » 人工智能机器学习发展很快就能让我们拥有变声功能

相关推荐