人工智能造假音频以假乱真,潜在威胁如何破?
据报道,将来新闻标题可能不再是唯一能够造假的东西,强大的机器学习技术让操作或生成逼真视频和音频内容变得越来越容易,它们能以惊人的准确性让你冒充任何人。俄罗斯一家公司最近推出名为FaceApp的智能手机应用,它可通过添加微笑、加减年龄或更换性别等方式,自动修改某人的面部特征。这款应用还能应用于"美化效果",包括平滑皱纹,更具争议的是能美白皮肤。
不久前,名为Lyrebird的公司也演示了自己的技术,据称可被用于模仿某人的声音。这家公司已经发布模仿美国前总统巴拉克·奥巴马(Barack Obama)、现任总统唐纳德·特朗普(Donald Trump)以及前美国国务卿希拉里·克林顿(Hillary Clinton)声音的音频。
这只是强大的AI算法可被用于生成内容而非仅仅用于分析数据的2个例证。强大的图形硬件和软件以及最新的视频捕获技术,也在推动这种趋势。2016年,斯坦福大学的研究人员演示了换脸程序Face2Face。这套系统可操纵视频画面,以便某人的面部表情与那些正被深度感测摄像头追踪的人相匹配。结果往往产生令人难辨真伪的内容。
正如Lyrebird的创始人所承认的那样,这种操纵声音和面部的能力可能引发许多问题。该公司在网站上发表声明称:"在我们的社会,特别是某些国家的司法领域,语音记录目前依然被视为确凿证据。我们的技术对这类证据的有效性提出质疑,因为它允许人们轻易操纵音频录音。这可能产生潜在的危险后果。"
FaceApp和Lyrebird都利用深度生成卷积网络技术支持自己的产品。这意味着,公司正应用这种近年来才出现的技术作为获取算法的方法,它不再仅被限于分类东西,而是可以自己生成合理的数据。像今天人工智能(AI)执行的许多任务那样,这涉及到使用非常庞大的(或深度)神经网络。这类网络正常情况下需要利用数据训练和调整,以便于它们能够对新输入的数据做出人们预期的响应。举例来说,它们被训练识别照片中的脸部和物体,准确度惊人。
但同样的网络也能基于它们接受训练的内部数据集自己生成内容。这可能促使这类网络形成无中生有的能力,生成几乎可以乱真的图片。将来,使用同样的技术,操纵视频可能也会变得更简单。Lyrebird联合创始人亚历山大·布雷比森(Alexandre de Brébisson)说:"在某个时候,这些神经网络可能生成完整的视频。但这存在更多挑战,因为在视频所代表的更高维度空间中存在更多变量,当前模型依然不够完美。"
由于这种技术属于新兴技术,它可能变得越来越重要,并被用于检测虚假视频和音频。德国弗里德里希·亚历山大大学(Friedrich Alexander)的博士生、Face2Face研究员加斯图斯·蒂斯(Justus Thies)表示,他已经开始一个检测视频中操作痕迹的项目,看起来其很有前途。
- 大尺寸面板价格不涨反跌 市场供需失衡难落幕(07-29)
- Fairchild推出全新品牌,标志着公司的重大转型(03-19)
- 飞兆半导体附属公司崇贸科技荣获发明创作奖(05-14)
- Fairchild通过收购Xsens将战略步伐跨入 快速增长的3D运动追踪市场(05-15)
- Fairchild宣布2014年度北美洲和亚洲功率技术研讨会时间表(04-15)
- Fairchild与Xsens的结合水到渠成(06-09)