文章内容

兰州大学 - 《兰州大学报》

【启物明维】虚实之间,我们是否能够真正识别伪造的声音?

作者:□谭源 刘新    
2023-03-24     浏览(162)     (0)

左为谭源,右为刘新

原创·首发·独家

  在人工智能技术迅速发展的背景下,“声音克隆”早已不再是科幻中遥不可及的臆想,而是可以成熟使用的技术。“声音克隆”系统仅使用几秒钟的样本,便可复刻出与样本相同音色的声音,令人难以区分真假,因此常被用于欺诈目的。目前,业界已有大量研究尝试对合成克隆声音进行检测,这些检测方法大多报告了不错的检测效果。

我校信息科学与工程学院研究团队针对现有检测方案的特征工程方法进行了深入分析,创造性地提出了“说话人无关特征”这一理念,即在音频中除去人声有效信息的部分,这些特征不会影响人类的听觉感知,但它们可以有效地干扰检测系统的识别准确性。团队基于此设计了基于“声音克隆”的新型攻击方法SiF-DeepVC。

通过广泛的真实世界验证证明,SiF-DeepVC+可以让“假声音”变得更“真”,避免克隆声音被现有的“克隆声音检测器”识别出。该攻击方案的提出证明了现有克隆声音检测器仍然存在缺陷,使得现有检测系统在真实世界中的应用价值有所降低,同时在一定程度上改变了该领域的攻防对抗形势,在业界敲响了警钟:现有的防御方案并不安全,提醒相关领域的研究人员继续提高和更新检测假声音的技术,以适应新的攻击方式。

AI可以创作出各种以假乱真的作品,例如文字、图片、视频、音频等。信息安全中的攻防总是有来有往,比如为了应对最近爆火的ChatGPT(一种基于深度学习的自然语言处理模型,能够理解和生成文本),来自斯坦福大学的研究者提出了DetectGPT用于对抗ChatG-PT的滥用。作为AI领域的经典问题,在“声音克隆”领域,也已经有大量研究者提出了用于分辨AI合成声音的检测器。

现有的AI合成声音检测器可以被分为三种类型:基于统计学的方法、基于端到端的深度学习方法和基于图像识别的办法。

基于图像识别的方法很有意思,这个方法是把声音转换成频谱,然后使用现在很成熟的基于人工智能的图片分类技术来进行识别。这些方法的基本原理都是在想办法通过间接特征分辨出真实声音和AI合成声音之间的差异。然而,信息系统中的攻防总是有来有往的,既然有方法能检测出AI的独特的痕迹,那么也可能有办法掩盖掉,构建更锋利的“声音克隆之矛”。这里将要介绍的就是这样的技术。

凭借多年的攻防经验,信息科学与工程学院计算机应用技术专业2019级博士生刘新敏锐地嗅出了现有的“声音检测之盾”中可能存在的缺陷———人的耳朵通常只能听到20赫兹到20000赫兹之间的声音,而这些检测器很可能使用了一些人类不使用的特征来作为判断合成与否的基础。如果我们精心构造这些特征,就可以在不干扰人类声音的前提下,让克隆音频“以假乱真”。

“验证这个猜想是一个很有意思的事情”,信息科学与工程学院计算机科学与技术专业2019级本科生谭源说道,“实验中,我需要在尽量不影响AI合成语音的效果下对其进行修改,这才能既‘骗’过人类也能‘骗’过AI。”团队在经过广泛的调查研究后,谭源复现了现有的多种检测器,并开展了验证性的实验。实验的结果表明,在引入“说话人无关特征”后,现有的检测器会给我们克隆出的音频更高的真实性评分,也就是“比人更像人”。

作为一项首创的攻击技术,团队希望它成为一个新方向的奠基方法。因此,刘新博士决定将其以主题报告的形式向有“黑客奥斯卡”之称的Black>Hat>USA投稿。Black>Hat>大会被公认为世界信息安全行业的最高盛会,也是最具技术性的信息安全会议,每年在美国、欧洲、亚洲各举办一次,其中Black>Hat>USA拥有超过二十五年的历史,最具规模和权威性。

去年8月举行的Black Hat USA 2022共有来自Google Project Zero、德国亥姆霍兹信息安全中心、360漏洞研究院等知名安全研究机构和哈佛大学、加州大学、美国西北大学、普渡大学等知名高校的101个议题入选。该团队也有幸成为唯一入选会议并分享成果报告的中国大陆高校团队。

大会上,刘新和谭源共同做了报告,在分析现有检测技术存在问题的基础上,提出了自己的新型声音克隆攻击方案SiF-DeepVC。同时展示了一系列实验来评估现有的方法和SiF-DeepVC。报告内容让参会者耳目一新,研究者们踊跃尝试了对SiF-DeepVC开源的工具和数据集。

这是谭源同学首次参加Black Hat,接触到世界前沿和顶尖的信息安全成果让他非常兴奋。在被问到未来是否将进一步针对“声音克隆”新型攻防对抗技术进行探索时,作为团队负责人的刘新博士给予了肯定的答复,他表示团队已经取得了进一步的技术突破,目前正在撰写文章,未来也将加快步伐,以期为本领域创立新的攻防范式。

背景资料:

本课题研究团队由兰州大学分布式与嵌入式系统实验室(DSLab)安全团队组成,团队长期从事信息安全攻防及相关技术研究。成立五年来,团队在区块链、代码分析、流量检测领域取得了一系列进展,获甘肃省科技进步二等奖一项,在I-JIM、TDSC、ESEM等知名期刊和会议中发表SCI/EI索引论文二十余篇,其中一篇论文入选ESI高被引。参与本课题的2019级本科生谭源同学目前已推免至团队中,在未来将继续围绕信息安全关键技术开展研究工作。

(谭源,信息科学与工程学院计算机科学与技术专业2019级本科生;刘新,信息科学与工程学院计算机应用技术专业2019级博士生)