以AI治人脸篡改,网易易盾在国家级人工智能大赛中再夺魁

发表时间:2021-03-04

2020年12月23日,第二届中国人工智能高峰论坛暨多媒体信息识别技术竞赛在厦门顺利落幕,发布会对外公布了多项人工智能AI领域的技术创新成果。

在本次竞赛中,网易易盾荣获“视频深度伪造检测”赛道最高级A级证书最高级。值得一提的是,网易易盾凭借过硬的技术能力连续两年在该项赛事中获得最高荣誉。在去年第一届赛事中,网易易盾一举拿下“旗帜识别”赛道最高级证书。

中国人工智能大赛是在中央网信办、公安部等多个部委指导下,由厦门市人民政府主办的大型系列赛事活动,自2019年以来每年召开一届,旨在深入贯彻关于人工智能系列重要讲话精神,以竞赛方式解决现实场景中需求问题,发掘一批人工智能领域的技术领先团队,加速人工智能的技术发展和应用创新。

在去年的基础上,本次竞赛项目难度有了较大幅度的提升,主要涵盖视频、音频、图像领域。赛题也更加贴合当前互联网面临的现实问题,涵盖视频深度伪造检测、音频深度伪造检测、变种同源音频检索、特定行为识别、复杂场景文本识别OCR这5个方向。赛事从10月持续到12月底,吸引了国内高校、科研机构、企业和创业团队数百支团队参加。根据竞赛规则,各支参赛队伍要在竞赛平台上针对组委会设定的人工智能技术赛题进行公开竞赛。

在本次竞赛上,网易易盾在对数损失和平均耗时两项指标上取得了出色的成绩,成为本次多媒体信息识别技术竞赛获得A级认证的企业。

视频深度伪造Deepfake是近年来被广泛热议的互联网话题。从“假靳东”直播到美国大选中的“假总统”宣言,从声音到外貌,人工智能编造出的另类现实掀起更大的波澜。

当前,通过人工智能技术手段将视频中的人脸篡改为其他人物变得并不困难,随着深度学习技术的发展,更换人脸后的伪造视频越来越“真实”,很多时候肉眼难以辨别出视频是否经过伪造。

这一现状给互联网安全带来了巨大的挑战,在准入真人验证、个人隐私保护、谣言排查、版权保护等各个层面,都将受到视频伪造技术带来的强烈冲击。如何能够精准识别深度伪造视频是当前人工智能领域的一项重要研究内容。

与一般的人工智能类比赛不同,本项赛事不提供训练数据,仅提供少量测试用例。这就意味着参赛队伍不仅要有强大的算法能力,同时也要能够从容应对少量样本场景。

“伪造人脸检测可以近似抽象为细粒度图像/视频识别问题,需要区分的类别非常接近,识别难度很高。模型在伪造算法以及伪造后处理方式上过拟合很严重,合理的训练数据选择、恰到好处的数据增强、娴熟的模型训练技巧是成功的关键。”网易易盾的参赛团队表示,“简单而言,炼丹火候力度至关重要。”

在本次比赛过程中,网易易盾完成了一系列精细化工作。首先,在伪造样例生成方面,易盾做了大量精心准备工作,能够为模型训练、测试提供全面充分的素材。其次,在模型训练方面,易盾凭借日常工作中积累的训练与评测技术,能够从多个方面提升模型的判别能力。其中,易盾针对不同人脸伪造算法训练模型,构建了一个大规模的模型备选库。到了竞赛提交阶段,针对不同的模型、不同的映射方式,易盾做了大量的对比实验。得益于AI团队在音视频内容安全相关业务中的经验积累和技术沉淀,各个环节开展顺利。

目前,网易易盾的视频伪造检测能力已经尝试应用在点播、直播视频等场景下的内容安全检测能力中。在真实场景下,甚至可以应对不同清晰度、不同肤色甚至大侧脸的案例。然而,人脸伪造算法与伪造检测算法属于对抗任务,为了保证识别效果,一方面要跟进最前沿的伪造技术,另一方面需要去探索泛化能力更强的检测算法,从根本上缓解问题。

除了视频伪造检测能力,网易易盾在2020年度上线了多个全新服务类型,包括低俗内容、复杂广告、毒品、恐怖元素、宗教服饰等识别服务,同时也全面升级了语音内容审核能力,可提供更优质的音视频解决方案。在这一基础上,易盾技术团队不但构建了“自主发现-精细排查-循环迭代”的完整技术链路,能够灵活高效响应紧急问题,并形成了算法极速定制机制,能够在短周期内训练出满足客户需要的个性化算法模型,进一步确立了内容安全领域技术能力的领先性。

在不断进化的过程中,网易易盾的内容安全服务着眼于客户实际问题,通过打造更精细、更灵活、更先进的技术能力,尽心为客户创造真实业务价值。