山姆·琼斯和肖恩·哈克
互联网上越来越多地存在伪造,篡改或人工创建的媒体,例如图像,视频和音频。 出于从幽默到政治动机的原因,创建了许多软件篡改的图像或视频示例。 辨别什么是真实的能力对于任何向前发展的社会都至关重要。 公众已经对篡改图像感到愤慨,以极高的精确度引起创作者的预期反应。 随着人工智能(AI)的改进,这种趋势只会变得更糟,并且能够创建与现实世界中的设备无法区分的新图像,视频和音频。 需要一种用于验证和认证媒体的标准,否则互联网将迅速发展成为不受信任的媒体。
需要以与安全套接字层(SSL)是大多数安全Web通信所经过的一种开放标准技术相同的方式来开放一个好的标准。 但是,用于媒体验证和认证的标准比SSL更复杂,并且需要权衡以下权衡因素:隐私,媒体质量,准确性和安全性以及易用性。
- 隐私-除非用户希望,否则不得与任何中央平台或其他参与者共享媒体或用户信息。
- 媒体质量-确保某些职业必需的不受干扰的高质量媒体要求。
- 准确性和安全性-确保介质是真实的并且可以被篡改。
- 易于使用-确保解决方案易于采用,因此该解决方案成为标准做法。
为了进一步分解这些折衷,下面是媒体验证和认证的完美标准必须具备的属性列表:
- 开放而普遍 -我们创建的几乎所有内容都需要使用这样的标准,否则未经验证的媒体的长尾巴仍然会造成混乱。 假设必须是,如果不信任某事物,则它可能不是真实的。 (便于使用)
- 快速 -在终端设备上实现标准并执行验证和认证过程必须快速,否则由于某些用例需要提高速度,因此再次面临大规模采用的风险。 (便于使用)
- 无需验证即可阅读 -并且应该可以离线访问,而不能访问互联网。 (便于使用)
- 保留原始媒体文件 -如果不保留本地媒体文件,则由于普遍需要高质量的媒体(例如新闻,电影或艺术),因此存在被大众采用的风险。 (媒体质量)
- 无法提取–如果坏演员可以提取原始媒体,则他们可以用错误的身份重新验证它,从而使该媒体看起来像是来自该演员的真实媒体。 (准确性和安全性)
- 人工创建的媒体无法在真实身份下进行验证-如果人工创建的媒体通过具有真实身份签名的相同验证标准(即水印算法)运行,则错误地认为该媒体是真实且真实的。 (准确性和安全性)
- 身份附件-可以验证一种媒体是真实的,但不是从那里来的。 这对于新闻业这样的用例非常重要,在这种情况下,您可能正在记录政府或公司的滥用行为,并且您不希望将自己的身份附加到媒体上,而是希望其真实可验证。 (准确性和安全性,隐私权)
- 验证-可以真实地检查图像是真实的事实。 (准确性和安全性)
- 身份验证 -可以选择显示媒体来源。 (准确性和安全性)
- 不需要中央平台-如果需要将媒体上传到中央平台,则这会带来很多隐私和成本问题。 (隐私)
但是,其中某些属性存在直接冲突。 例如,保存原始媒体文件以供查看和不提取原始媒体以伪造来源存在冲突。 此外,任何实现都必须更好地处理交付某些资产时的权衡取舍。
当前有一些举措和产品正在以几种不同的方式解决伪造媒体的普遍问题。 三个这样的计划是SurfSafe,TruePic和美国国防部高级计划局(DARPA)耗尽的一些项目-在解决这一非常重要的问题上,都应受到赞扬。 它们大多是早期的计划,进展程度不同,但每个计划至少都有一个重大缺陷。
SurfSafe用作浏览器插件,用于检查“受信任”的新闻站点和事实检查站点。 这里的问题是,将来不可能像人类一样区分真实和不真实,而这种方法依赖于“可信赖”媒体的语料库进行比较。 “受信任”的站点很容易被污染或没有媒体文件的引用,因此此方法可能会输出假阴性或不确定的答案。 [1](准确性和安全性失败)
TruePic拥有一个用于第三方应用程序的应用程序和SDK,可将图像与标识用户,日期和时间的签名一起提交到TruePic的服务器。 这种方法最接近上述所有属性,因为它允许进行验证和身份验证,并且在某种意义上是开放的。 但是,作为一种商业产品,TruePic要求将图像存储在其平台上,这对于从新闻报道到情报的许多用例来说都是一个开端,并且无法扩展到整个互联网。 此外,如果有人注册了应用程序,然后使用该注册信息对人工创建的图像进行了虚假签名,则仅软件签名方法可能会受到攻击。 更好的方法还涉及可信的硬件组件。 (导致隐私权和媒体质量下降)
最后,在DARPA项目中公开谈论了参考AI检测篡改或伪造媒体的参考。 通过查看文件中某些在某些实际情况下无法找到的模式,可以起作用。 这种方法目前可能行得通,但是如果我们假设用于创建媒体的AI将赶上检测技术,并最终以与用作检测的AI一样快的速度发展,那将永远不是一种可靠的方法。 [3](准确性和安全性失败)
本文中提出的想法尚未完全发展,也未达到理想标准的所有特性。 它们旨在作为讨论如何实现此目标的起点。
解决方案1:使用私钥和公钥的不可见水印
有一些研究实例[4]和[5]演示了使用公钥和私钥对人眼不可见的水印方法。 这种高层次的方法如下:
- 私钥和公钥分发给最终用户和设备。
- 每个用户或设备还获得唯一的水印图案以供使用。
- 在创建媒体后,会对其加水印,并且该水印版本会被共享和分发,但是用户希望如此。
- 另一个用户或应用程序可以通过利用用户或设备的公共密钥来尝试显示水印来验证图像的真实性,如果成功,水印将通过标准算法返回。 如果公钥不匹配或图像已被篡改,则水印将无法验证。
这种方法几乎达到了完美标准的所有特性。 不能以原始格式存储媒体。 此外,它仍然容易受到攻击,这些攻击是后来由合法用户或设备的私钥对人工创建的媒体进行签名的。 对此的可能解决方案是要求每个设备以从非法软件无法访问的方式在硬件中存储私钥。 但是,这很困难并且可能无法控制。
而且,这种方法也不是完美的。 根据水印算法的性能,它可能无法通过完美的媒体质量测试,并且容易受到其准确性和安全性的不同攻击。
解决方案2:创建媒体文件格式的新安全版本
当然,这个想法在技术上还没有完全解决,结果可能与解决方案1并没有什么不同。这种新的安全格式集的灵感源于网络中安全数据包封装的工作方式。 邮件的内容经过加密,以使接收者可以接收,并且标头具有有关有效负载的元数据。 这种方法可以采取带水印的媒体文件的形式,该文件也包含有关该媒体的创建者和创建的元数据。 水印需要与图像本身绑定,在这种格式下,没有“原始”图像,因为原始图像将在创建时创建。 普通的智能手机有一个10百万像素的摄像头,即有1000万像素需要进行微调以进行验证。
这种方法将达到与解决方案1相同的要求,但也容易遇到相同的问题。
结论
当前没有提议的技术标准可以完美地发挥所有特性,但是大多数解决方案的想法都需要一个可广泛访问的公钥基础结构(PKI)网络才能正常工作。 作为PKI的替代方案,可以使用不信任的分布式分类帐来存储原始媒体文件,并在其原始数据上附带元数据,但这会带来成本和规模问题。
这篇文章有助于加深对具有普及标准的可能技术实施路径的讨论,该标准可以帮助我们验证和认证媒体。 此外,这里提出的理想属性还应该增加关于如何考虑分割Internet的受信任部分和非受信任部分的讨论。 如果不是真正普及的解决方案,它将变得更加容易,只有需要一定信任级别的行业或用户才能使用给定的解决方案。
这是一个棘手的问题,可能需要对某些关键系统进行行为更改和重大体系结构更改,但这是我们需要解决的问题。