人工智能安全.pdf_人工智能安全领域意义资源-CSDN文库

版权申诉

5星 · 超过95%的资源 28 浏览量 2023-06-02 08:30:03 上传评论 1 收藏 213KB PDF 举报

人工智能安全现在有很多技术可以欺骗人工智能，也有很多人工智能技术被用来欺骗人。在人工智能（AI）时代，安全问题不容忽视。近几年，人工智能技术在很多领域都取得了初步的成功，无论是图像分类、视频监控领域的目标跟踪，还是自动驾驶、人脸识别、围棋等方面，都取得了非常好的进展。那么，人工智能技术到底安全不安全? 事实上，目前的人工智能技术还存在很多问题。人工智能并不安全现在有很多技术可以欺骗人工智能，如在图片上加入一些对抗干扰。所谓对抗干扰，就是针对智能判别式模型的缺陷，设计算法精心构造与正常样本差异极小、能使模型错误识别的样本。如图 1 所示，本来是一幅手枪的图片，如果加入一些对抗干扰，识别结果就会产生错误，模型会识别为不是枪。在人的前面挂一块具有特定图案的牌子，就能使人在视频监控系统中"隐身"(见图 2)。在自动驾驶场景下，如果对限速标识牌加一些扰动，就可以误导自动驾驶系统识别成 "Stop"(见图 3)，显然这在交通上会引起很大的安全隐患。另一方面，人工智能的一些技术现在正在被滥用来欺骗人。例如，利用人工智能生成虚假内容，包括换脸视频、虚假新闻、虚假人脸、虚拟社交账户等。图 1 被暴恐检测系统识别成正常图片图 2 在智能监控下隐身图 3 误导自动驾驶系统不只在图片和视频领域，在语音识别领域也存在这样的安全隐患。例如，在语音中任意加入非常微小的干扰，语音识别系统也可能会把这段语音识别错。同样，在文本识别领域，只需要改变一个字母就可以使文本内容被错误分类。除了对抗攻击这种攻击类型外，还有一种叫后门攻击的攻击类型。后门攻击是指向智能识别系统的训练数据安插后门，使其对特定信号敏感，并诱导其产生攻击者指定的错误行为。例如，我们在对机器进行训练时，在某一类的某些样本中插入一个后门模式，如给人的图像加上特定的眼镜作为后门，用一些训练上的技巧让机器人学习到眼镜与某个判断结果(如特定的一个名人)的关联。训练结束后，这个模型针对这样一个人还是能够做出正确的识别，但如果输入另一个人的图片，让他戴上特定的眼镜，他就会被识别成前面那个人。训练的时候，模型里留了一个后门，这同样也是安全隐患。除了对抗样本、后门外，如果 AI 技术被滥用，还可能会形成一些新的安全隐患。例如，生成假的内容，但这不全都是人工智能生成的，也有人为生成的。此前，《深圳特区报》报道了深圳最美女孩给残疾乞丐喂饭，感动路人，人民网、新华社各大媒体都有报道。后来，人们深入挖掘，发现这个新闻是人为制造的。现在社交网络上有很多这样的例子，很多所谓的新闻其实是不真实的。一方面，人工智能可以发挥重要作用，可以检测新闻的真假;另一方面，人工智能也可以用来生成虚假内容，用智能算法生成一个根本不存在的人脸。用人工智能技术生成虚假视频，尤其是使用视频换脸生成某个特定人的视频，有可能对社会稳定甚至国家安全造成威胁。例如，模仿领导人讲话可能就会欺骗社会大众。因此，生成技术是否需要一些鉴别手段或者相应的管理规范，这也是亟须探讨的。例如，生成虚假人脸，建立虚假的社交账户，让它与很多真实的人建立关联关系，甚至形成一些自动对话，看起来好像是一个真实人的账号，实际上完全是虚拟生成的。这样的情况该如何管理还需要我们进一步探索和研究。人工智能安全隐患的技术剖析针对 AI 的安全隐患，要找到防御的方法，首先要了解产生安全隐患的技术。以对抗样本生成为例，其主要分为 2 类：一类是白盒场景下对抗样本生成;另一类为黑盒场景下对抗样本生成。白盒场景的模型参数完全已知，可以访问模型中所有的参数，这个情况下攻击就会变得相对容易一些，只需要评估信息变化的方向对模型输出的影响，找到灵敏度最高的方向，相应地做出一些扰动干扰，就可以完成对模型的攻击。黑盒场景下攻击则相对较难，大部分实际情况下都是黑盒场景，我们依然可以对模型远程访问，输入样本，拿到检测结果，但无法获得模型里的参数。现阶段的黑盒攻击可大致分为 3 类。第一类是基于迁移性的攻击方法，攻击者可以利用目标模型的输入信息和输出信息，训练出一个替换模型模拟目标模型的决策边界，并在替换模型中利用白盒攻击方法生成对抗样本，最后利用对抗样本的迁移性完成对目标模型的攻击。第二类是基于梯度估计的攻击方法，攻击者可以利用有限差分以及自然进化策略等方式来估计梯度信息，同时结合白盒攻击方法生成对抗样本。在自然进化策略中，攻击者可以以多个随机分布的单位向量作为搜索方向，并在这些搜索方向下最大化对抗目标的期望值。第三类是基于决策边界的攻击方法，通过启发式搜索策略搜索决策边界，再沿决策边界不断搜索距离原样本更近的对抗样本。有攻击就有防御，针对对抗样本的随着人工智能技术的飞速发展，AI已经深入到我们生活的各个领域，从日常的智能助手到复杂的自动驾驶系统，AI技术已经带来了翻天覆地的变革。然而，AI技术的普及也带来了不可忽视的安全挑战。当前，我们面临着一个重要的议题——人工智能安全。人工智能技术的安全性问题，主要源于AI系统容易受到对抗性攻击的影响。对抗性攻击指的是通过向输入数据中添加精心设计的干扰，使得原本的AI模型产生错误的判断。例如，在图像识别领域，通过在图片中加入对抗性干扰，可以使AI系统将手枪图片错误识别为其他物品；在视频监控中，特定图案的牌子可以让人在系统中“隐身”；在自动驾驶场景下，对交通标志的轻微修改可能导致AI系统误判限速，埋下严重的安全隐患。 AI技术的滥用也带来了新的问题。一方面，AI可以用来制造虚假内容，如换脸视频、虚假新闻、假人脸和虚假的社交账户。这些内容不仅能够误导公众，还可能用于欺诈和破坏社会稳定。例如，利用AI技术制造的假新闻，可以轻易地在社交网络上引起广泛传播，影响公众对重要事件的看法。另一方面，AI技术还可能被用来进行有针对性的欺骗，例如，通过特定后门模式的设计，使AI系统在面对特定输入时作出错误的判断。在对抗性攻击之外，语音和文本识别领域的安全问题也日益凸显。在语音识别中，微小的干扰就可能导致识别错误；而在文本识别中，改变一个字母即可使文本内容被错误分类。这些例子说明，当前的AI系统在面对对抗性干扰时，表现出明显的脆弱性。为了解决AI的安全性问题，研究者们将攻击类型分为白盒和黑盒攻击。在白盒场景下，攻击者拥有模型的所有参数，攻击相对容易；而在黑盒场景下，攻击者无法获取模型参数，但依然可以通过迁移学习、梯度估计或决策边界搜索等方法生成对抗样本。由于攻击手段的多样性，防御策略也必须多元化。目前，防御措施包括训练二分类器来检测对抗样本、使用对抗训练增强模型的鲁棒性，以及开发更稳健的模型结构。然而，现有的防御手段并非万无一失，随着攻击技术的发展，防御技术也需要不断更新和改进。因此，确保人工智能的安全性是一项复杂而紧迫的任务，这不仅需要算法的不断改进和数据安全的加强，还需要有效的模型验证和监管。在未来的AI安全研究中，开发更加安全的AI模型、制定合理的管理规范和法规以防止技术滥用，保护个人隐私和社会秩序将是关键。跨学科的合作以及全球范围内的共同努力，对于应对AI安全挑战至关重要。只有这样，我们才能充分发挥AI技术的巨大潜力，同时确保技术的安全应用，为社会带来更多福祉。

资源推荐

资源详情

资源评论