没有合适的资源?快使用搜索试试~ 我知道了~
Pg-Rnn 一种基于递归神经网络的密码猜测模型 - 智能系统学报 - 20181
试读
8页
需积分: 0 1 下载量 193 浏览量
更新于2022-08-03
收藏 906KB PDF 举报
《PG-RNN: 一种基于递归神经网络的密码猜测模型》
在当前的网络安全环境中,用户名-密码认证是最常见的身份验证方式。然而,由于获取真实密码的难度极高,密码猜测技术成为了评估密码安全性、检测密码保护机制漏洞的重要手段。本文提出的PG-RNN(Password Guessing Recurrent Neural Network)模型,旨在通过递归神经网络自动学习密码的分布特征和字符规律,以生成高度真实的密码集。
递归神经网络(RNN)是一种具有循环结构的深度学习模型,尤其适合处理序列数据,如文本。在密码生成领域,RNN可以捕捉密码中的长期依赖关系,这对于理解和模仿人类设置密码的习惯至关重要。与传统的基于规则的密码生成方法不同,PG-RNN无需人为设定规则,而是让网络自身从训练数据中学习模式,从而生成更接近实际的密码。
文章对比了PG-RNN与其他模型的性能,如马尔可夫模型(Markov Model)。马尔可夫模型是早期常用的密码生成工具,但其对密码结构和长度分布的模拟能力有限。实验结果显示,PG-RNN在结构字符类型和密码长度分布上更接近原始训练数据,体现了RNN在捕捉复杂模式上的优势。
此外,PG-RNN与基于生成对抗网络(GAN)的PassGAN模型进行了比较。PassGAN是一种利用对抗学习生成密码的模型,已在密码生成领域取得了不错的效果。尽管如此,PG-RNN在真实密码匹配度上仍然表现出色,相比于PassGAN提升了1.2%,这进一步证明了PG-RNN在模拟真实密码分布方面的优越性。
文章作者们讨论了PG-RNN在密码安全研究中的应用前景。通过生成大量的“可能”密码,PG-RNN可以帮助评估现有的密码策略,发现潜在的安全隐患,为改进密码策略提供依据。同时,这种方法也可以用于测试和优化密码强度检测算法,提升整体的网络安全水平。
《PG-RNN: 一种基于递归神经网络的密码猜测模型》展示了递归神经网络在密码生成领域的潜力,为密码安全研究提供了新的视角和工具。通过自动学习和模拟密码特征,PG-RNN模型有望推动密码学和网络安全研究的进步。
DOI: 10.11992/tis.201712006
网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180410.1436.020.html
PG-RNN: 一种基于递归神经网络的密码猜测模型
滕南君
1,2
,鲁华祥
1,3,4
,金敏
1
,叶俊彬
1,2
,李志远
1,2
(1. 中国科学院 半导体研究所,北京 100083; 2. 中国科学院大学,北京 100089; 3. 中国科学院 脑科学与智能技
术卓越创新中心,上海 200031; 4. 半导体神经网络智能感知与计算技术北京市重点实验室,北京 100083)
摘 要:用户名—密码(口令)是目前最流行的用户身份认证方式,鉴于获取真实的大规模密码明文非常困难,
利用密码猜测技术来生成大规模密码集,可以评估密码猜测算法效率、检测现有用户密码保护机制的缺陷等,
是研究密码安全性的主要方法。本文提出了一种基于递归神经网络的密码猜测概率模型(password guessing
RNN, PG-RNN),区别于传统的基于人为设计规则的密码生成方法,递归神经网络能够自动地学习到密码集本
身的分布特征和字符规律。因此,在泄露的真实用户密码集上训练后的递归神经网络,能够生成非常接近训练
集真实数据的密码,避免了人为设定规则来破译密码的局限性。实验结果表明,PG-RNN生成的密码在结构字
符类型、密码长度分布上比Markov模型更好地接近原始训练数据的分布特征,同时在真实密码匹配度上,本文
提出的PG-RNN模型比目前较好的基于生成对抗网络的PassGAN模型提高了1.2%。
关键词:密码生成;深度学习;递归神经网络;Markov;密码猜测
中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2018)06−0889−08
中文引用格式:滕南君, 鲁华祥, 金敏, 等. PG-RNN: 一种基于递归神经网络的密码猜测模型[J]. 智能系统学报, 2018, 13(6):
889–896.
英文引用格式:TENG Nanjun, LU Huaxiang, JIN Min, et al. PG-RNN: a password-guessing model based on recurrent neural net-
works[J]. CAAI transactions on intelligent systems, 2018, 13(6): 889–896.
PG-RNN: a password-guessing model based on recurrent neural networks
TENG Nanjun
1,2
,LU Huaxiang
1,3,4
,JIN Min
1
,YE Junbin
1,2
,LI Zhiyuan
1,2
(1. Institute of Semiconductors, Chinese Academy of Sciences, Beijing 100083, China; 2. University of Chinese Academy of Sci-
ences, Beijing 100089, China; 3. Center for Excellence in Brain Science and Intelligence Technology, Chinese Academy of Sciences,
Shanghai 200031, China; 4. Semiconductor Neural Network Intelligent Perception and Computing Technology Beijing Key Lab,
Beijing 100083, China)
Abstract: Passwords are the most popular way of user ID authentication. However, it is rather difficult to obtain large-
scale real text passwords. Generating large-scale password sets based on password-guessing techniques is a principal
method to research password security, which can be applied to evaluate the efficiency of password-guessing algorithm
and detect the defects of existing user-password protective mechanisms. In this paper, we propose a password guessing-
based recurrent neural network (PG-RNN) model. Our model can directly and automatically infer the distribution char-
acteristics and character rules from the data of password sets, which is different from the traditional password generat-
ing method based on manual design rule. Therefore, an RNN model that has been trained on a disclosed real user pass-
word set can generate passwords very close to the real data of the training set, which avoids the limitations of manual
setting for password guessing. The results of our experiments show that PG-RNN can generate passwords closer to
primitive data distribution more than Markov in password length and character structure categories. When evaluating on
large password dataset, the proposed PG-RNN model matching outperforms that of PassGAN, which is based on gener-
ative adversarial networks, by more than 1.2%.
Keywords: password generation; deep learning; recurrent neural networks; Markov; password guessing
在网络时代普及的今天,密码是一种被广泛
使用的用户验证方法。主要原因在于,一方面密
码方便理解、使用,另一方面较容易实现。然而,
收稿日期:2017−12−05. 网络出版日期:2018−04−10.
基金项目:北京市科技计划课题(Z171100002217094);中科院战
略性先导科技专项(A类)(XDA18040400).
通信作者:金敏. E-mail:jinmin08@semi.ac.cn.
第 13 卷第 6 期
智 能 系 统 学 报
Vol.13 No.6
2018 年 12 月
CAAI Transactions on Intelligent Systems
Dec. 2018
让人担忧的是,密码的使用者总是倾向于设置一
些强度低、易猜测的弱密码,例如:abcdefg,
1234567等。实际上,密码的安全性和方便性之
间,总是存在某种程度上的折中:即强密码不容
易被攻击破解,但是对于用户来说,很难记忆;而
弱密码虽然方便记忆和使用,但却容易被猜到。
现阶段大部分网站在用户设定密码时,都会加入
密码强度测试机制(一般分为“弱、中等、强”3个
级别)这样的预防措施能够在一定程度上提醒用
户避免设定过于简单的密码。这些机制通常都是
基于规则的,比如:要求密码必须包含一个数字、
一个小写字母或者一个特殊字符
[1]
,密码长度在
6~18位之间等。
如何更快、更有效地找到有效的用户密码,
一直以来都是一个活跃的研究领域。目前流行的
基于规则的密码猜测工具hash-cat,John the ripper
(JTR)
[2-3]
, 主要通过原有的密码字典或泄露的密码
数据集,加上密码规则的模糊化和变形来生成新
的大量近似的密码。文献[4]开发了一种基于模
板结构的密码模型PCFGs,采用了上下文无关法,
这种方法背后的思想是将密码切分成不同的模板
结构(e.g.,5个小写字母加3个数字),让终端产生
的密码符合这样的密码结构。每个生成的密码
P概率等于该密码结构类型的概率P
T
与各子结
构的概率乘积,例如,如果一个密码由两部分组
成:字母+数字,那么该密码的生成概率则为P=
P
letter
P
digit
P
T
,值得一提的是,PCFGs模型在针对长
密码时有着较好的效果。文献[1]采用一种基于
马尔可夫的模型,该模型通过评估n元概率的原
理,在衡量密码强度上性能要优于基于规则的方
法。文献[6]系统地比较和实现了目前流行的几
种密码猜测的技术来评估密码强度,发现字典攻
击在发现弱密码时最有效,它们能够快速地以哈
希校验的方法快速检验大量规则相似的密码,而
马尔可夫链模型则在强密码时表现更加突出。所
有的这些攻击方法随着搜索空间的不断扩大,有
效性会出现指数型的下降
[7]
。
尽管上述的这些方法,都能够在一定程度上
弥补人为设定密码规则的一些不足,但是这些方
法往往也包含大量非真实用户设置密码
[5]
;此外,
密码规则的确立和启发式探索依然需要大量密码
专家的参与。对于人为设定的密码,在一定程度
上,可以将其看成语言的延伸,因此,明文密码的
设置习惯依然符合人类的表达习惯;在本文中我
们希望能够直接、有效地挖掘出密码的一些内在
的规律或特征。文献[8-9]中,展示了递归神经网
络能够很好地学习到文本数据特征,并且生成一
些之前从未出现过的新字符组合。这表明,递归
神经网络并不仅仅只是简单的复刻、重现训练数
据,而是通过内部的特征表示不同的训练样本,
在高维度中综合重构出新的数据。我们的PG-
RNN模型很大程度上是基于之前的这些方法,旨
在通过小规模泄露密码样本数据,生成更多符合
真实用户密码样本分布空间特征的密码,提高密
码猜测算法效率;同时,通过端到端的小模型生
成方式,能够有效地扩充密码攻击字典,缩小密
码猜测空间。
预测是一个概率问题,对于一个训练好的RNN
网络,给定一串输入字符序列,然后计算出下一
个字符的概率分布并且根据概率生成下一个出现
的字符,并将当前时刻的字符作为下一步网络的
输入。由于密码本身就是一串字符串,因此,密
码的生成和文本生成之间有着非常相似的特点。
最早尝试使用递归神经网络来做密码猜测攻击的
是一篇博客
[10]
,它的想法是通过一大堆已经被破
解的密码,产生新的、有效的密码,来预测那些还
没有被破解的密码。但是遗憾的是,作者只是简
单地搭建了个RNN模型,并没有对模型进行调整
和修改,每个模型只生成了很少的密码数量,而
且匹配上的密码数量也非常有限,以至于作者对
这种方法可行性表示怀疑。最近,文献[11]第1次尝试
了使用生成对抗网络
[12]
(generative adversarial
networks, GAN)来进行密码猜测攻击。在生成对
抗网络PassGAN中,生成网络G和对抗网络D采
用的都是卷积神经网络,生成网络G接受输入作
为噪声向量,前向传播经过卷积层后输出一个长
度为10的one-hot编码的字符序列。这些字符序
列经过Softmax非线性函数之后,进入对抗网络
D中进行判别。在测试中,文献[11]通过两个网
站公开泄露的密码数据集来训练PassGAN
模型,然后生成不同数量级别的密码数量,结果
显示他们的模型能够在测试密码数据中匹配上一
定数量的密码。Melicher等
[13]
提出了一种快速的
密码猜测方法,他们采用了复杂的3层长短时记
忆(long-short term memory, LSTM)递归层和两层
全连接层的网络来产生新的密码字符序列。在测
评中,文献[13]基于蒙特卡罗仿真的方法:在一个
非常大的数量范围内(10
10
~10
25
),对模型在5组密
码长度、字符类型都不同的测试数据上进行测
试,结果表明他们的方法性能要优于基于字典和
规则的Hash-cat与JTR,以及基于概率的PCFGs、
Markov模型。
·890·
智 能 系 统 学 报 第 13 卷
剩余7页未读,继续阅读
资源推荐
资源评论
2021-01-20 上传
141 浏览量
2019-10-11 上传
2019-09-17 上传
116 浏览量
2021-09-20 上传
125 浏览量
163 浏览量
5星 · 资源好评率100%
140 浏览量
5星 · 资源好评率100%
2019-09-18 上传
2021-09-20 上传
129 浏览量
2019-09-18 上传
152 浏览量
2024-09-14 上传
5星 · 资源好评率100%
2021-10-02 上传
5星 · 资源好评率100%
185 浏览量
104 浏览量
114 浏览量
2019-09-17 上传
2019-08-16 上传
2019-08-11 上传
资源评论
weixin_35780426
- 粉丝: 26
- 资源: 286
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功