【免费】口令安全研究进展_王平1资源-CSDN文库

需积分: 0 168 浏览量 2022-08-04 14:32:25 上传评论收藏 3.01MB PDF 举报

资源详情

资源评论

资源推荐

书书书

计算机研究与发展

ＤＯＩ

：

１０．７５４４

／

ｉｓｓｎ１０００

－

１２３９．２０１６．２０１６０４８３

Ｊｏｕｒｎａｌ

　

ｏｆ

　

Ｃｏｍ

ｐ

ｕｔｅｒ

　

Ｒｅｓｅａｒｃｈ

　

ａｎｄ

　

Ｄｅｖｅｌｏ

ｐ

ｍｅｎｔ

　

５３

（

１０

）：

２１７３

－

２１８８

，

２０１６

　

收稿日期

：

２０１６

－

０６

－

１５

；

修回日期

：

２０１６

－

０９

－

０７

　

基金项目

：

国家重点研发计划项目

（

２０１６ＹＦＢ０８００６０３

）；

国家自然科学基金项目

（

６１４７２０１６

，

６１４７２０８３

）

Ｔｈｉｓ

　

ｗｏｒｋ

　

ｗａｓ

　

ｓｕ

ｐｐ

ｏｒｔｅｄ

　

ｂ

ｙ

　

ｔｈｅ

　

Ｎａｔｉｏｎａｌ

　

Ｋｅ

ｙ

　

Ｒｅｓｅａｒｃｈ

　

Ｐｒｏ

ｇ

ｒａｍ

　

ｏｆ

　

Ｃｈｉｎａ

（

２０１６ＹＦＢ０８００６０３

）

ａｎｄ

　

ｔｈｅ

　

Ｎａｔｉｏｎａｌ

　

Ｎａｔｕｒａｌ

　

Ｓｃｉｅｎｃｅ

Ｆｏｕｎｄａｔｉｏｎ

　

ｏｆ

　

Ｃｈｉｎａ

（

６１４７２０１６

，

６１４７２０８３

）

．

口令安全研究进展

王

　

平

１

，

３

　

汪

　

定

１

　

黄欣沂

２

１

（

北京大学信息科学技术学院

　

北京

　

１００８７１

）

２

（

福建师范大学数学与计算机科学学院

　

福州

　

３５０１１７

）

３

（

北京大学软件与微电子学院

　

北京

　

１０２６００

）

（

ｗａｎ

ｇ

ｄｉｎ

ｇｇ

＠

ｐ

ｋｕ．ｅｄｕ．ｃｎ

）

Ａｄｖａｎｃｅｓ

　

ｉｎ

　

Ｐａｓｓｗｏｒｄ

　

Ｓｅｃｕｒｉｔ

ｙ

Ｗａｎ

ｇ

　

Ｐｉｎ

ｇ

１

，

３

，

Ｗａｎ

ｇ

　

Ｄｉｎ

ｇ

　

１

，

ａｎｄ

　

Ｈｕａｎ

ｇ

　

Ｘｉｎ

ｙ

ｉ

　

２

１

（

Ｓｃｈｏｏｌ

　

ｏ

ｆ

　

Ｅｌｅｃｔｒｏｎｉｃｓ

　

Ｅｎ

ｇ

ｉｎｅｅｒｉｎ

ｇ

　

ａｎｄ

　

Ｃｏｍ

ｐ

ｕｔｅｒ

　

Ｓｃｉｅｎｃｅ

，

Ｐｅｋｉｎ

ｇ

　

Ｕｎｉｖｅｒｓｉｔ

ｙ

，

Ｂｅｉ

ｊ

ｉｎ

ｇ

１００８７１

）

２

（

Ｓｃｈｏｏｌ

　

ｏ

ｆ

　

Ｍａｔｈｅｍａｔｉｃｓ

　

ａｎｄ

　

Ｃｏｍ

ｐ

ｕｔｅｒ

　

Ｓｃｉｅｎｃｅ

，

Ｆｕ

ｊ

ｉａｎ

　

Ｎｏｒｍａｌ

　

Ｕｎｉｖｅｒｓｉｔ

ｙ

，

Ｆｕｚｈｏｕ

３５０１１７

）

３

（

Ｓｃｈｏｏｌ

　

ｏ

ｆ

　

Ｓｏ

ｆ

ｔｗａｒｅ

　

ａｎｄ

　

Ｍｉｃｒｏｅｌｅｃｔｒｏｎｉｃｓ

，

Ｐｅｋｉｎ

ｇ

　

Ｕｎｉｖｅｒｓｉｔ

ｙ

，

Ｂｅｉ

ｊ

ｉｎ

ｇ

１０２６００

）

Ａｂｓｔｒａｃｔ

　

Ｉｄｅｎｔｉｔ

ｙ

　

ａｕｔｈｅｎｔｉｃａｔｉｏｎ

　

ｉｓ

　

ｔｈｅ

　

ｆｉｒｓｔ

　

ｌｉｎｅ

　

ｏｆ

　

ｄｅｆｅｎｓｅ

　

ｆｏｒ

　

ｉｎｆｏｒｍａｔｉｏｎ

　

ｓ

ｙ

ｓｔｅｍｓ

，

ａｎｄ

　

ｐ

ａｓｓｗｏｒｄｓ

ａｒｅ

　

ｔｈｅ

　

ｍｏｓｔ

　

ｗｉｄｅｌ

ｙ

　

ｕｓｅｄ

　

ａｕｔｈｅｎｔｉｃａｔｉｏｎ

　

ｍｅｔｈｏｄ．Ｔｈｏｕ

ｇ

ｈ

　

ｔｈｅｒｅ

　

ａｒｅ

　

ａ

　

ｎｕｍｂｅｒ

　

ｏｆ

　

ｉｓｓｕｅｓ

　

ｉｎ

　

ｐ

ａｓｓｗｏｒｄｓ

ｒｅ

ｇ

ａｒｄｉｎ

ｇ

　

ｓｅｃｕｒｉｔ

ｙ

　

ａｎｄ

　

ｕｓａｂｉｌｉｔ

ｙ

，

ａｎｄ

　

ｖａｒｉｏｕｓ

　

ａｌｔｅｒｎａｔｉｖｅ

　

ａｕｔｈｅｎｔｉｃａｔｉｏｎ

　

ｍｅｔｈｏｄｓ

　

ｈａｖｅ

　

ａｌｓｏ

　

ｂｅｅｎ

ｓｕｃｃｅｓｓｉｖｅｌ

ｙ

　

ｐ

ｒｏ

ｐ

ｏｓｅｄ

，

ｐ

ａｓｓｗｏｒｄ

－

ｂａｓｅｄ

　

ａｕｔｈｅｎｔｉｃａｔｉｏｎ

　

ｗｉｌｌ

　

ｒｅｍａｉｎ

　

ｔｈｅ

　

ｄｏｍｉｎａｎｔ

　

ｍｅｔｈｏｄ

　

ｉｎ

　

ｔｈｅ

ｆｏｒｅｓｅｅａｂｌｅ

　

ｆｕｔｕｒｅ

　

ｄｕｅ

　

ｔｏ

　

ｉｔｓ

　

ｓｉｍ

ｐ

ｌｉｃｉｔ

ｙ

，

ｌｏｗ

　

ｃｏｓｔ

　

ａｎｄ

　

ｅａｓｉｎｅｓｓ

　

ｔｏ

　

ｃｈａｎ

ｇ

ｅ．Ｔｈｕｓ

，

ｔｈｉｓ

　

ｔｏ

ｐ

ｉｃ

　

ｈａｓ

　

ａｔｔｒａｃｔｅｄ

ｅｘｔｅｎｓｉｖｅ

　

ｉｎｔｅｒｅｓｔｓ

　

ｆｒｏｍ

　

ｗｏｒｌｄｗｉｄｅ

　

ｒｅｓｅａｒｃｈｅｒｓ

，

ａｎｄ

　

ｍａｎ

ｙ

　

ｉｍ

ｐ

ｏｒｔａｎｔ

　

ｒｅｓｕｌｔｓ

　

ｈａｖｅ

　

ｂｅｅｎ

　

ｒｅｖｅａｌｅｄ．Ｔｈｉｓ

ｗｏｒｋ

　

ｂｅ

ｇ

ｉｎｓ

　

ｗｉｔｈ

　

ｔｈｅ

　

ｉｎｔｒｏｄｕｃｔｉｏｎ

　

ｏｆ

　

ｕｓｅｒｓ ｖｕｌｎｅｒａｂｌｅ

　

ｂｅｈａｖｉｏｒｓ

　

ａｎｄ

　

ｄｅｔａｉｌｓ

　

ｔｈｅ

　

ｐ

ａｓｓｗｏｒｄ

ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ

，

ｄｉｓｔｒｉｂｕｔｉｏｎ

　

ａｎｄ

　

ｒｅｕｓｅ

　

ｒａｔｅ．Ｎｅｘｔ

　

ｗｅ

　

ｓｕｍｍａｒｉｚｅ

　

ｔｈｅ

　

ｐ

ｒｉｍａｒ

ｙ

　

ｃｒａｃｋｉｎ

ｇ

　

ａｌ

ｇ

ｏｒｉｔｈｍｓ

　

ｔｈａｔ

ｈａｖｅ

　

ａ

ｐｐ

ｅａｒｅｄ

　

ｉｎ

　

ｔｈｅ

　

ｐ

ａｓｔ

　

３０

ｙ

ｅａｒｓ

，

ａｎｄ

　

ｃｌａｓｓｉｆ

ｙ

　

ｔｈｅｍ

　

ｉｎｔｏ

　

ｇ

ｒｏｕ

ｐ

ｓ

　

ｉｎ

　

ｔｅｒｍｓ

　

ｏｆ

　

ｔｈｅ

　

ｄｉｆｆｅｒｅｎｃｅ

　

ｉｎ

ｄｅ

ｐ

ｅｎｄｅｎｃｅ

　

ｏｎ

　

ｗｈａｔ

　

ｉｎｆｏｒｍａｔｉｏｎ

　

ｉｓ

　

ｅｘ

ｐ

ｌｏｉｔｅｄ

　

ｂ

ｙ

　

ｔｈｅ

　

ａｔｔａｃｋｅｒ．Ｔｈｅｎ

，

ｗｅ

　

ｒｅｖｉｓｉｔ

　

ｔｈｅ

　

ｖａｒｉｏｕｓ

　

ｓｔａｔｉｓｔｉｃａｌ

－

ｂａｓｅｄ

　

ｅｖａｌｕａｔｉｏｎ

　

ｍｅｔｒｉｃｓ

　

ｆｏｒ

　

ｍｅａｓｕｒｉｎ

ｇ

　

ｔｈｅ

　

ｓｔｒｅｎ

ｇ

ｔｈ

　

ｏｆ

　

ｐ

ａｓｓｗｏｒｄ

　

ｄｉｓｔｒｉｂｕｔｉｏｎｓ．Ｆｕｒｔｈｅｒ

，

ｗｅ

　

ｃｏｍ

ｐ

ａｒｅ

ｔｈｅ

　

ｓｔａｔｅ

－

ｏｆ

－

ｔｈｅ

－

ａｒｔ

　

ｐ

ａｓｓｗｏｒｄ

　

ｓｔｒｅｎ

ｇ

ｔｈ

　

ｍｅｔｅｒｓ．Ｆｉｎａｌｌ

ｙ

，

ｗｅ

　

ｓｕｍｍａｒｉｚｅ

　

ｏｕｒ

　

ｒｅｓｕｌｔｓ

　

ａｎｄ

　

ｏｕｔｌｉｎｅ

　

ｓｏｍｅ

ｆｕｔｕｒｅ

　

ｒｅｓｅａｒｃｈ

　

ｔｒｅｎｄｓ．

Ｋｅ

ｙ

　

ｗｏｒｄｓ

　

ｉｄｅｎｔｉｔ

ｙ

　

ａｕｔｈｅｎｔｉｃａｔｉｏｎ

；

ｐ

ａｓｓｗｏｒｄ

　

ｓｅｃｕｒｉｔ

ｙ

；

ｖｕｌｎｅｒａｂｌｅ

　

ｂｅｈａｖｉｏｒ

；

ｇ

ｕｅｓｓｉｎ

ｇ

　

ａｔｔａｃｋ

；

ｓｔｒｅｎ

ｇ

ｔｈ

　

ｅｖａｌｕａｔｉｏｎ

摘

　

要

　

身份认证是确保信息系统安全的第一道防线

，

口令是应用最为广泛的身份认证方法

．

尽管口令

存在众多的安全性和可用性缺陷

，

大量的新型认证技术陆续被提出

，

但由于口令具有简单易用

、

成本低

廉

、

容易更改等特性

，

在可预见的未来仍将是最主要的认证方法

．

因此

，

口令近年来引起了国内外学者的

广泛关注

，

涌现出了一大批关于口令安全性的研究成果

．

从用户生成口令时的脆弱行为入手

，

介绍了中

英文用户口令的特征

、

分布和重用程度

；

总结了近

３０

年来提出的几个主流口令猜测算法

，

并根据它们所

依赖的攻击对象的信息不同进行了分类

；

然后

，

回顾了当前广泛使用的基于统计学的口令策略强度评价

标准

；

此外

，

对比了当前主流的几个口令强度评价器

．

最后

，

对当前研究现状进行了总结

，

并对未来研究

方向进行了展望

．

关键词

　

身份认证

；

口令安全

；

脆弱行为

；

猜测攻击

；

强度评价

中图法分类号

　

ＴＰ３９１

　　

随着信息化进程的不断推进

，

人们的日常生活

不断网络化

，

资产不断数字化

，

身份认证逐渐成为保

障用户信息安全的基本手段

．

基于口令的认证伴随

着大型机的问世而诞生

，

在

２０

世纪

６０

年代起被广

泛用于大型机的访问控制

［

１

］

，

避免分时操作系统的

时间片被滥用

．２０

世纪

９０

年代互联网进入千家万

户以来

，

互联网服务

（

如邮件

、

电子商务

、

社交网络

）

蓬勃发展

，

口令成为互联网世界里保护用户信息安

全的最主要手段之一

［

２

］

．

随着互联网的发展

，

一方面越来越多的服务需

要口令保护

，

另一方面人类大脑能力有限

，

只能记忆

５

～

７

个口令

［

３

］

，

导致用户不可避免地使用低信息熵

的弱口令

［

４

］

，

在多个网站中重用同一口令

［

５

］

，

在纸上

记口令

［

６

］

，

带来严重的安全危胁

．２００４

年

，

比尔

·

盖

茨对外宣告口令将消亡

，

微软公司将使用多因子认

证替代纯口令认证

［

７

］

．

后续一系列学术研究也分别

从口令无法抵抗离线猜测攻击

［

８

－

９

］

、

口令过期策略

（

ｐ

ａｓｓｗｏｒｄ

　

ｅｘ

ｐ

ｉｒａｔｉｏｎ

　

ｐ

ｏｌｉｃ

ｙ

）

无法保证更新后的口

令的不可预测性

［

１０

］

等方面论证了口令认证技术的

不可持续性

．

与时同时

，

大量的替代口令的认证方案

不断被提出

，

比如多因子认证

［

１１

］

、

图形口令

［

１２

］

、

生物

认证

［

１３

］

、

行为认证

［

１４

］

等

．

相比之下

，

研究口令的相关

工作却较少

．

出乎意料的是

，

时至今日

，

口令的地位在工业界

不仅丝毫没有被撼动

，

反而在越来越多的信息系统应

用中得到加强

．

这一现象吸引了越来越多的学者关

注

，

开始引起学术界的反思

．

研究发现

，

虽然这些替代

型方案有的在安全性方面优于口令

，

有的在可用性

方面胜过口令

，

但几乎都在可部署性

（

ｄｅ

ｐ

ｌｏ

ｙ

ａｂｉｌｉｔ

ｙ

）

方面劣于口令

，

并且各自存在一些固有的缺陷

［

１５

］

．

比如

，

基于硬件

（

如智能卡

、

ＵＳＢ

　

ｋｅ

ｙ

）

的认证技术成

本高昂

，

使用不方便

；

基于生物

（

如指纹

、

虹膜

）

的认

证技术不具有可撤销性

，

且存在隐私泄露问题

．

因

此

，

学术界逐渐开始形成一个共识

［

２

，

１６

－

１８

］

：

在可预见

的未来

，

口令仍将是最主要的身份认证方式

．

既然口令不可替代

，

只有深入理解口令的安全

性和可用性

，

人类才能更好地与之共存

（

ｌｉｖｉｎ

ｇ

　

ｗｉｔｈ

ｐ

ａｓｓｗｏｒｄｓ

）

［

１６

－

１７

］

．

自

２０１２

年以来

，

口令研究逐渐成

为一个热点

，

涌现出了一大批关于口令的研究成果

，

本文主要关注安全性方面的研究进展

．

关于口令的

可用性

，

读者可关注人机交互方面的刊物

，

它已成为

该领域一个重要研究分支

［

１９

］

．

需要指出的是

，

与口

令强度无关的攻击

（

如社会工程学

［

２０

］

、

恶意口令捕

获软件

［

２１

］

）

也不是本文关注点

．

口令安全性研究的难点在于

，

口令是人生成的

，

与人的行为直接相关

，

而每个人的行为因内在或外

在环境的不同而千差万别

．

比如说

，

同样是注册一个

１６３

邮箱帐户

，

有的人觉得这个帐户不重要

，

会使用

“

１２３４５６

”

作口令

．

有的人后面会经常使用这一邮箱

，

因此采用精心构造的一个字符串

（

比如

“

ｂｒ

ｙ

ｓ

ｊ

ｈｈｒｈｌ

”，

一句诗的首字母

）

作口令

．

众所周知

，“

１２３４５６

”

是弱

口令

；

但是

，

如果很多用户也使用诗词的首字母作口

令

，

那么攻击者

!

很可能了解这一用户行为

，

进而

“

ｂｒ

ｙ

ｓ

ｊ

ｈｈｒｈｌ

”

也可能是弱口令

．

至于这

２

个口令谁更

安全

，

需要具体考察它们针对

４

种口令猜测攻击

（

见

第

２

节

）

的抵抗能力

．

再比如

，

给定一个口令

“

Ｗａｎ

ｇ

．

１２３

”，

该口令如果是由

“

Ｌｉ

”

姓用户产生

，

那么该口令

可很好抵御定向在线口令猜测攻击

（

ｔａｒ

ｇ

ｅｔｅｄ

　

ｏｎｌｉｎｅ

ｐ

ａｓｓｗｏｒｄ

　

ｇ

ｕｅｓｓｉｎ

ｇ

　

ａｔｔａｃｋ

）

．

如果该口令如果是由

“

Ｗａｎ

ｇ

”

姓用户产生

，

显然它是一个弱口令

［

２２

］

，

无法

抵御定向在线口令猜测攻击

；

无论对于任何用户

，

这

一口令都无法抵抗离线口令猜测攻击

［

２２

－

２３

］

．

在用户

脆弱口令行为研究方面

，

焦点主要集中在用户的倾

向性构造模式选择

［

２４

－

２６

］

、

口令重用

［

２７

－

２８

］

、

基于个人

信息构造口令

［

２２

，

２９

］

３

个方面

．

基于对用户脆弱口令行为的更深入理解

，

一方

面攻击者会不断改进其口令猜测算法

，

另一方面系

统管理员也可以阻止弱口令的使用

．

近年来一个突

出变化是

，

口令攻击算法逐渐摆脱了依靠

“

奇思妙

想

”

启发式方法

，

进入了依赖可靠的概率模型科学化

算法的新阶段

，

如基于概率上下文无关方法

（

ｐ

ｒｏｂａｂｉｌｉｓｔｉｃ

　

ｃｏｎｔｅｘｔ

－

ｆｒｅｅ

　

ｇ

ｒａｍｍａｒｓ

，

ＰＣＦＧ

）

［

３０

］

，

基于马尔可夫链

（

Ｍａｒｋｏｖ

－

Ｃｈａｉｎ

）

的方法

［

２３

］

，

基于自

然语言处理技术

（

ｎａｔｕｒａｌ

　

ｌａｎ

ｇ

ｕａ

ｇ

ｅ

　

ｐ

ｒｏｃｅｓｓｉｎ

ｇ

，

ＮＬＰ

）

的方法

［

３１

］

．

与此同时

，

管理员也可以

：

１

）

设计

更准确的口令强度评测器

（

ｐ

ａｓｓｗｏｒｄ

　

ｓｔｒｅｎ

ｇ

ｔｈ

　

ｍｅｔｅｒ

，

ＰＳＭ

）

［

２８

，

３２

－

３３

］

，

以便用户注册

、

更新口令时对用户提

交的口令的强度进行及时反馈

；

２

）

设计更安全可用

的口令生成策略

，

比如研究发现策略

“

口令长度

１２

位以上

，

包含

２

类字符

”

要比策略

“

必须

８

位以上

，

包

括字母

、

数字和特殊字符

”

更可用

、

更安全

［

３４

］

．

口令安全研究根据其研究方法大致可分为

３

个

阶段

．

第

１

阶段为

１９９９

年以前

，

主要采用启发式方

式

，

没有理论体系

，

口令安全研究更多是一门艺术

，

４７１２

计算机研究与发展

　

２０１６

，

５３

（

１０

）

欧美少数几个研究机构零星地发表一些成果

（

如文

献

［

３５

－

３７

］）；

第

２

阶段为

２０００

年到

２００８

年

，

口令理

论体系初现端倪

，

但主基调与微软的

“

口令替代计

划

”

类似

，

这一阶段研究大多集中于揭示口令的弱

点

，

表明口令在身份认证领域将无法担当主要角色

（

如文献

［

８

，

３８

－

３９

］）；

第

３

阶段为

２００９

年以来

，

口令安

全理论体系逐渐完善

，

形成了以

Ｍａｒｋｏｖ

［

２３

］

、

ＰＣＦＧ

［

３０

］

为代表的概率攻击理论模型

，

以

Ｚｉ

ｐ

ｆ

原理为基础的

口令分布理论模型

［

２５

］

，

以

α

－

ｇ

ｕｅｓｓｗｏｒｋ

为代表的口

令分布强度评价理论模型

［

４０

］

，

使口令安全研究摆脱

了传统的依赖简单统计方法和启发式

“

奇思妙想

”，

进

入了以严密理论体系为支撑的科学轨道

．

值得一提的

是

，

口令的

Ｚｉ

ｐ

ｆ

分布

［

２５

］

由我国学者发现

．

综上

，

本文主要从用户脆弱口令行为

、

口令攻击

算法

、

口令分布强度评价指标和口令强度评价方法

４

个方面

，

对国内外最新研究进展进行综述

．

１

　

用户的脆弱口令行为

用户的不安全口令行为是造成口令无法达到理

想强度的直接原因

［

４１

］

，

因此理解用户的脆弱口令行

为成为研究口令安全性的基础前提

．

一方面用户往

往需要管理几十上百个口令帐户

［

２４

］

，

并且这一数字

在不断增长

，

此外各个网站的口令设置要求往往差

异很大

［

２２

，

４２

］

；

另一方面

，

用户用于处理信息安全事

务的精力十分有限且保持稳定

［

４３

］

，

并不会随着时间

的推移而有较大幅度提高

．

这一根本矛盾导致了用

户的一系列脆弱行为

．

近期研究表明

，

现实中用户的

口令行为往往是理智的

［

４４

］

，

并且只有这样

，

普通用

户才能可持续地管理不断增多的口令帐户

［

４５

］

．

当前

，

广泛采用的口令脆弱行为挖掘方法既

有实证分析

（

如文献

［

２３

－

２６

］），

也有用户调查

（

如文

献

［

２７

－

２８

］）；

实证分析的数据既有来自于黑客泄露

（

如文献

［

２３

－

２５

，

４６

］），

也有来自于企业合作

（

如文

献

［

４０

，

４７

］）；

用户调查既有小规模的传统调查

（

如文

献

［

２７

－

２８

］），

也有基于外包服务的新型大规模网络

调查

（

如文献

［

３４

］）

．

为更好显示实证分析结果

，

本文

使用了

８

个知名真实口令集

，

如表

１

所示

．

总的来

说

，

已发现用户的脆弱口令行为主要可以归为以下

３

类

．

Ｔａｂｌｅ

　

１

　

Ｂａｓｉｃ

　

Ｉｎｆｏｒｍａｔｉｏｎ

　

ａｂｏｕｔ

　

ｔｈｅ

　

Ｐａｓｓｗｏｒｄ

　

Ｄａｔａｓｅｔｓ

　

Ｕｓｅｄ

表

１

　

本文使用口令集的基本信息

Ｐａｓｓｗｏｒｄ

　

Ｄａｔａｓｅｔ

　

Ｓｅｒｖｉｃｅ

　

Ｔ

ｙｐ

ｅ

　

Ｌａｎ

ｇ

ｕａ

ｇ

ｅ

　

Ｌｅａｋｅｄ

　

Ｔｉｍｅ

　

Ｔｏｔａｌ

　

Ｐａｓｓｗｏｒｄｓ

　

Ｕｎｉ

ｑ

ｕｅ

　

Ｐａｓｓｗｏｒｄ

　

Ｐｅｒｓｏｎａｌ

　

Ｉｎｆｏ

　

Ｔ

ｙｐ

ｉｃａｌ

　

Ｒｅｆｅｒｅｎｃｅ

Ｄｏｄｏｎｅｗ

　

Ｇａｍｉｎ

ｇ

，

Ｅｃｏｍｍｅｒｃｅ

　

Ｃｈｉｎｅｓｅ

　

２０１１

－

１２

　

１６

　

２５８

　

８９１

　

１０

　

１３５

　

２６０Ｒｅｆ

［

２３

－

２６

］

ＣＳＤＮ

　

Ｐｒｏ

ｇ

ｒａｍｍｅｒ

　

Ｆｏｒｕｍ

　

Ｃｈｉｎｅｓｅ

　

２０１１

－

１２

　

６

　

４２８

　

２７７

　

４

　

０３７

　

６０５Ｒｅｆ

［

２３

－

２６

］

１２６Ｅｍａｉｌ

　

Ｃｈｉｎｅｓｅ

　

２０１１

－

１２

　

６

　

３９２

　

５６８

　

３

　

７７８

　

１６８Ｒｅｆ

［

２８

］

１２３０６Ｔｒａｉｎ

　

Ｔｉｃｋｅｔｉｎ

ｇ

　

Ｃｈｉｎｅｓｅ

　

２０１４

－

１２

　

１２９

　

３０３

　

１１７

　

８０８

√

＊

Ｒｅｆ

［

２９

］

Ｒｏｃｋ

ｙ

ｏｕ

　

Ｓｏｃｉａｌ

　

Ｎｅｔｗｏｒｋｓ

　

Ｅｎ

ｇ

ｌｉｓｈ

　

２００９

－

１２

　

３２

　

５８１

　

８７０

　

１４

　

３２６

　

９７０Ｒｅｆ

［

２３

－

２４

，

３０

］

０００ｗｅｂｈｏｓｔ

　

Ｗｅｂ

　

Ｈｏｓｔｉｎ

ｇ

　

Ｅｎ

ｇ

ｌｉｓｈ

　

２０１５

－

１０

　

１５

　

２５１

　

０７３

　

１０

　

５８３

　

７０９Ｒｅｆ

［

２８

］

Ｙａｈｏｏ

　

Ｗｅｂ

　

Ｐｏｒｔａｌ

　

Ｅｎ

ｇ

ｌｉｓｈ

　

２０１２

－

０７

　

４４２

　

８３４

　

３４２

　

５１０Ｒｅｆ

［

２３

－

２５

］

Ｒｏｏｔｋｉｔ

　

Ｈａｃｋｅｒ

　

Ｆｏｒｕｍ

　

Ｅｎ

ｇ

ｌｉｓｈ

　

２０１１

－

０２

　

６９

　

４１９

　

５６

　

９００

√

＊＊

Ｒｅｆ

［

２７

］

　

Ｎｏｔｅｓ

：

＊

Ｔｈｅ

　

１２３０６ｄａｔａｓｅｔ

　

ｉｎｃｌｕｄｅｓ

　

ｆｉｖｅ

　

ｔ

ｙｐ

ｅｓ

　

ｏｆ

　

ｐ

ｅｒｓｏｎａｌ

　

ｉｎｆｏｒｍａｔｉｏｎ

：

ｎａｍｅ

，

ｂｉｒｔｈｄａ

ｙ

，

ｅｍａｉｌ

，

ｐ

ｈｏｎｅ

　

ｎｕｍｂｅｒ

　

ａｎｄ

　

ｎａｔｉｏｎａｌ

　

ｉｄｅｎｔｉｔ

ｙ

　

ｃａｒｄ

ｎｕｍｂｅｒ．

＊＊

Ｔｈｅ

　

Ｒｏｏｔｋｉｔ

　

ｄａｔａｓｅｔ

　

ｉｎｃｌｕｄｅｓ

　

ｆｏｕｒ

　

ｔ

ｙｐ

ｅｓ

　

ｏｆ

　

ｐ

ｅｒｓｏｎａｌ

　

ｉｎｆｏｒｍａｔｉｏｎ

：

ｎａｍｅ

，

ｂｉｒｔｈｄａ

ｙ

，

ｕｓｅｒ

　

ｎａｍｅ

　

ａｎｄ

　

ｅｍａｉｌ．

１．１

　

口令构造的偏好性选择

１．１．１

　

国民口令

１９７９

年

，

Ｍｏｒｒｉｓ

和

Ｔｈｏｍ

ｐ

ｓｏｎ

在他们的开创性

论文里分析了

３

　

２８９

个真实用户口令

，

发现

８６％

落

入普通字典

，

３３％

可以在

５ｍｉｎ

内搜索出来

．

后续大

量研究

（

如文献

［

２３

－

２８

］）

表明

，

除了选择单词作口

令

，

用户常常将单词进行简单变换

，

以满足网站口令

设置策略的要求

．

比如

“

１２３４５６ａ

”

可以满足

“

字母

＋

数字

”

的策略

要求

．

这些最流行的单词及其变换就形成了国民口

令

，

如表

２

所示

．

中文国民口令多为纯数字

，

而英文

国民口令多含字母

，

这体现了语言对口令行为的影

响

．

有趣的是

，

爱情这一主题在国民口令中占据了重

要地位

．

高达

１．０１％

～

１０．４４％

的用户选择最流行

的

１０

个口令

，

这意味着攻击者

!

只要尝试

１０

个最

流行的口令

，

其成功率就会达到

１．０１％

～

１０．４４％．

同时

，

这也预示着人类生成的口令远不是均匀分布

，

那到底是什么分布呢

？

５７１２

王

　

平等

：

口令安全研究进展

Ｔａｂｌｅ

　

２

　

Ｔｏ

ｐ

－

１０Ｍｏｓｔ

　

Ｐｏ

ｐ

ｕｌａｒ

　

Ｐａｓｓｗｏｒｄｓ

　

ｏｆ

　

Ｅａｃｈ

　

Ｓｅｒｖｉｃｅ

表

２

　

各个网络服务中最流行的

１０

个口令

Ｒａｎｋ

　

Ｄｏｄｏｎｅｗ

　

ＣＳＤＮ

　

１２６

　

１２３０６Ｒｏｃｋ

ｙ

ｏｕ

　

０００ｗｅｂｈｏｓｔ

　

Ｙａｈｏｏ

　

Ｒｏｏｔｋｉｔ

１

　

１２３４５６

　

１２３４５６７８９

　

１２３４５６

　

１２３４５６

　

１２３４５６ａｂｃ１２３

　

１２３４５６

　

１２３４５６

２ａ１２３４５６

　

１２３４５６７８

　

１２３４５６７８９ａ１２３４５６

　

１２３４５

　

１２３４５６ａ

ｐ

ａｓｓｗｏｒｄ

　

ｐ

ａｓｓｗｏｒｄ

３

　

１２３４５６７８９

　

１１１１１１１１

　

１１１１１１

　

５２０１３１４

　

１２３４５６７８９

　

１２

ｑ

ｗ２３ｗｅ

　

ｗｅｌｃｏｍｅ

　

ｒｏｏｔｋｉｔ

４

　

１１１１１１ｄｅａｒｂｏｏｋ

　

ｐ

ａｓｓｗｏｒｄ

　

１２３４５６ａ

ｐ

ａｓｓｗｏｒｄ

　

１２３ａｂｃ

　

ｎｉｎ

ｊ

ａ

　

１１１１１１

５

　

５２０１３１４

　

００００００００

　

００００００

　

１１１１１１

　

ｉｌｏｖｅ

ｙ

ｏｕ

　

ａ１２３４５６ａｂｃ１２３

　

１２３４５６７８

６

　

１２３１２３

　

１２３１２３１２３

　

１２３１２３

　

ｗｏａｉｎｉ１３１４

ｐ

ｒｉｎｃｅｓｓ

　

１２３

ｑ

ｗｅ

　

１２３４５６７８９

ｑ

ｗｅｒｔ

ｙ

７ａ３２１６５４

　

１２３４５６７８９０

　

１２３４５６７８

　

１２３１２３

　

１２３４５６７ｓｅｃｒｅｔ６６６

　

１２３４５６７８

　

１２３４５６７８９

８

　

１２３４５

　

８８８８８８８８

　

５２０１３１４

　

００００００ｒｏｃｋ

ｙ

ｏｕ

　

ＹｆＤｂＵｆＮ

ｊ

Ｈ１０３０５０７０ｓｕｎｓｈｉｎｅ

　

１２３１２３

９

　

００００００

　

１１１１１１１１１

　

１８８８１８８８

ｑｑ

１２３４５６

　

１２３４５６７８ａｓｄ１２３

　

ｐ

ｒｉｎｃｅｓｓ

　

ｑ

ｗｅｒｔ

ｙ

ｕｉ

１０

　

１２３４５６ａ１４７２５８３６９

　

１２３４５６７

　

１

ｑ

ａｚ２ｗｓｘ

　

ａｂｃ１２３

ｑ

ｗｅｒｔ

ｙ

１２３

ｑ

ｗｅｒｔ

ｙ

　

１２３４５

Ｐｅｒｃｅｔａ

ｇ

ｅ

／

％３．２８

　

１０．４４

　

３．５２

　

１．２８

　

２．０５

　

０．７９

　

１．０１

　

３．９４

１．１．２

　

Ｚｉ

ｐ

ｆ

分布

在

２０１２

年以前

，

学术界普遍假设口令满足均匀

分布

（

如文献

［

４８

－

４９

］），

这有

２

方面的原因

：

１

）

缺少

大规模真实口令数据

，

口令具体是什么分布难以实

证

；

２

）

在均匀分布的假设下

，

分析问题最为方便简

单

．

自

２００９

年第

１

个千万级口令集

Ｒｏｃｋ

ｙ

ｏｕ

泄露

以来

，

如表

１

所示

，

数以百计的知名网站被攻陷

［

５０

］

，

这为研究口令分布提供了充足原始数据

．

关于口令

Ｚｉ

ｐ

ｆ

分布的发现经历了一个

“

否定

—

肯定

”

的曲折过

程

．

因为人类自然语言满足

Ｚｉ

ｐ

ｆ

分布

［

５１

］

，

很自然的

一个想法是

，

人类生成的口令也可能满足

Ｚｉ

ｐ

ｆ

分

布

．２０１２

年

，

Ｍａｌｏｎｅ

和

Ｍａｈｅｒ

［

５２

］

分析了

３

　

２００

万条

Ｒｏｃｋ

ｙ

ｏｕ

数据和另外

３

个小于

１０

万条的数据集

，

将

整个口令集输入

Ｚｉ

ｐ

ｆ

模型

，

发现拟合出来的参数通

不过

Ｋｏｌｍｏ

ｇ

ｏｒｏｖ

－

Ｓｍｉｒｎｏｖ

（

ＫＳ

）

检验

．

因此

，

他们得

到结论

：

口令不服从

Ｚｉ

ｐ

ｆ

分布

．

同年

，

Ｂｏｎｎｅａｕ

［

４０

］

使

用类似方法分析了

７

　

０００

万条

Ｙａｈｏｏ

口令

，

也否定

了口令服从

Ｚｉ

ｐ

ｆ

分布的可能性

．

２０１４

年

，

Ｗａｎ

ｇ

等人

［

２５

］

根据大数定律

，

指出那

些低频次口令天然无法反映其真实频率

，

因此只有

将那些高频次口令

（

如出现频次不小于

４

的口令

）

输

入

Ｚｉ

ｐ

ｆ

模型才有意义

．

基于这一新方法

，

Ｗａｎ

ｇ

等发

现在

１０

万抽样样本下

，

通过

Ｚｉ

ｐ

ｆ

模型拟合的参数

可通过

ＫＳ

检验

．

这意味着

，

Ｚｉ

ｐ

ｆ

模型能够很好地刻

画口令分布

（

双对数坐标下为直线

，

如图

１

所示

）：

ｆ

ｒ

＝

Ｃ

ｒ

ｓ

，

其中

，

ｒ

表示排名

，

ｆ

ｒ

表示排名为

ｒ

的口令的频率

，

Ｃ

和

ｓ

为常数

，

由具体的分布

（

即数据集

）

决定

．

当前

，

这一发现已被广泛应用于多个场合

，

如精

确刻画可证明安全协议中攻击者优势

［

５３

－

５４

］

、

评估基

因保护系统的抗攻击能力

［

５５

］

、

评估口令

Ｈａｓｈ

函数

的强健性

［

５６

］

．

同时

，

这一规律表明

，

口令频次呈多项

式下降

，

高频的口令和低频的口令都会占据整个口

令集的重要部分

．

这也从根本上说明了为什么漫步

猜测攻击

（

见

２．１

节

）

会如此有效

．

Ｆｉ

ｇ

．１

　

Ｈｕｍａｎ

－

ｃｈｏｓｅｎ

　

ｐ

ａｓｓｗｏｒｄｓ

　

ｆｏｌｌｏｗ

　

Ｚｉ

ｐ

ｆｓ

　

ｌａｗ．

图

１

　

人类生成的口令服从

Ｚｉ

ｐ

ｆ

分布

１．１．３

　

字符组成结构

当网站设置了口令生成策略时

，

口令的字符组

成很大程度上由口令策略所决定

．

当网站未设置口

令构成策略时

，

用户口令的结构直接体现了用户的

偏好

［

２２

－

２４

］

．

表

３

中最突出的现象是

，

绝大多数中文口令包

含数字

，

并且

２７％

～

４５％

仅由数字构成

；

英文口令

喜欢包含字母

，

低于

１６％

的口令仅由数字构成

，

有

相当一部分由一串小写字母后面跟

１

组成

．

由于高

达

９９．５７％

的

０００ｗｅｂｈｏｓｔ

口令由字母和数字共同

６７１２

计算机研究与发展

　

２０１６

，

５３

（

１０

）

剩余15页未读，继续阅读

评论0

内容反馈

XiZi

粉丝: 61
资源: 325

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip