没有合适的资源?快使用搜索试试~ 我知道了~
互联网企业:如何建设数据安全体系.pdf
7 浏览量
2023-02-06
20:01:44
上传
评论
收藏 999KB PDF 举报
。。。
资源推荐
资源详情
资源评论















互联网企业:如何建设数据安全体系?
Facebook 数据泄露事件一度成为互联网行业的焦点,
几百亿美元市值瞬间蒸发,这个代价足以在地球上养活一
支绝对庞大的安全团队,甚至可以直接收购几家规模比较
大的安全公司了。虽然媒体上发表了很多谴责的言论,但
实事求是地讲,Facebook 面临是一个业界难题,任何一家
千亿美元的互联网公司面对这种问题,可能都没有太大的
抵抗力,仅仅是因为全球区域的法律和国情不同,暂时不
被顶上舆论的浪尖罢了。但是全球的趋势是越来越重视隐
私,在安全领域中,数据安全这个子领域也重新被提到了
一个新的高度,所以笔者就借机来说一下数据安全建设。
(按照惯例,本文涉及敏感信息的部分会进行省略处理或
者一笔带过。)
二、概念
这里特别强调一下,“隐私保护”和“数据安全”是两个完全不
同的概念,隐私保护对于安全专业人员来说是一个更加偏
向合规的事情,主要是指数据过度收集和数据滥用方面对
法律法规的遵从性,对很多把自身的盈利模式建立在数据
之上的互联网公司而言,这个问题特别有挑战。有些公司
甚至把自己定义为数据公司,如果不用数据来做点什么,
要么用户体验大打折扣,要么商业价值减半。GDPR 即将实

施,有些公司或将离场欧洲,就足见这件事的难度不容小
觑。当然市场上也有一些特别推崇隐私保护的公司,他们
很大程度上并不能真正代表用户意愿,而只是因为自家没
有数据或缺少数据,随口说说而已。
数据安全是实现隐私保护的最重要手段之一。对安全有一
定了解的读者可能也会察觉到,数据安全并不是一个独立
的要素,而是需要连同网络安全、系统安全、业务安全等
多种因素,只有全部都做好了,才能最终达到数据安全的
效果。所以本文尽可能的以数据安全为核心,但没有把跟
数据安全弱相关的传统安全体系防护全部列出来,对于数
据安全这个命题而言尽可能的系统化,又避免啰嗦。另外
笔者也打算在夏季和秋季把其他子领域的话题单独成文,
譬如海量 IDC 下的入侵防御体系等,敬请期待。
三、全生命周期建设
尽管业内也有同学表示数据是没有边界的,如果按照泄露
途径去做可能起不到“根治”的效果,但事实上以目前的技术
是做不到无边界数据安全的。下图汇总了一个全生命周期
内的数据安全措施:四、数据采集
数据泄露有一部分原因是用户会话流量被复制,尽管有点
技术门槛,但也是发生频率比较高的安全事件之一,只是
是很多企业没有感知到而已。下面从几个维度来说明数据
采集阶段的数据保护。

1. 流量保护
全站 HTTPS 是目前互联网的主流趋势,它解决的是用户到
服务器之间链路被嗅探、流量镜像、数据被第三方掠走的
问题。这些问题其实是比较严重的,比如电信运营商内部
偶有舞弊现象,各种导流劫持插广告(当然也可以存数
据,插木马),甚至连 AWS 也被劫持 DNS 请求,对于掌握
链路资源的人来说无异于可以发动一次“核战争”。即使目标
对象 IDC 入侵防御做的好,攻击者也可以不通过正面渗
透,而是直接复制流量,甚至定向 APT,最终只是看操纵流
量后达到目的的收益是否具有性价比。
HTTPS 是一个表面现象,它暗示着任何互联网上未加密的
流量都是没有隐私和数据安全的,同时,也不是说有了
HTTPS 就一定安全。HTTPS 本身也有各种安全问题,比如
使用不安全的协议 TLS1.0、SSL3,采用已经过时的弱加密
算法套件,实现框架安全漏洞如心脏滴血,还有很多的数
字证书本身导致的安全问题。
全站 HTTPS 会带来的附带问题是 CDN 和高防 IP。历史上有
家很大的互联网公司被 NSA 嗅探获取了用户数据,原因是
CDN 回源时没有使用加密,即用户浏览器到 CDN 是加密
的,但 CDN 到 IDC 源站是明文的。如果 CDN 到源站加密
就需要把网站的证书私钥给到 CDN 厂商,这对于没有完全
自建 CDN 的公司而言也是一个很大的安全隐患,所以后来

衍生出了 Keyless CDN 技术,无需给出自己的证书就可以实
现 CDN 回源加密。广域网流量未加密的问题也要避免出现
在“自家后院”——IDC 间的流量复制和备份同步,对应的解
决方案是跨 IDC 流量自动加密、TLS 隧道化。
2. 业务安全属性
在用户到服务器之间还涉及两个业务安全方向的问题。第
一个问题是账号安全,只要账号泄露(撞库&爆破)到
达一定数量级,把这些账号的数据汇总一下,就必定可以
产生批量数据泄露的效果。第二个问题是反爬,爬虫的问
题存在于一切可通过页面、接口获取数据的场合,大概 1
小时爬个几百万条数据是一点问题都没有的,对于没有彻
底脱敏的数据,爬虫的效果有时候等价于“黑掉”服务器。账
号主动地或被动地泄露+爬虫技术,培育了不少黑产和数据
获取的灰色地带。
3. UUID
UUID 最大的作用是建立中间映射层,屏蔽与真实用户信息
的关系链。譬如在开放平台第三方应用数据按需自主授权
只能读取 UUID,但不能直接获取个人的微信号。更潜在的
意义是屏蔽个体识别数据,因为实名制,手机号越来越能
代表个人标识,且一般绑定了各种账号,更改成本很高,
找到手机号就能对上这个人,因此理论上但凡带有个体识
别数据的信息都需要“转接桥梁”、匿名化和脱敏。譬如当商
剩余15页未读,继续阅读
资源评论

lengyue815
- 粉丝: 476
- 资源: 3294

上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
安全验证
文档复制为VIP权益,开通VIP直接复制
