缓存技术优化 P2P 流量
摘要 随着 P2P 文件共享应用的泛滥,P2P 应用大量占用了基础网络运营商的核心带宽,并在影响运营商利润的同时影响了 P2P 技术的继续发
展。本文介绍了一种 P2P 流量优化技术——P2P 缓存系统。通过对 P2P 流量进行缓存过滤,可使 P2P 流量占用的核心网络带宽大大降低,从而
解决 P2P 文件共享同基础网络运营的矛盾。本文讨论了 P2P 缓存系统所面临的主要问题,并提出了相关的解决方案。
1、引言
随着 BT、eMule、Skype 等 P2P 应用的流行,P2P 技术已经成为互联网的重要组成部分,甚至很多人已经认为 P2P 技术将成为未来互联网的
发展方向[1]。作为一种与服务器/客户端模式完全不同的技术,P2P 技术的突出特点就是“去中心化”。在 P2P 网络中,网络资源和服务散布于整个
网络中,每个节点逻辑地位相等,都具备客户端和服务器双重特性,可以同时作为服务使用者和服务提供者。
P2P 应用的流行源于 P2P 技术所提供的无限服务能力、低廉的成本和良好的服务稳定性。P2P 系统的服务能力随着用户数量的增加而增加,
在理论上并不存在瓶颈,相反,传统的服务器/客户端系统存在着无法突破的服务器性能瓶颈。在打破了服务器瓶颈后利用 P2P 技术可以在非常便
宜的设备上架设服务,从而带来了成本优势。而且在 P2P 系统中各个 peer 端都分担了服务能力,单一 peer 故障不会造成系统崩溃,解决了传统
服务器/客户端系统中服务器故障可能造成服务崩溃的问题。服务能力的优势还为 P2P 系统提供了新业务模式,例如,在 P2P 文件共享系统中,
内容发布功能被开放给每一个 peer 端,极大地丰富了系统的内容,从而吸引了大量新用户。对于传统的服务器/客户端系统,开放内容发布能力
将给服务器系统带来无法支撑的压力。近几年,P2P 应用的用户数和流量都呈现爆炸式增长的趋势,截至 2005 年年底,中国 P2P 流媒体业务的
用户数已经达到 235 万,比年初增长 176%[1]。
另一方面,随着 P2P 技术的快速发展,P2P 技术和基础网络运营商之间的利益冲突日益明显,这种矛盾可能阻碍 P2P 技术的进一步发展。当
前,网络使用时间通常是基础网络运营商和用户的结算依据,而支撑这种结算方式的是传统的网络业务访问模型,也就是用户在其访问时段内仅
有部分时间活跃,用户占用的带宽随其访问的活跃程度而变化,使用的上下行带宽不对等。但是 P2P 技术的普及破坏了传统的网络业务访问模
型,用户访问开始在其访问时段内永久活跃、带宽占用稳定并且上下行带宽基本相等。为此,基础网络运营商不得不为应付飞速上升的网络带宽
需求而大规模地扩容。更要命的是此时的带宽投入已经无法带来合理的收入。当基础网络运营商无法通过改变结算方式解决带宽需求和业务收入
的矛盾时,就只好转向用各种方式限制 P2P 技术在其网络上的应用[2],从而对 P2P 技术的继续发展设置了障碍。
下面介绍一种 P2P 流量优化技术——P2P 缓存系统。通过在网络边缘缓存 P2P 内容,过滤掉传输重复的 P2P 内容,可以减轻 P2P 应用对核心
带宽带来的压力。P2P 缓存系统需要完成捕捉网络流量、P2P 协议分析以及内容缓存等操作,并且还需要为后续 P2P 访问提供缓存内容的代理服
务。
通过部署 P2P 缓存系统,基础网络运营商可以利用有限的投入支撑增长的 P2P 业务需求,从而解决当前 P2P 技术带来的带宽冲击。另
外,P2P 缓存系统的使用还可以改善 P2P 应用的用户体验,从而吸引更多 P2P 客户,并可能为基础网络运营商带来更多客户。也就是说,P2P 缓
存系统的部署不仅可能缓和 P2P 技术和基础网络运营商的矛盾,而且可能引导二者协同发展,创造出双赢局面。
2、P2P 缓存系统
2.1 基本原理
P2P 缓存系统将传统的缓存原理应用到 P2P 内容上,其基本思想就是在网络边缘缓存 P2P 内容,用缓存内容服务后续的 P2P 请求,过滤掉重
复的 P2P 内容。图 1 描述了 P2P 缓存系统的工作原理。如图 1 所示,在使用了 P2P 缓存系统后,P2P 访问的流程如下。