一个小型的网站,比如个人网站,可以使用最简单的 html 静态页面就实现了,配合
一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站对系统架构、性能
的要求都很简单,随着互联网业务的不断丰富,网站相关的技术经过这些年的发展,已经
细分到很细的方方面面,尤其对于大型网站来说,所采用的技术更是涉及面非常广,从硬
件到软件、编程语言、数据库、WebServer、防火墙等各个领域都有了很高的要求,已经
不是原来简单的 html 静态网站所能比拟的。
大型网站,比如门户网站。在面对大量用户访问、高并发请求方面,基本的解决方案
集中在这样几个环节:使用高性能的服务器、高性能的数据库、高效率的编程语言、还有
高性能的 Web 容器。但是除了这几个方面,还没法根本解决大型网站面临的高负载和高
并发问题。
上面提供的几个解决思路在一定程度上也意味着更大的投入,并且这样的解决思路具
备瓶颈,没有很好的扩展性,下面我从低成本、高性能和高扩张性的角度来说说我的一些
经验。
1、HTML 静态化
其实大家都知道,效率最高、消耗最小的就是纯静态化的 html 页面,所以我们尽可
能使我们的网站上的页面采用静态页面来实现,这个最简单的方法其实也是最有效的方法。
但是对于大量内容并且频繁更新的网站,我们无法全部手动去挨个实现,于是出现了我们
常见的信息发布系统 CMS,像我们常访问的各个门户站点的新闻频道,甚至他们的其他频
道,都是通过信息发布系统来管理和实现的,信息发布系统可以实现最简单的信息录入自
动生成静态页面,还能具备频道管理、权限管理、自动抓取等功能,对于一个大型网站来
说,拥有一套高效、可管理的 CMS 是必不可少的。
除了门户和信息发布类型的网站,对于交互性要求很高的社区类型网站来说,尽可能
的静态化也是提高性能的必要手段,将社区内的帖子、文章进行实时的静态化,有更新的
时候再重新静态化也是大量使用的策略,像 Mop 的大杂烩就是使用了这样的策略,网易社
区等也是如此。
同时,html 静态化也是某些缓存策略使用的手段,对于系统中频繁使用数据库查询但
是内容更新很小的应用,可以考虑使用 html 静态化来实现,比如论坛中论坛的公用设置
信息,这些信息目前的主流论坛都可以进行后台管理并且存储再数据库中,这些信息其实
大量被前台程序调用,但是更新频率很小,可以考虑将这部分内容进行后台更新的时候进
行静态化,这样避免了大量的数据库访问请求。
2、图片服务器分离
大家知道,对于 Web 服务器来说,不管是 Apache、IIS 还是其他容器,图片是最消
耗资源的,于是我们有必要将图片与页面进行分离,这是基本上大型网站都会采用的策略,
他们都有独立的图片服务器,甚至很多台图片服务器。这样的架构可以降低提供页面访问
请求的服务器系统压力,并且可以保证系统不会因为图片问题而崩溃,在应用服务器和图
片服务器上,可以进行不同的配置优化,比如 apache 在配置 ContentType 的时候可以
尽量少支持,尽可能少的 LoadModule,保证更高的系统消耗和执行效率。
3、数据库集群和库表散列