寻寻找自我的博客找自我的博客
PPython 开发者应该知道的 7 个开发库 ython 开发者应该知道的 7 个开发库
分类: Python 2012-11-18 19:16 72人阅读 评论(0) 收藏 举报
在我多年的 Python 编程经历以及在 Github 上的探索漫游过程中,我发掘到一些很不错的
Python 开发包,这些包大大简化了开发过程,而本文就是为了向大家推荐这些开发包。
请注意我特别排除了像 SQLAlchemy 和 Flask 这样的库,因为其实在太优秀了,无需多提。
下面开始:
1. PyQuery (with lxml)
安装方法 pip install pyquery
Python 解析 HTML 时最经常被推荐的是 Beautiful Soup ,而且它的确也表现很好。提供良好的
Python 风格的 API,而且很容易在网上找到相关的资料文档,但是当你需要在短时间内解析大量
文档时便会碰到性能的问题,简单,但是真的非常慢。
下图是 08 年的一份性能比较图:
这个图里我们发现 lxml 的性能是如此之好,不过文档就很少,而且使用上相当的笨拙!那么是选
择一个使用简单但是速度奇慢的库呢,还是选择一个速度飞快但是用起来巨复杂的库呢?
谁说二者一定要选其一呢,我们要的是用起来方便,速度也一样飞快的 XML/HTML 解析库!
而 PyQuery 就可以同时满足你的易用性和解析速度方面的苛刻要求。
看看下面这几行代码:
from pyquery import PyQuery
page = PyQuery(some_html)
last_red_anchor = page('#container > a.red:last') 很简单吧,很像是 jQuery,但它却是 Python。
不过也有一些不足,在使用迭代时需要对文本进行重新封装:
for paragraph in page('#container > p'):
paragraph = PyQuery(paragraph)
text = paragraph.text()
2. dateutil
安装方法:pip install dateutil
评论0
最新资源