'''
http://category.dangdang.com/cp01.03.51.00.00.00.html
get
这些书都在一个个的li标签里,先获取所有的li,再分别对每一个li进行xpath提取,可以避免要提取的字段是空最后数据错位的情况
第二页 http://category.dangdang.com/pg2-cp01.03.51.00.00.00.html
第三页 http://category.dangdang.com/pg3-cp01.03.51.00.00.00.html
'''
import requests
from lxml import etree
# 处理