===========python 安装===========
安装 Python 2.7
将python的安装路径加入到环境变量的path 里
python test.py 运行脚本
python请求一个网页
这个是3.4 版本
import urllib.request
with urllib.request.urlopen('http://www.python.org/') as f:
print(f.read(300))
print 之前一定有空格,python 严格缩进
最好还是在eclipse pydev 插件里进行开发
=====搭建scrapy=======
get-pip.py
python get-pip.py 安装
C:\Python2.7\;C:\Python2.7\Scripts\;
将python 和下面的脚本目录加入到环境变量,包括script里保护有 pip 脚本
pip install Scrapy
依赖于 http://aka.ms/vcpython27
Microsoft Visual C++ 9.0 先安装
http://www.microsoft.com/en-us/download/details.aspx?id=44266
以下为我们的第一个Spider代码,保存在 tutorial/spiders 目录下的 dmoz_spider.py 文件中:
------------
import scrapy
class DmozSpider(scrapy.Spider):
name = "dmoz"
allowed_domains = ["dmoz.org"]
start_urls = [
"http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
"http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
]
def parse(self, response):
filename = response.url.split("/")[-2]
with open(filename, 'wb') as f:
f.write(response.body)
---------------------
进入项目的根目录,执行下列命令启动spider:
scrapy crawl dmoz
报错
scrapy项目运行报错: exceptions.ImportError: No module named win32api
缺少包所致,pip 运行
pip install pypiwin32
爬取得数据可以保存为json ,结合xpath表达式进行过滤
没有合适的资源?快使用搜索试试~ 我知道了~
爬虫试验 scrapy python2.7
共2个文件
txt:1个
msi:1个
1星 需积分: 9 7 下载量 81 浏览量
2016-06-17
14:30:44
上传
评论
收藏 17.3MB RAR 举报
温馨提示
爬虫试验 scrapy python2.7 VCForPython27.msi改文件在另一地方下载,我的下载资源里
资源推荐
资源详情
资源评论
收起资源包目录
爬虫试验.rar (2个子文件)
爬虫试验
新建文本文档.txt 1KB
python-2.7.11.msi 17.77MB
共 2 条
- 1
资源评论
- risemypassion2016-07-19就一个python安装包也能叫爬虫?
hongyawx
- 粉丝: 2
- 资源: 92
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功