没有合适的资源?快使用搜索试试~ 我知道了~
python笔试面试题.pdf
资源推荐
资源详情
资源评论
黑 马 程 序 员
1. 现有字典 d={‘a’:24,’g’:52,’l’:12,’k’:33}请按字典
中的 value 值进行排序?
sorted(d.items(),key = lambda x:x[1])
2. Redis 由于存储的指纹过多怎么办?
设置生存时间
定时清理
持久化
主从
3. Phontomjs 相关?
主程序退出后,selenium 不保证 phantomJS 也成功退出,最好手动关闭
phantomJS 进程。(有可能会导致多个 phantomJS 进程运行,占用内存)
WebDriverWait 虽然可能会减少延时,但是目前存在 bug(各种报错),这
种情况可以采用 sleep。
phantomJS 爬数据比较慢,可以选择多线程。如果运行的时候发现有的可以
运行,有的不能,可以尝试将 phantomJS 改成 Chrome。
4. 什么是函数?
函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。
函数能提高应用的模块性,和代码的重复利用率。Python 提供了许多内建函
数,但也可以自己创建函数,这被叫做用户自定义函数
5. scrapy-redis 去重原理?
可见 scrapy_redis 是利用 set 数据结构来去重的,去重的对象是 request
的 fingerprint(其实就是用 hashlib.sha1()对 request 对象的某些字段信息进
行压缩)。其实 fp 就是 request 对象加密压缩后的一个字符串(40 个字符,0~f)
6. map 函数和 reduce 函数?
①从参数方面来讲:
map()包含两个参数,第一个是参数是一个函数,第二个是序列(列表或元
组)。其中,函数(即 map 的第一个参数位置的函数)可以接收一个或多个参数。
reduce() 第一个参数是函数,第二个是 序列(列表或元组)。但是,其函
数必须接收两个参数。
黑 马 程 序 员
②从对传进去的数值作用来讲:
map()是将传入的函数依次作用到序列的每个元素,每个元素都是独自被函
数“作用”一次;(请看下面的栗子)
reduce()是将传人的函数作用在序列的第一个元素得到结果后,把这个结果
继续与下一个元素作用(累积计算)。
7. Python 的引用类型有哪些?
对象本身可以修改,比如列表,字典等
8. self 和 cls 区别?
约定俗成,一般用到 staticmethod,classmethod 或者后期绑定就用 cls,否
则就用 self,属于*args 的范畴的
9. 怎么设置深度爬取?
通过在 settings.py 中设置 DEPTH_LIMIT 的值可以限制爬取深度,这个深度
是与 start_urls 中定义 url 的相对值。也就是相对 url 的深度。若定义 url 为
http://www.domz.com/game/,DEPTH_LIMIT=1 那么限制爬取的只能是此 url 下一
级的网页。深度大于设置值的将被忽视。
10. 怎么储存图片和视频?
一般存储的是 URL
保存在云服务器
11. a=1,b=2,不用中间变量交换 a 和 b 的值?
a=a+b
b=a-b
a=a-b
12. 代理 IP 里的“透明”“匿名”“高匿”分别是指?
透明代理的意思是客户端根本不需要知道有代理服务器的存在,但是它传送
的仍然是真实的 IP。你要想隐藏的话,不要用这个。
普通匿名代理能隐藏客户机的真实 IP,但会改变我们的请求信息,服务器端
有可能会认为我们使用了代理。不过使用此种代理时,虽然被访问的网站不能知
道你的 ip 地址,但仍然可以知道你在使用代理,当然某些能够侦测 ip 的网页仍
然可以查到你的 ip。
剩余7页未读,继续阅读
资源评论
网络毒刘
- 粉丝: 1967
- 资源: 26
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功