【免费】20171207爬虫需求分析1资源-CSDN文库

爬虫

需求分析

需积分: 0 182 浏览量 2022-08-08 19:07:53 上传评论收藏 112KB DOCX 举报

资源详情

资源评论

从 11 月 17 号开始学爬虫，到现在将近 1 个月

期间完成了

1. 基于 Python 语言的爬虫开发环境搭建（windows10/64bit 和 ubuntu17.10/64bit）

2. 完成了菜鸟官网 (HTTP/HTML/AJAX/JSON/CSS/XPATH) 以及简单的

MySQL/Redis/MongoDB 的学习

3. 阅读

requests/re/selenium/lxml/beautifulSoup/pyquery/pyspider/scrapy/pymql/pymongo

的官方文档和通过例子的编写实现了一些基本功能的理解

4. 通过崔庆才的视频教程完成了基本的一些简单爬虫的编写和理解

遇到的问题和实现的项目都已经归档到博客：

http://www.cnblogs.com/copywang/

回头看看这些天的劳动，反思以下：

1. 环境问题导致的重复安装劳动（以后直接切换到 Ubuntu 环境），特别是框架安装时候的

问题比较多（pyspider/scrapy），重复安装至少耗费了 2 天时间

2. 基础知识不牢固，在实现 scrapy 的时候，Pycharm 中的 external_lib 每次创建新项目和

在原有项目中再打开是不一样的，出来了 import 错误，折腾了 1 天

3. 数据类型辨识错误，没有理解好各个不同的解析库解析出来的是 class 还是 str，在调试

过程每次都要打印 type，浪费了比较多的编程时间

4. 不能迷信框架，在调试 pyspider/scrapy 的过程中，出现了比较多的调用错误，虽然框架

在一定程度上减少了调用者的编程难度，在没有阅读和理解源码的情况下，没有理解到

各个部件之间的联系，并不会在多大程度上给新手带来好处，如果是工作条件下的追求

效率实现，倒是没什么问题，但是对于新手一上来就使用框架，并没有想象中那么好

5. 多使用基本的 request 和 lxml

6. 动态语言写起来爽，但是在 debug 的时候真的要命

7. 增量爬取还没有学到任何资料

以上就是学习的内容，本吊智商捉急，无法达到大神那种一点即通的境界，只能来面向工作

编程，快到年底，看看爬虫工程师的需求和岗位要求，有句话说得好，一个人的成功，纪要

讲究个人努力，也要配合历史进程

1. 拉勾网的爬虫工程师需求

广州地区（本吊不能出去其他城市找工作）

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

评论收藏

内容反馈

20171207 爬虫需求分析1

评论0

最新资源

20171207 爬虫需求分析1

评论0

最新资源

相关推荐

网络爬虫需求分析.docx

网络爬虫需求分析.doc

人工智能时代我国会计人才需求分析——基于爬虫大数据分析技术.pdf

不错的需求分析资料，共8个部分

Java+python实现爬虫+大数据的招聘需求分析系统-源码

招聘网站分析-猎聘网的爬虫设计与实现

基于python爬虫对百度贴吧进行爬取的设计与实现.docx

爬虫+大数据的招聘需求分析，毕设项目.zip

基于JAVA和Eclipse开发环境的网络爬虫技术网络新闻分析软件程序源码+WORD说明档.zip

Java+python实现爬虫+大数据的招聘需求分析系统完整源码+项目说明.zip

基于Linux的python多线程爬虫程序设计.pdf

安居客出租房（武汉为例）爬虫+数据分析+可视化

论文研究-面向BBS的主题爬虫系统的分析与设计 .pdf

Python网络爬虫实战.pdf

基于Python Scrapy爬虫框架实现的链家二手房数据爬取系统的设计与实现 毕业设计论文答辩用 1万+字 共41页.pdf

基于python的网上购物商品评论爬虫分析设计与实现.docx

python爬虫 - 期末考核课程设计天天基金网数据采集源代码

BurpLoaderKeygen.jar.zip

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

Goby红队版-win-x64-2.4.7版本

Chrome Header Editor 插件

ISO SAE 21434-2021 中文版.pdf

OpenVAS GVM 中文翻译补丁

安全认证cisp教材全套

STM32F103C8T6核心板-电路原理图1.PDF

软件工程导论(第六版)课后习题答案1

goby红队&社区版-win-64-2.4.7

基于Python Scrapy爬虫框架实现的链家二手房数据爬取系统的设计与实现毕业设计论文答辩用 1万+字共41页.pdf