智虎履带
徒手实现定时爬取知乎,从中发掘目标的信息,并可视化爬取的数据作网页展示。项目当前正在开发,欢迎前来交流学习!
问题及解决方案
日志程序运行时统一初始化。由于logging应用了单例模式,之后可以直接使用配置好的logging
第三方库版本管理Pipenv,功能强大,方便易用
代码版本控制Git,使用.gitignore来忽略日志文件夹,vim临时文件,缓存文件文件夹
配置管理Yaml,清晰性好,语法简单
文件组织将相同功能的文件放于同一文件夹下,*。py文件组织成包
性能分析使用自己定义的装饰器函数来测量函数运行的时间
数据爬取使用Selenium + Webdriver爬取动态网页
评论0
最新资源