img
share 分享

Python数据分析与数据化运营 第2版

作者:宋天龙

出版社:机械工业出版社

ISBN:9787111627760

VIP会员免费 (仅需0.8元/天) ¥ 65.0

温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!

电子书推荐

更多资源 展开

基于Python的简单网络爬虫的实现 评分:

随着互联网技术的发展, 网络信息过载已经成为不争 的事实。 因此, 如何有效提取互联网信息, 并将这些信息 充分利用已经成为一个巨大的挑战。 搜索引擎成为用户检 索信息的工具。 而所谓搜索引擎的重要组成部分, 网络爬 虫是一种按照一定的规则, 自动地抓取万维网信息的程序 和脚本。 网络爬虫技术的应用范围较广。 例如, 可将爬虫获取 的有价值数据资源进行整合, 实现不同类型的垂直领域的 应用, 图书价格比对, 新闻主题聚合网等。 特别要提到的 是, 现今大数据时代, 机器学习算法需要大量的网络数 据作为训练数据, 一定程度上说, 训练数据的质量高低 决定了机器学习算法效果的差异。 而获取训练数据的方 法除了其他典型的统计数据外, 网络爬虫提取数据也是 其中主要的方法。 网络爬虫技术是目前大数据时代的重 要基础应用

...展开详情
上传时间:2018-07 大小:1.07MB
热门图书