# WebSpiderLearnAndTest
A simple C# web spider application , It catches all the hotels of hangzhou from xiecheng
[一个简单的C#怕爬虫软件,提供了一个基础的爬虫框架,实现了携程网上对杭州所有的酒店信息爬取到本地,由于网页信息是ajax分页的,所以使用了phantomjs+Selenium来实现功能]
关键爬虫代码参考以下项目:
<ul>
<li>https://github.com/coldicelion/Simple-Web-Crawler</li>
<li>https://github.com/coldicelion/Strong-Web-Crawler</li>
</ul>
## screenshot[以下是示例截图]:
![image](https://github.com/dathlin/WebSpiderLearnAndTest/raw/master/WebSpiderLearnAndTest/screenshots/hotel.png)
## Catch pictures from taobao.com [从淘宝获取淘MM照片]
能获取到绝大多数的照片,但是总会有几个会出现异常。【原因来自几张图片原本就是无法显示的】
![image](https://github.com/dathlin/WebSpiderLearnAndTest/raw/master/WebSpiderLearnAndTest/screenshots/alibaba.png)
【一个简单的爬虫程序,提供了一个基础的框架,实现了对AJAX页面爬虫,并测试学习几个例子,详细见….zip
需积分: 2 154 浏览量
2024-01-20
15:33:28
上传
评论
收藏 17.86MB ZIP 举报
![avatar](https://profile-avatar.csdnimg.cn/f40b27f659cf4356877369aa7344c2b6_qqrrjj2011.jpg!1)
极致人生-010
- 粉丝: 3444
- 资源: 3074
最新资源
- jQuery jPages分页工具库(jQuery Pagination Plugin)
- Spring框架学习指南
- Lan仿朋友圈系统开源源码,可用于表白墙等微商相册,商品图册等
- ASP.NET电子购物商城系统(源码)
- SLAM-V1.5.4
- Hibernate 版本 3.6.0 最终发布版(或Hibernate 3.6.0 最终版)
- 简约在线生成短网址系统源码 短链防红域名系统 带后台
- asp.netERP客户关系系统设计(源码)
- RJ45 PCB封装概述: SMD(表面贴装设备)封装 插件式封装 特定型号如R-RJ45R08P-A004等详细封装规格 以上
- 2024最新Zibll子比主题V7.7版本源码 开心版 - WordPress主题
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)