没有合适的资源?快使用搜索试试~ 我知道了~
ruby-spider:使用“ anemone” gem作为框架,用ruby编写的电子邮件爬虫
共7个文件
rb:2个
md:1个
gemfile:1个
需积分: 9 0 下载量 36 浏览量
2021-05-01
01:50:40
上传
评论
收藏 3KB ZIP 举报
温馨提示
目的 该网络蜘蛛会收集可以在目标网站上找到的所有电子邮件地址。 它将收集的地址存储在SQLite数据库文件中。 每个地址还包括有关该站点和其被收获的页面以及被发现的时间的信息。 安装 删除Gemfile.lock文件。 然后将宝石与: bundle install 用法 使用以下方法调用蜘蛛: ruby crawl.rb URL 抓取工具会在抓取网站时显示每个页面的URL。 它将写出一个pages.pstore文件(用于跟踪其已爬网的页面),以及一个data.db文件(用于存储收集的地址)。 要从数据库中导出地址,请执行“导出” Rake任务: rake export 您应该看到如下输出: [~/projects/ruby_spider] rake export 31 addresses exported to addresses.csv 导出数据中的每一行都包含电子邮件地址,收
资源推荐
资源详情
资源评论
收起资源包目录
ruby-spider-master.zip (7个子文件)
ruby-spider-master
Rakefile 448B
data.rb 798B
Gemfile 87B
Gemfile.lock 2KB
crawl.rb 963B
.gitignore 34B
README.md 1KB
共 7 条
- 1
资源评论
是CC阿
- 粉丝: 20
- 资源: 4744
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功