没有合适的资源?快使用搜索试试~ 我知道了~
Gumo:从动态网页提取数据的搜寻器。 写在节点js
共9个文件
js:4个
json:2个
license:1个
需积分: 12 0 下载量 19 浏览量
2021-05-13
14:31:54
上传
评论
收藏 12KB ZIP 举报
温馨提示
:spider_web: 古墨 “蜘蛛”(Gumo)在日语中是“蜘蛛”的意思。 概述 :glasses: Web爬网程序(获取它?)和爬网程序,它从一组嵌套的动态网页中提取数据,并添加了增强功能以帮助进行知识挖掘应用程序。 用NodeJS编写。 目录 :open_book: :man::laptop: 配置 :gear: 弹性搜索 :high_voltage: GraphDB☋ 节点数 人际关系 去做 :check_box_with_check: 特征 :glowing_star: 出现在任何域及其子域的页面上的爬网超链接。 从每个页面抓取元标记和正文。 将整个站点地图存储在GraphDB中(当前支持Neo4J)。 将页面内容存储在ElasticSearch中,以方便全文本查找。 安装 :building_construction: 用法 :man::laptop: 来自代码: // 1: import the module const gumo = require ( 'gumo' ) // 2: instantiate the
资源推荐
资源详情
资源评论
收起资源包目录
Gumo-main.zip (9个子文件)
Gumo-main
crawler
crawler.js 13KB
.gitignore 137B
package.json 1KB
LICENSE 1KB
gumo.js 6KB
index.js 555B
libs
graphHandler.js 2KB
README.md 8KB
config.json 542B
共 9 条
- 1
资源评论
每天痛苦与更好的
- 粉丝: 32
- 资源: 4536
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功