没有合适的资源?快使用搜索试试~ 我知道了~
content-record-scraper
共20个文件
ts:11个
json:4个
gitignore:1个
需积分: 5 0 下载量 141 浏览量
2021-04-14
03:01:16
上传
评论
收藏 22KB ZIP 举报
温馨提示
内容记录抓取器 介绍 该存储库包含一个抓取器,它将从Content Record DAC抓取信息。 它将定期下载内容记录使用的索引和页面文件,并将其持久保存在Mongo数据库中。 资料模型 在mongo数据库中,将有三个集合: content interactions users 在content集合中,我们跟踪创建的所有内容,在interactions集合中,我们跟踪与该内容发生的所有交互。 在users集合中,我们跟踪所有用户,并保持状态。 此状态可防止抓取工具不必要地重新索引已编制索引的内容和/或交互。 用户非常重要,因为需要将其喂入刮板。 抓取工具不会自行扩展用户,它只会扫描内容记录以查找已知的用户,并保持最新状态。 建筑学 刮板是围绕两个cronjobs构建的: 提取skapps 获取条目 Fetch skapps仅有一项工作是更新用户的skapp列表。 skapp
资源推荐
资源详情
资源评论
收起资源包目录
content-record-scraper-main.zip (20个子文件)
content-record-scraper-main
src
database
types.ts 460B
index.ts 889B
mongodb.ts 2KB
index.ts 440B
crons
fetch_interactions.ts 3KB
types.ts 551B
fetch_skapps.ts 2KB
utils.ts 1KB
index.ts 2KB
fetch_newcontent.ts 3KB
consts.ts 410B
Dockerfile 149B
scripts
start.sh 25B
tsconfig.json 463B
tslint.json 2KB
README.md 3KB
docker-compose.yml 242B
.gitignore 18B
package-lock.json 28KB
package.json 743B
共 20 条
- 1
资源评论
晨曦姜
- 粉丝: 62
- 资源: 4660
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- yolo算法-动物数据集-8944张图像带标签-自行车-背景-大象-豹-牛-熊-鹿-马-摩托车-猎豹-福克斯-猴子-美洲虎-太阳能电池板-老虎-犀牛-狮子-山羊-人-狗-天鱼-鸟.zip
- WordPress在线社交问答社区主题Discy V3.8.1
- 公开整理-农业科技创新数据集(2010-2022).xlsx
- 基于Python卷积神经网络人脸识别驾驶员疲劳检测与预警系统设计毕业源码案例设计
- yolo算法-麻将数据集-2205张图像带标签-绿色-北-南方-西-白色-万-东-红色.zip
- yolo算法-麻将检测数据集-13687张图像带标签-西风.zip
- yolo算法-跌倒检测数据集-10787张图像带标签-检测到跌倒.zip
- 软考冲刺资源之软考系统架构设计师笔记一起努力吧
- delphi 读取多种格式的图像,并实现互转
- Wordpress简约大气昼夜切换导航主题模板NDNAV主题
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功