没有合适的资源?快使用搜索试试~ 我知道了~
compendia-scraper:Web抓取工具,可从PreviewsWorld抓取新版本,将它们解析为JSON,然后将其提交...
共29个文件
js:22个
json:2个
jpg:2个
需积分: 9 0 下载量 151 浏览量
2021-03-31
09:17:00
上传
评论
收藏 133KB ZIP 举报
温馨提示
Compendia网页抓取工具 关于 这个网络抓取工具每周都会抓取页面,以获取计划在该周的漫画店发行的美国漫画书,并将其解析为JSON数据。 解析完成后,所有漫画都将保存到“暂存版本” JSON文件中,可以在其中手动检查它们是否存在任何错误,然后将其提交到PostgreSQL数据库,其封面由AWS S3托管。 使用它作为数据源。 如何使用 解析发布并将它们提交到数据库: 克隆此存储库并安装所有依赖项 将PostgreSQL和AWS S3环境变量添加到.env文件 运行“ npm run parse”以抓取这些发行版,并将其解析为在/log/todays-date-StagedReleases.json下找到的JSON。 手动查看/log/todays-date.log下的日志中是否有任何警告或错误,并在暂存的发行文件中解决它们 运行“ npm run commit”,将已发布的版本提交
资源推荐
资源详情
资源评论
收起资源包目录
compendia-scraper-master.zip (29个子文件)
compendia-scraper-master
package.json 955B
.prettierignore 22B
package-lock.json 397KB
NoCover.jpg 13KB
src
database
series.js 1KB
comicCreators.js 761B
creator.js 1KB
publisher.js 1KB
commit.js 2KB
connect.js 896B
comic.js 4KB
scrapers
index.js 599B
previewsWorld
test
manualTest.js 527B
parse
variant.js 9KB
creator.js 4KB
util.js 744B
comic.js 22KB
subtitle.js 5KB
patterns.js 4KB
scrape.js 6KB
utils
parseCover.js 2KB
getMonth.js 707B
logger.js 933B
sleep.js 141B
stagedReleases.js 546B
convertToProperCasing.js 2KB
.gitignore 2KB
PreviewsWorldPlaceholder.jpg 14KB
README.md 3KB
共 29 条
- 1
资源评论
水瓶座的兔子
- 粉丝: 26
- 资源: 4469
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功