没有合适的资源?快使用搜索试试~ 我知道了~
readable-web-extractor-comparison:手动比较各种可读的Web提取程序库与不同的网站
共23个文件
ts:12个
json:2个
editorconfig:1个
需积分: 9 0 下载量 194 浏览量
2021-05-02
09:23:07
上传
评论
收藏 78KB ZIP 举报
温馨提示
可读的Web提取器比较 各种可读的网站提取程序库(即提供类的功能的库)如何执行? 存在此回购协议是为了提供一种可以一次在多个页面之间比较多个库的方法。 当前,实现了以下库: TODO-(377星) 待办事项 (13星) 结果 gh-pages分支提供了在2020年6月从Hacker News选择的一组16个随机页面上进行比较的最新输出( )。 基于这些比较, 打算使用mozilla / 项目。 范例报告 用法 确保运行yarn以确保安装了所有依赖项。 每个命令应包括--help文档,并在执行过程中产生说明性输出。 提取测试页 创建一个以换行符分隔的URL列表,以获取并存储在文本文件中,例如test_urls.txt 。 使用fetch-test-pages脚本检索它们并将其保存到诸如test_pages/的文件夹中,以进行报告处理。 yarn scripts:run ./s
资源推荐
资源详情
资源评论
收起资源包目录
readable-web-extractor-comparison-master.zip (23个子文件)
readable-web-extractor-comparison-master
.prettierignore 50B
.gitignore 3KB
README.md 3KB
.markdownlintrc 65B
.pre-commit-config.yaml 1KB
LICENSE 1KB
package.json 2KB
scripts
tsconfig.json 2KB
generate-report.ts 6KB
fetch-test-pages.ts 3KB
lib
types.ts 788B
func.ts 980B
adapters
adapter-metascraper.ts 780B
adapter-readability.ts 685B
adapter-cleanview.ts 422B
index.ts 268B
adapter-mercury.ts 808B
stream.ts 369B
missing-types
metascraper.d.ts 400B
cleanview.d.ts 1KB
test_urls.txt 1KB
.editorconfig 313B
yarn.lock 147KB
共 23 条
- 1
资源评论
帝哲
- 粉丝: 35
- 资源: 4669
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功