没有合适的资源?快使用搜索试试~ 我知道了~
go-htmldate:用于提取网页发布日期的 CLI 和 Go 包
需积分: 12 1 下载量 19 浏览量
2021-08-04
21:44:49
上传
评论
收藏 5.1MB ZIP 举报
温馨提示
Go-HtmlDate Go-HtmlDate 是一个 Go 包和命令行工具,用于提取网页的原始和更新发布日期。 这个包基于 ,一个由 的 Python 包。 这个包的结构是按照原始Python代码的结构排列的。 这样,两个库都应该提供相似的性能,并且可以轻松移植原始库的任何改进。 目录 特征 提取网页的原始或更新的发布日期; 实验:也提取原始或更新的发布时间(及其时区); 就像原来一样,Go-HtmlDate 有两种模式:快速和广泛。 区别在于: 在快速模式下,HTML 页面被清理并有针对性的精确模式; 在扩展模式下,Go-HtmlDate 还将收集所有可能的日期并使用消歧算法来确定要使用的最佳日期。 默认情况下,Go-HtmlDate 将在扩展模式下运行,通常没有理由使用快速模式。 这是因为与原来不同的是,在我们的 Go 端口中,fast 和extended 模式之间的提
资源推荐
资源评论
资源评论
信徒阿布
- 粉丝: 39
- 资源: 4576
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功