没有合适的资源?快使用搜索试试~ 我知道了~
warcio, 流 warc/arc 库,用于快速网络存档.zip
共56个文件
py:30个
gz:8个
warc:4个
需积分: 18 1 下载量 46 浏览量
2019-09-17
11:44:18
上传
评论
收藏 95KB ZIP 举报
温馨提示
warcio, 流 warc/arc 库,用于快速网络存档 WARCIO: WARC ( 还有 arc ) 流库 背景这个库提供了一种快速。独立的方式来读取和写入 WARC格式( 通常用于web归档中) 。 支持 python 2.7 和 python 3.3 ( 使用六,这是
资源推荐
资源详情
资源评论
收起资源包目录
warcio.zip (56个子文件)
warcio-master
.gitignore 329B
warcio
statusandheaders.py 11KB
digestverifyingreader.py 5KB
extractor.py 1KB
recordloader.py 13KB
capture_http.py 6KB
timeutils.py 9KB
exceptions.py 224B
archiveiterator.py 8KB
checker.py 3KB
utils.py 3KB
recordbuilder.py 8KB
cli.py 4KB
__init__.py 145B
recompressor.py 3KB
warcwriter.py 5KB
bufferedreaders.py 12KB
indexer.py 3KB
limitreader.py 2KB
README.rst 14KB
appveyor.yml 746B
test
test_writer.py 26KB
test_cli.py 19KB
test_limitreader.py 1KB
test_utils.py 3KB
test_bufferedreaders.py 6KB
__init__.py 133B
test_statusandheaders.py 7KB
test_archiveiterator.py 15KB
test_capture_http.py 9KB
test_check_digest_examples.py 3KB
data
example-iana.org-chunked.warc 9KB
example-space-in-url.arc 2KB
example-space-in-target-uri.warc.gz 583B
bad.arc 331B
example.arc 2KB
example.warc 5KB
example-wrong-chunks.warc.gz 2KB
example-bad.warc.gz.bad 2KB
example-wget-bad-target-uri.warc.gz 3KB
example.warc.gz 4KB
example-resource.warc.gz 2KB
post-test.warc.gz 4KB
example-trunc.warc 3KB
example-digest.warc 4KB
example.arc.gz 1KB
example-bad-non-chunked.warc.gz 2KB
test_digestverifyingreader.py 1KB
LICENSE 10KB
CHANGELIST.rst 9KB
.gitattributes 39B
.coveragerc 72B
MANIFEST.in 49B
setup.py 2KB
.travis.yml 369B
NOTICE 128B
共 56 条
- 1
资源评论
weixin_38743506
- 粉丝: 349
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功