没有合适的资源?快使用搜索试试~ 我知道了~
HTMetadata-Bookworm:创建一个目录文件文件,用于基于 HTRC 文本生成书虫
共22个文件
py:8个
json:4个
txt:2个
需积分: 5 0 下载量 156 浏览量
2021-06-16
12:12:24
上传
评论
收藏 14.57MB ZIP 举报
温馨提示
HTMetadata-书虫 这个 repo 做了两件事: 为完整的 HTRC 书虫协作构建必要的jsoncatalog.txt文件和field_descriptions.json 。 使用这些文件构建一个正在运行的 Bookworm 实例,其中包含所有 HTRC 元数据,但使用标题而不是单词的全文。 第一个是构建完整的 HTRC 书虫的重要前期步骤。 第二,元数据书虫主要用作更完整的 HTRC 集合的调试工具/测试平台。 这主要是 HTRC-Bookworm 项目的内部代码,不太可能引起广泛关注。 描述 一次一行地读取 hathifiles 文本文件,调用 HTRC 的 Solr 代理 API 以获取其他元数据,并创建目录文件文件以用于生成基于 HTRC 文本的 Bookworm。 用法:python3 generator.py [hathifile hathifile] [-
资源推荐
资源详情
资源评论
收起资源包目录
HTMetadata-Bookworm-master.zip (22个子文件)
HTMetadata-Bookworm-master
fakeInput.py 339B
supplementMetadata.sh 305B
data
pd-ids.txt 80.82MB
guiOptions
example-autogen.json 90KB
clean.py 2KB
example-handcraft.json 92KB
MarcLanguageCodes.tsv 8KB
README.md 44B
generator.py 7KB
field_descriptions.json 2KB
.gitignore 874B
truncate
remove-consecutive-dupes.awk 53B
truncate_hathifile.sh 583B
select-hathiline.py 1KB
Makefile 813B
README.md 2KB
HTBookwormCatalogGenerator
util.py 1KB
field_descriptions.json 1KB
__init__.py 23B
classification.py 13KB
location.py 18KB
LICENSE.txt 2KB
共 22 条
- 1
资源评论
佳同学
- 粉丝: 28
- 资源: 4583
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功