没有合适的资源?快使用搜索试试~ 我知道了~
country-names:使用Wikipedia数据创建查找表以消除国家_地区名称的歧义
共6个文件
py:2个
csv:2个
gitignore:1个
需积分: 5 0 下载量 31 浏览量
2021-05-13
12:08:42
上传
评论
收藏 55KB ZIP 举报
温馨提示
国家消歧 这些脚本有助于构建列表以消除国家名称的歧义。 Wikipedia中的ISO 3166国家/地区列表用作“标准”国家/地区名称列表( )。 脚本get3166.py从Wikipedia get3166.py ISO 3166国家名称和其他信息的列表,并将其保存在get3166.py中。 脚本disambiguate.py为每个ISO 3166国家/地区名称生成一个替代名称的查找表。 它通过解析由DBpedia项目构建的Wikipedia上的传递重定向列表来实现。 最终结果是一个包含两列的CSV文件:备用国家/地区名称和标准化(ISO 3166)名称。 由于Wikipedia重定向存储在dbpedia中的方式,因此将包括一些实际上不是国家名称的替代国家名称,但是除了使查找表变得比必要的大一点之外,这无关紧要。 该代码非常脆弱且缓慢,但是不必经常运行它。 感谢向我建议这种
资源推荐
资源详情
资源评论
收起资源包目录
country-names-master.zip (6个子文件)
country-names-master
country-names-cross-ref.csv 238KB
get3166.py 1KB
README.md 1KB
countries.csv 26KB
.gitignore 29B
disambiguate.py 1KB
共 6 条
- 1
资源评论
RonaldWang
- 粉丝: 22
- 资源: 4586
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功