没有合适的资源?快使用搜索试试~ 我知道了~
Japanese-Company-Lexicon
共28个文件
py:22个
sh:2个
license:1个
需积分: 5 0 下载量 160 浏览量
2021-03-09
03:07:49
上传
评论
收藏 45KB ZIP 举报
温馨提示
日本公司词汇(JCLdic) “日本公司名称识别的高覆盖辞典” 的回购。 下载链接 我们提供两种格式。 CSV格式每行包含一个名称,而每行包含一个记录。 用户可以直接打开MeCab CSV格式来检查记录。 MeCab Dic格式由MeCab编译,可以用作MeCab的用户词典。 JCL_slim(7067216, , , ):无假名,无额外的enName,无数字名称,名称长度大于2且小于30。 JCL_medium(7555163, , , ):无数字名称,名称长度大于2且小于30。 JCL_full(8491326, , , , ):包含各种名称。 我将MeCab Dic分为两个文件,因为MeCab由于文件大而无法编译单个文件。 我们的目标是建立企业知识图,因此我们仅考虑出于商业目的进行经济活动的公司。 这些公司分别表示为股份公司(Ltd),有限公司(Limit
资源推荐
资源详情
资源评论
收起资源包目录
Japanese-Company-Lexicon-master.zip (28个子文件)
Japanese-Company-Lexicon-master
models
crf.py 1KB
tools.py 6KB
utils.py 14KB
metrics.py 6KB
evaluate.py 5KB
__init__.py 0B
bilstm.py 1KB
config.py 272B
bilstm_crf.py 11KB
main.py 7KB
tools
annotator.py 3KB
convert_csv2jsonl.py 5KB
dataset_preprocess.py 12KB
coverage.py 3KB
jcl_filter.py 2KB
alias_generation.py 13KB
downloader.py 3KB
settings.py 85B
dictionary_preprocess.py 4KB
save_mecab_format.py 3KB
annotation_with_dict.py 6KB
dataset_converter.py 2KB
LICENSE 1KB
requirements.txt 188B
.gitignore 1018B
README.md 23KB
scripts
generate_alias.sh 343B
download.sh 977B
共 28 条
- 1
资源评论
三渔
- 粉丝: 23
- 资源: 4544
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功