没有合适的资源?快使用搜索试试~ 我知道了~
DS_CTT:对中国时间标签的远距离监督
共93个文件
txt:31个
py:26个
yml:8个
需积分: 9 0 下载量 51 浏览量
2021-05-16
23:09:03
上传
评论 1
收藏 177.05MB ZIP 举报
温馨提示
DS_CTT Distant supervision for Chinese Temporal Tagging 利用CN-DBPedia的triples做远程监督,进行中文时间表达式标注。 序列标注模型采用BiLSTM+CRF。 DS_CTT介绍 百科语料经来自CN-DBPedia的时间相关三元组远程监督标注,作为序列标注模型BiLSTM+CRF的训练集。 raw_pages来源: 百度百科随机页面3万条 Bike_triples.txt文件: 来自知识工场2015年dump文件,http://openkg.cn/dataset/cndbpedia 代码使用: 数据准备部分用python2.7写的,序列标注模型python3.5+Tensorflow 总体框架图 训练集标注示意图(两轮标注): 第一轮较长时间属性值文本匹配 第二轮加入jieba词性标注的结果 序列标注模型框架图:
资源推荐
资源详情
资源评论
收起资源包目录
DS_CTT-master.zip (93个子文件)
DS_CTT-master
images
flow_3.PNG 37KB
flow_4.PNG 50KB
flow_1.PNG 84KB
flow_2.PNG 92KB
data_preprepare
temp_eval_2
train
train_temporal_tag.txt 237KB
timex-extents.tab 31KB
train_temporal_tag_line.txt 238KB
__init__.py 0B
base-segmentation.tab 484KB
test
timex-extents.tab 6KB
test_temporal_tag_line.txt 51KB
__init__.py 0B
test_temporal_tag.txt 51KB
base-segmentation.tab 110KB
__init__.py 0B
data_file
candidate_property_top_all.txt 503KB
candidate_property.txt 444KB
candidate_property.json 1013KB
sentence_set.txt 65.64MB
__init__.py 0B
__init__.py 0B
script
sentence_process.py 4KB
__init__.py 0B
temporal_property.py 6KB
temp_eval_process.py 4KB
data_prepare_pos
data_file
sentence_tag_5_final.txt 37.73MB
untag_sentence_5.txt 12.6MB
sentence_vertical_tag_5.txt 38.56MB
sentence_tag_5_only_jieba.txt 37.73MB
sentence_tag_5_pos.txt 37.73MB
temporal_sentence_candidate.txt 27.39MB
temporal_expression_5.txt 3.03MB
sentence_tag_standard_5.txt 37.9MB
temporal_expression_deduplicate_clean.txt 3.23MB
__init__.py 0B
script
__init__.py 0B
temporal_filter.py 1KB
pos_tag.py 3KB
text_match_tag.py 3KB
time_taging
preprocessing.py 8KB
train_config
config_b2b_tag_5_complete.yml 1KB
config_t2t.yml 1KB
config_b2t_tag_5_complete.yml 1KB
config_b2b_tag_5_no_pos.yml 1KB
config_t2b.yml 1KB
config_b2t_tag_5_only_jieba.yml 1KB
config_b2t_tag_5_no_pos.yml 1KB
config_b2b_tag_5_only_jieba.yml 1KB
utils.py 6KB
data
zi_vec.txt 24.21MB
temporal_lab
baike_2_TempEval
test_tag_TempEval_all.txt 337KB
test_tag_TempEval.txt 59KB
train_set
tag_5_complete.txt 37.73MB
tag_5_no_pos.txt 37.9MB
tag_5_only_jieba.txt 37.73MB
TempEval_2_baike
train_tag_TempEval.txt 278KB
test_set_Baike.txt 248KB
baike_2_baike
test_set_Baike.txt 248KB
train_set
tag_5_complete.txt 37.73MB
tag_5_no_pos.txt 37.9MB
tag_5_only_jieba.txt 37.73MB
TempEval_2_TempEval
train_tag_TempEval.txt 278KB
result_t2t.txt 68KB
test_tag_TempEval.txt 59KB
test.py 5KB
train.py 4KB
__pycache__
load_data.cpython-35.pyc 3KB
model.cpython-35.pyc 16KB
utils.cpython-35.pyc 7KB
Model
b2t
__init__.py 0B
t2b
best_model.meta 1.28MB
checkpoint 77B
best_model.index 1KB
best_model.data-00000-of-00001 10.32MB
__init__.py 0B
b2b
__init__.py 0B
t2t
best_model.meta 1.28MB
checkpoint 77B
best_model.index 1KB
best_model.data-00000-of-00001 10.32MB
__init__.py 0B
load_data.py 3KB
model.py 24KB
Res
voc
f1.voc.pkl 25KB
char.voc.pkl 657KB
label.voc.pkl 38B
some_voc 20B
embed
some_embed 1B
README.md 6KB
Utils
trietree.py 5KB
1
train_word2vec_model.py 1KB
README.md 328B
README.md 1KB
共 93 条
- 1
资源评论
苏咔咔
- 粉丝: 26
- 资源: 4706
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功