没有合适的资源?快使用搜索试试~ 我知道了~
RENET2:RENET2
共74个文件
py:25个
ipynb:11个
gitkeep:9个
需积分: 18 0 下载量 45 浏览量
2021-03-20
10:14:15
上传
评论
收藏 6.56MB ZIP 举报
温馨提示
RENET2:具有迭代训练数据扩展的高性能全文本基因-疾病关系提取 联系人:苏俊浩电邮: 介绍 关系提取是从生物医学文本中提取基因-疾病关联的一项基本任务。现有工具的能力有限,因为它们只能从单个句子或抽象文本中提取基因-疾病关联。在这项工作中,我们提出RENET2,这是一种基于深度学习的关系提取方法,该方法实现节过滤和模糊关系建模以从全文文章中提取基因-疾病关联。我们设计了一种新颖的迭代训练数据扩展策略,以构建带注释的全文数据集,以解决全文文章上标签的稀缺性。在我们的实验中,RENET2从带注释的全文本数据集中提取基因疾病关联的F1分数达到72.13%,分别比现有的最佳工具BeFree,DTMiner和BioBERT高27.22%,30.30%和29.24%。 。我们将RENET2应用于(1)来自PMC的〜1.89M全文文章,发现〜3.72M基因-疾病关联; (2)LitCovid文章设
资源推荐
资源详情
资源评论
收起资源包目录
RENET2-main.zip (74个子文件)
RENET2-main
.gitignore 275B
README.md 14KB
test
test_download_pmcid_list.csv 231B
test_download_pmid_list.csv 1KB
renet2
evaluate_renet2_ft.py 17KB
stat_covid.ipynb 173KB
pre_process
preparing_ft_data.ipynb 92KB
normalize_ann.py 4KB
exp_ft.ipynb 685KB
utils
sequence_utils.py 18KB
omim2mesh.py 409B
mesh_match.py 356B
ann_utils.py 9KB
data_iterator.py 8KB
__init__.py 0B
word_index 2.16MB
venn.py 21KB
gene_transfer.py 346B
tokenizer.py 6KB
evaluate_renet2_ft_cv.py 35KB
parse_data.py 26KB
train_renet2_ft.py 34KB
download_renet2_data.sh 1KB
build_best_model_abs.ipynb 361KB
clean_label.ipynb 113KB
download_renet2_data_bal.sh 1KB
model.py 42KB
predict_renet2_ft.py 18KB
__init__.py 0B
parse_COVID_data.ipynb 27KB
raw_handler.py 27KB
resource
dict_omim2mesh.txt 178KB
human_genes.txt 306KB
dict_gene.txt 4.48MB
dict_c2d.txt 9.15MB
exp_abs.ipynb 323KB
vis_text.ipynb 535KB
raw.py 61KB
train_renet2_ft_cv.py 34KB
download_data.py 6KB
models
ft_models
.gitkeep 0B
.gitkeep 0B
abs_models
.gitkeep 0B
benchmark
Generate_BioBERT_Input.ipynb 22KB
BeFree
README.md 509B
benchmark_befree.sh 4KB
calculate_metrics.py 2KB
check.tsv 8KB
Generate_BeFree_Input.ipynb 9KB
BioBERT
re_eval.py 2KB
run_bert.sh 977B
calculate_metrics.py 3KB
run_bert_e.sh 344B
DTMiner
README.md 279B
benchmark_DTMiner.sh 59B
calculate_metrics.py 2KB
Generate_DTMiner_Input.ipynb 8KB
LICENSE.md 1KB
tools
geniass-1.00.tar.gz 148KB
data
ft_info
ft_id_lst.csv 10KB
classification_result_befree.txt 81KB
classification_result_dtminer.txt 98KB
classification_result_biobert.txt 100KB
ft_500_n.tsv 371KB
abs_data
.gitkeep 0B
raw_data
ft
.gitkeep 0B
abs
.gitkeep 0B
image
RENET2_vis.png 59KB
RENET2_logo.png 53KB
ft_data
.gitkeep 0B
test_data
.gitkeep 0B
ft_gda
.gitkeep 0B
ann_table
ann_1st.tsv 484KB
ann_2nd.tsv 324KB
共 74 条
- 1
资源评论
易烊千玺的小朋友
- 粉丝: 33
- 资源: 4516
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功