# CCKS_EE
## environment
```
python 3.6
torch 1.5.0
matplotlib 3.1.1
numpy 1.16.1
```
## 结构
```
base :attention实现
data :数据及预处理
pretrained_models :BERT与训练模型
result :保存的结果、图像和对应的 p r f,以及结果的处理
save_model :保存的模型
vocab :提供的实体词典
config.py :配置信息
loss.py :dice_loss的实现
model.py :模型
module.py :模型训练预测等相关函数
result_analysis.py :模型结果分析
run.py :模型训练入口
test.py :测试
tool.py :各种工具
```
## data 各个文件及处理分析函数
```
analysis.py # 多种分析函数
precess.py # 预处理
task2_train_reformat.xlsx # 原始数据
task2_train_reformat_cleaned.xlsx # 清洗后的数据
sub_train.xlsx # 8-2随机切分后数据
sub_cut_train.xlsx # 病例文档切分成子句后的子句文档
```
## run.py 入口文件
```
config.experiment_name = 'test_init_model' # 实验名称
config.model_name = 'BiLSTM_CRF' # 模型名称
config.is_vector = False # 是否使用bert词向量
config.is_hidden_tag = False # 是否增加 子句hidden-> 是否有待抽取属性 的约束
注:此处也可更改或添加其他config.py文件中未涉及到的属性
```
## module.py 训练预测等相关函数
```
train() # 训练函数
eval() # 评测函数
predict_test() # 预测test文件
predict_sentence() # 预测具体医疗病例
```
## 2020.8.22
```
1.embedding
2.data argument
3.ruler
4.dice loss
5.hidden tag & size replace & bioes & CNN
6.autoencoder
7.data clean
note:find mistakes
```
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
CCKS举办的针对电子病例的信息抽取比赛,主要是进行医疗实体及事件抽取,本项目包括展示比赛的不断改进与多种方法的尝试,最终取得:valid第6名;test第9名。 教育部认可的大学生竞赛备赛资料代码,源码,竞赛总结,所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通 全国电子设计大赛、全国大学生智能汽车竞赛、蓝桥杯、集成电路创新创业大赛、光电设计竞赛、挑战杯、大创项目、互联网+、三创赛、计算机设计竞赛、创新创业大赛、ACM-ICPC国际大学生程序设计竞赛、全国大学生数学建模竞赛、全国大学生电子商务“创新、创意及创业”挑战赛、全国大学生节能减排社会实践与科技竞赛、全国大学生工程训练综合能力竞赛、全国大学生机器人大赛-RoboMaster、RoboCon、“西门子杯”中国智能制造挑战赛、中国大学生计算机设计大赛、世界技能大赛、中国高校计算机大赛-大数据挑战赛、团体程序设计天梯赛、移动应用创新赛、网络技术挑战赛、全国大学生信息安全竞赛、“中国软件杯”大学生软件设计大赛、全国大学生光电设计竞赛、中国机器人及人工智能大赛、“大唐杯”全国大学生移动通信5G技术大赛、华为ICT大赛、全国大学生嵌入式芯片与系统设计竞赛、中国高校智能机器人创意大赛
资源推荐
资源详情
资源评论
收起资源包目录
CCKS举办的针对电子病例的信息抽取比赛,主要是进行医疗实体及事件抽取,本项目包括展示比赛的不断改进与多种方法的尝试,最终取得:valid第6名;test第9名。.zip (41个子文件)
cm
__init__.py 80B
loss.py 3KB
pretrained_models
__init__.py 78B
module.py 44KB
data
sub_cut_train1.xlsx 890KB
__init__.py 78B
data2conll.py 0B
data_augmentation.py 8KB
task2_train_reformat.xlsx 362KB
task2_no_val_cleaned.xlsx 126KB
sub_cut_dev.xlsx 145KB
sub_cut_dev_new.xlsx 106KB
sub_dev.xlsx 107KB
sub_cut_train_new.xlsx 717KB
analysis.py 9KB
test.xlsx 99KB
task2_train_reformat_cleaned.xlsx 486KB
sub_cut_dev1.xlsx 149KB
task2_no_val.xlsx 122KB
sub_train.xlsx 1001KB
sub_cut_train.xlsx 581KB
precess.py 26KB
save_model
__init__.py 79B
vocab
__init__.py 78B
task2_vocab.val.txt 4KB
task2_vocab.txt 10KB
model.py 40KB
result_analysis.py 4KB
vector
__init__.py 0B
base
__init__.py 0B
layers.py 8KB
tool.py 27KB
run.py 2KB
eval
__init__.py 79B
eval_seq.py 137KB
.gitignore 103B
test.py 4KB
README.md 2KB
result
__init__.py 0B
predict_eval_process.py 4KB
config.py 3KB
共 41 条
- 1
资源评论
妄北y
- 粉丝: 1w+
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功