【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 2019百度语言与智能技术竞赛信息抽取赛参赛源码+学习说明(第5名).zip Environment: ----- python 3+ tensorflow 1.10+ keras 2.2.4+ Install ----- 我们将所使用的依赖环境已打包为 requirements.txt keras-bert from here https://github.com/CyberZHG/keras-bert ```python pip install keras-bert conda install --yes --file requirements.txt ``` Datas ---- 请将以下文件放入对应文件夹<br> 1, ./inputs (原始数据存放路径) <br> 应包含以下文件: train_data.json, dev_data.json, all_50_chemas, test_data_postag.json<br> 2, ./bert (存放预训练模型权重路径) 应包含一下文件:<br> ./bert/chinese_L-12_H-768_A-12/bert_config.json;<br> ./bert/chinese_L-12_H-768_A-12/bert_model.ckpt;<br> ./bert/chinese_L-12_H-768_A-12/vocab.txt<br> 以下是预训练权重下载地址<br> chinese_L-12_H-768_A-12 :https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip Usage ----- run ``` python main.py gpu_num1 gpu_num2 gpu_num3 gpu_num4 gpu_num5``` <br> The test datasets predictions will be saved into a file called ```final_data.json ```in the``` outputs```, and the models be trained will be saved into ```ensemble_part_x.weights``` in the ```models```. We used multiple GPUs for training and prediction, so we also specified multiple GPUS for training and forecasting in this program. baseline: https://github.com/bojone/kg-2019-baseline ---- 我们在苏神baseline上的工作:<br> 1, BERT<br> 2,优化了标注方式,针对重叠关系的重新设定了多信息的标注方式<br> 3,简化了下游模型结构,尝试了self-attention和普通点乘attention<br> 4,投票方式简单集成<br> 5,规则数据后处理和预处理。<br> 参考文献: Global Normalization of Convolutional Neural Networks for Joint Entity and Relation Classification<br> One for All Neural Joint Modeling of Entities and Even<br> Table filling multi-task recurrent neural network for joint entity and relation extraction<br> Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme<br> End-to-End Neural Relation Extraction with Global Optimization<br> 结果 --- A榜:0.889, B榜:0.8872 , 最终B榜第五(原本第六,第四名放弃)。<br>
- 1
- 粉丝: 1827
- 资源: 5646
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 各省-恩格尔系数、泰尔指数(2000-2022年).zip
- labview双按钮和三按钮计时对话框
- Dev-C++ 软件安装教程
- 理光Ricoh MP C4504打印机驱动下载
- 编译器KEIL5-STM32-KEIL5护眼模式(绿豆沙色)global.prop
- lenovo-SR650-BIOS 4.11-BMC 9.80
- 智慧医院综合管理解决方案(医院综合监控中心).docx
- Python编程入门指南:背景知识与环境搭建
- 毕业设计《Python基于Opencv和SVM机器学习算法和百度AI平台车牌识别系统》+项目源码+文档说明+演示视频
- 基于 Vue 和 SpringBoot 的大病保险管理系统源代码+数据库+文档,模拟了就医和医保报销的过程