课程大作业基于bert4keras开放领域的关系抽取python源码+部署说明.zip
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
【资源说明】 课程大作业基于bert4keras开放领域的关系抽取python源码+部署说明.zip 1、该资源内项目代码都是经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能。 欢迎下载,欢迎交流,互相学习进步! 本项目是利用深度学习技术进行开放领域的关系抽取,算法模型可以处理多个三元组。 开放领域关系抽取是从文本中抽取三元组,不同于限定域的关系抽取,开放关系抽取并不限制关系的种类和数量,即所识别的关系(relation)在文本中体现。于是将("n", 标签)组合成一个大类,然后可以将开放关系抽取转化为一个NER问题,其中n对应的是文本中三元组的数量。对于NER任务,我们采用[GPLinker模型](https://kexue.fm/archives/8926),相应代码在openRE_train_v2中。 所需环境 Python==3.6 tensorflow==1.14.0 keras==2.3.1 bert4keras==0.10.9 项目目录 ├── bert4keras ├── data 存放数据 ├── pretrained_model 存放预训练模型 ├── extract_chinese_and_punct.py ├── openRE_train.py 训练代码 ├── openRE_train_v2.py 训练代码v2 ├── openRE_predict.py 评估和测试代码 数据集 采用[COER语料库],对原始数据进行了筛选,处理好的数据存放在data/CORE文件夹下。 ``` "text": "巴基斯坦国家灾害管理局局长法鲁克、巴内阁事务部长穆罕默德", "sro_list": [{"subject": "巴", "relation": "内阁事务部长", "object": "穆罕默德"}, {"subject": "巴基斯坦国家灾害管理局", "relation": "局长", "object": "法鲁克"}] ``` 三元组中的实体和关系均出现在文本中。 训练集和验证集中的每个句子都有n个三元组(2=<n<=4),数据统计情况: | 数据集 | 2个 | 3个 | 4个 | | :------:| :------: | :------: | :------: | | train | 8858 | 767 | 264 | | dev | 2238 | 177 | 58 | 使用说明 1.[下载预训练语言模型] 可采用BERT-Base, Chinese等模型 2.构建数据集(数据集已处理好) train.json和dev.json 3.训练模型 ``` python openRE_train.py ``` 4.评估和测试 ``` python openRE_predict.py ``` 结果 | 数据集 | f1 | precision | recall | | :------:| :------: | :------: | :------: | | train | 0.92781 | 0.92947 | 0.92616 | | dev | 0.62125 | 0.61854 | 0.62397 | | dev(v2) | 0.76922 | 0.80624 | 0.73545 |
- 1
- 一帆风顺7122024-04-26资源不错,内容挺好的,有一定的使用价值,值得借鉴,感谢分享。
- 粉丝: 5638
- 资源: 3568
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助