# 方法说明
该代码方法用到了开源工具Hanlp,和官方的预训练模型bert-base-chinese。
项目目录结构如下:
![](images/d1.PNG)
其中expirement_attr、expirement_er和expirement_re三个文件夹下分别是做评测过程中进行的一些相关实验,data文件夹下存放的评测数据。
## 1.实体抽取方法
通过Hanlp实体识别工具,抽取“人物”和“机构”两种类型的实体。
通过规则,抽取“研报“,“文章“,“风险“,“ 机构“四种类型的实体。
除了规则匹配外,还可以采用远程监督的方法,主要用于抽取研报中的实体,具体流程如下图所示:
![](images/d2.PNG)
1.使用规则和外部工具抽取一部分实体
2.将原始数据平均分成两半,一半用于训练,一半用于测试,对用于训练的一半数据使用远程监督进行标注
3.采用将远程监督方法标注的数据按4:1划分,分别作为训练和验证集,训练模型
4.使用上一步训练出的模型在测试集上进行预测,抽取出一部分实体
5.查看是否达到中止循环的条件,达到条件后中止
6.通过规则匹配的方法筛选掉一些实体,剩下的实体加入种子知识图谱,然后从第2步开始,重复上一次训练,迭代进行实体抽取
## 2.属性抽取方法
使用规则匹配的抽取方法
## 3.关系抽取方法
使用规则匹配的抽取方法
# 程序运行说明
需要先安装python3.7和pytorch1.3
然后需要使用以下命令安装相关依赖库:
```
pip install jieba
pip install hanlp
pip install pytorch_pretrained_bert
```
使用如下命令启动程序:
```
python main.py
```
最终结果存放在
output文件夹下,名称为answers.json
JJJ69
- 粉丝: 6371
- 资源: 5917
最新资源
- 《基于使用 Java、Spring、SpringBoot、MySQL 和 Hibernate 的在线购物应用程序》(毕业设计,源码,部署教程)在本地部署即可运行。功能完善、界面美观、操作简单,具有高实
- 《一个基于 Spring Boot + Angular 的库存管理系统项目》(毕业设计,源码,部署教程)在本地部署即可运行。功能完善、界面美观、操作简单,具有高实用价值,适合毕设或课程设计.zip
- 《使用 JasperReports 和 Spring Boot 的简单 PDF 文档生成器项目》(毕业设计,源码,部署教程)在本地部署即可运行。功能完善、操作简单
- _基于电容耦合式非接触电导检测的气液两相流参数测量新方法研究.caj
- _基于多电极电容传感器的低温两相流反演理论和实验研究.caj
- _基于空隙率的油气两相流流量测量的研究.pdf
- _利用电容层析成像技术快速测量油气两相流空隙率的研究.pdf
- _基于非接触电阻抗测量的气液两相流参数检测新方法研究.caj
- Python 结合 MySQL 实现基础数据库操作与配置指南
- _基于电容层析成像和模糊模式识别的油气两相流流型辨识新方法的研究.pdf
- _气液两相流参数检测新方法研究.caj
- 航空发动机回油管路油气两相流空隙率测量方法和装置-专利.pdf
- _油气两相流空隙率测量研究.caj
- _电容层析成像的图像重建及流型辨识研究.caj
- _电容层析成像图像重建算法及流型辨识研究.caj
- _电容层析成像系统流型特征提取与图像重建.caj
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈