# 复现指南
先安装ElasticSearch,我用的版本是7.6.2
`pip install -r requirements.txt`
## 推理复现
`python KnowledgeSelection/insert_data_to_es.py` 将知识库载入ES
`python KnowledgeSelection/inference.py` 运行知识抽取代码
`python Generation/mt5.py` 运行生成代码
`python get_submit_file.py` 后处理,得到的 `result.json` 文件即为最终预测结果
## 训练复现
`python KnowledgeSelection/NameEntityClassification/preprocess.py` 预处理数据
`python KnowledgeSelection/IntentExtraction/preprocess.py` 预处理数据
`python Generation/preprocess.py` 预处理数据
`python KnowledgeSelection/insert_data_to_es.py` 将知识库载入ES
`python Generation/mt5_train.py` 训练生成模型
`python KnowledgeSelection/NameEntityRecognition/main.py` 训练实体识别模型
`python KnowledgeSelection/IntentExtraction/mine_full.py` 训练意图识别模型
`python KnowledgeSelection/NameEntityClassification/mine.py` 训练实体精排模型
后续过程同推理复现
# 算法实现说明
1. 使用ES和命名实体识别模型(基于BERT)进行实体召回。
2. 使用基于BERT的实体精排模型对候选实体进行打分,选出得分最高的作为预测实体。
3. 使用基于BERT的分类模型对预测实体的三元组(意图)进行识别。
4. 基于预测的三元组,利用mT5模型进行回复生成。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
知识图谱是一种结构化的知识表达形式,它以图形的方式组织和存储了大量实体(如人、地点、事件等)及其相互关系。在知识图谱中,实体作为节点,实体之间的各种语义关联则通过边进行连接,形成了一个庞大的数据网络。 知识图谱的核心价值在于其能够精确、直观地表示复杂世界中的知识,并支持高效的知识查询与推理。例如,在搜索引擎中,知识图谱可以提升搜索结果的相关性和准确性,为用户提供直接的答案而非仅仅是网页链接。同时,知识图谱还能支撑高级的人工智能应用,比如问答系统、推荐系统、决策支持等领域。 构建知识图谱的过程通常包括数据抽取、知识融合、实体识别、关系抽取等多个步骤,涉及到自然语言处理、机器学习、数据库技术等多种技术手段。知识图谱的不断完善有助于实现从海量信息中挖掘深层次、有价值的知识,从而推动人工智能向着更加理解人类世界的智慧方向发展。 总之,知识图谱是一个大规模、多领域、多源异构知识集成的载体,是实现智能化信息系统的基础工具和关键基础设施,对于提升信息检索质量、推动智能应用研发具有重要作用。
资源推荐
资源详情
资源评论
收起资源包目录
华为DIGIX2022 基于知识图谱的对话系统.zip (55个子文件)
SJT-code
clean_data.py 2KB
data
valid.json 4.51MB
test.json 225KB
train.json 17.19MB
kg.json 30.18MB
docker运行说明.txt 544B
Generation
preprocess.py 2KB
mt5_train.py 13KB
mt5.py 13KB
data
train.json 49.36MB
val.json 12.65MB
requirements.txt 77B
1.881.json 182KB
get_submit_file.py 4KB
KnowledgeSelection
inference_1.695.py 15KB
inference_1.770.py 16KB
inference_1.881.py 22KB
inference_1.765.py 17KB
insert_data_to_es.py 3KB
inference_1.809.py 18KB
inference_1.862.py 21KB
data
tag.txt 16B
classification_train.json 21.93MB
extractor_train.json 19.95MB
ner_valid.json 1.01MB
extractor_valid.json 4.89MB
classification_valid.json 5.34MB
ner_train.json 3.92MB
inference_1.690.py 17KB
inference_fold_1.667.py 15KB
inference.py 24KB
inference_1.762.py 16KB
inference_1.752.py 16KB
inference_1.743.py 16KB
NameEntityClassification
preprocess.py 3KB
new_mine.py 11KB
mine.py 11KB
new_preprocess.py 4KB
es.py 794B
inference_1.600.py 13KB
inference_1.673.py 12KB
NameEntityRecognition
preprocess.py 2KB
main.py 7KB
ner_infere.py 2KB
ner_metrics.py 3KB
ner_model.py 2KB
ner_dataset.py 2KB
IntentExtraction
preprocess.py 2KB
mine.py 15KB
mine_full.py 16KB
inference_1.715.py 15KB
es.py 2KB
README.md 1KB
generation_result.txt 25KB
cal_max_len.py 4KB
共 55 条
- 1
资源评论
JJJ69
- 粉丝: 6365
- 资源: 5917
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功