# KGQA
基于知识图谱的智慧城市主题智能问答系统,包含意图识别与类知识库送入LLM方法
py2neo疑似寄了,封装了一套自己用到的的Neo4j操作
实体识别直接AC自动机暴力,听说有库也懒得调了,直接和gpt一起手搓几十行解决,最后还要去掉名称有包含关系的实体,也是二重循环暴力了。也可以用结巴分词后再一一匹配,隔壁wenda的接口用的这个方法
意图识别调用torchtext自带的xmlroberta进行训练,本质文本分类,训练集为自编的智慧城市下的若干公共服务场景的用户问题,对实体和语气词进行预处理,使用EDA_NLP_for_Chinese进行数据增强。自己改了EDA源码,取消了近义词和插入,因为自己造数据集的时候已经搞得差不多了,而且实体预处理后的占位单词不能转变为近义词
LLM使用RWKV,借鉴了wenda的prompt,对用户问题中找到的所有实体,查询其在知识图谱中的所有相关知识送入LLM prompt中,让LLM自己提取。在这种已知图谱形状,自己做了知识翻译的情况下,使用3B小模型跑fp16i8,就能达到很好的效果
RWKV用的API见我的另一仓库,知识图谱调用的wenda接口同样上传
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
知识图谱是一种结构化的知识表达形式,它以图形的方式组织和存储了大量实体(如人、地点、事件等)及其相互关系。在知识图谱中,实体作为节点,实体之间的各种语义关联则通过边进行连接,形成了一个庞大的数据网络。 知识图谱的核心价值在于其能够精确、直观地表示复杂世界中的知识,并支持高效的知识查询与推理。例如,在搜索引擎中,知识图谱可以提升搜索结果的相关性和准确性,为用户提供直接的答案而非仅仅是网页链接。同时,知识图谱还能支撑高级的人工智能应用,比如问答系统、推荐系统、决策支持等领域。 构建知识图谱的过程通常包括数据抽取、知识融合、实体识别、关系抽取等多个步骤,涉及到自然语言处理、机器学习、数据库技术等多种技术手段。知识图谱的不断完善有助于实现从海量信息中挖掘深层次、有价值的知识,从而推动人工智能向着更加理解人类世界的智慧方向发展。 总之,知识图谱是一个大规模、多领域、多源异构知识集成的载体,是实现智能化信息系统的基础工具和关键基础设施,对于提升信息检索质量、推动智能应用研发具有重要作用。
资源推荐
资源详情
资源评论
收起资源包目录
基于知识图谱的智能问答系统,包含意图识别与类知识库送入LLM方法.zip (28个子文件)
SJT-code
知识图谱数据
region.csv 133B
state.csv 15B
site.csv 766B
city.csv 64B
locale.csv 174B
belong.csv 889B
country.csv 12B
rwkv.py 715B
intent
data
data.csv 10KB
train.csv 766KB
test.csv 1KB
predict.py 1KB
myeda.py 8KB
train_cloud.ipynb 8KB
data.csv 12KB
data.ipynb 2KB
train.csv 862KB
stopwords
cn_stopwords.txt 5KB
scu_stopwords.txt 7KB
hit_stopwords.txt 5KB
baidu_stopwords.txt 9KB
test.csv 1KB
main.py 18KB
data.py 2KB
neo4jDriver.py 6KB
config.json 235B
README.md 1KB
AC.py 2KB
共 28 条
- 1
资源评论
JJJ69
- 粉丝: 6212
- 资源: 5783
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功