# PoetryQA
结合知识图谱(Knowledge Graph)做的有关诗词的问答demo 数据库用的neo4j
文件夹poetyData下已存储按描写内容爬取的诗词
## 环境依赖
1.python3
2.neo4j==3.5.5
3.lxml(若不需要自行爬取诗词可省略)
4.jieba
5.py2neo
## 项目运行
1.首先运行neo4j:neo4j.bat console
2.将build_kg.py中第10行的neo4j密码修改为`自己的`,然后python build_kg.py
3.观察database中是否成功导入节点及关系:浏览器打开 http://localhost:7474/
4.修改answer_question.py中第8行的neo4j密码,然后python main.py
5.`[optional]`自行爬取诗词,代码见[Spider_poetry.py](https://github.com/JaniceWuo/PoetryQA/blob/master/Spider_poetry.py),详细介绍见[【爬虫练手小demo】爬取古诗词](https://blog.csdn.net/qq_25590283/article/details/104632222)
## 运行效果图
![](https://github.com/JaniceWuo/PoetryQA/blob/master/img/1.JPG)
## 诗词知识图谱
`HAS_POETRY`关系:
<div align=center><img width="800" height="650" src="https://github.com/JaniceWuo/PoetryQA/blob/master/img/kg_poetry.JPG"/></div>
## 详细介绍
1.此项目是本人学习知识图谱问答过程中做的小demo,顺便练习一下爬虫
2.目前已有功能有:查询某一作者有哪些作品/诗;查询某一首诗的内容/描写什么(描写山、雨、爱情等等)
查询作者的朝代;查询诗的作者
3.项目不足:问句的特征提取采取的是模板匹配式的,所以当用户改变另一种说法问时,可能答不上来。
目前回答完全是套用的模板。所以当数据集更大时,应该用seq2seq去训练数据以丰富答案。
可以考虑更加细致化的划分古诗词,例如按七言律诗、五言绝句等。
## 学习资料补充
[neo4j windows下安装](https://www.cnblogs.com/ljhdo/archive/2017/05/19/5521577.html)
[创建、查询neo4j节点](https://www.cnblogs.com/ljhdo/p/5516793.html)
[Python爬虫利器三之Xpath语法与lxml库的用法](https://cuiqingcai.com/2621.html)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
知识图谱是一种结构化的知识表达形式,它以图形的方式组织和存储了大量实体(如人、地点、事件等)及其相互关系。在知识图谱中,实体作为节点,实体之间的各种语义关联则通过边进行连接,形成了一个庞大的数据网络。 知识图谱的核心价值在于其能够精确、直观地表示复杂世界中的知识,并支持高效的知识查询与推理。例如,在搜索引擎中,知识图谱可以提升搜索结果的相关性和准确性,为用户提供直接的答案而非仅仅是网页链接。同时,知识图谱还能支撑高级的人工智能应用,比如问答系统、推荐系统、决策支持等领域。 构建知识图谱的过程通常包括数据抽取、知识融合、实体识别、关系抽取等多个步骤,涉及到自然语言处理、机器学习、数据库技术等多种技术手段。知识图谱的不断完善有助于实现从海量信息中挖掘深层次、有价值的知识,从而推动人工智能向着更加理解人类世界的智慧方向发展。 总之,知识图谱是一个大规模、多领域、多源异构知识集成的载体,是实现智能化信息系统的基础工具和关键基础设施,对于提升信息检索质量、推动智能应用研发具有重要作用。
资源推荐
资源详情
资源评论
收起资源包目录
结合知识图谱做的有关诗词的问答demo.zip (32个子文件)
SJT-code
Spider_poetry.py 2KB
build_kg.py 4KB
main.py 602B
poetryData
hua.csv 56KB
chuntian.csv 108KB
poetry.txt 40KB
xue.csv 22KB
tag.txt 65B
qiutian.csv 88KB
dongtian.csv 17KB
allPoetry.csv 622KB
yu.csv 28KB
author.txt 5KB
aiguo.csv 108KB
feng.csv 10KB
shan.csv 25KB
dynasty.txt 103B
shui.csv 17KB
aiqing.csv 127KB
xiatian.csv 16KB
stop_words.utf8 9KB
vocab.txt 9KB
answer_question.py 3KB
img
kg_tag.JPG 106KB
kg_dynasty.JPG 63KB
1.JPG 102KB
kg_poetry.JPG 80KB
2.JPG 179KB
question_classifier.py 5KB
__pycache__
answer_question.cpython-35.pyc 3KB
question_classifier.cpython-35.pyc 4KB
README.md 2KB
共 32 条
- 1
资源评论
JJJ69
- 粉丝: 6366
- 资源: 5917
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 企业文化的三层结构.docx
- 企业文化概念的探讨.docx
- 企业文化就是一言一行.docx
- 企业文化与东西方文化传统.docx
- 基于java的网上教学辅助系统的设计与实现论文.doc
- Be Like a Goldfish, Don't Memorize! Mitigating Memorization in Generative LLMs
- 从《士兵突击》学管理之企业文化.doc
- 论企业文化和企业制度.doc
- 浅论人力资源管理与企业文化的关系.doc
- 王伟论企业文化.doc
- 传统文化与企业家精神.docx
- 陈亮:企业文化建设的核心是认同.docx
- 传承与发展——企业家与企业文化之辩证关系.docx
- 董明珠:用企业文化留住人.docx
- 李东生首谈企业文化 TCL管理方式正在变革.docx
- 蒋锡培:社会公益需要构建慈善的企业文化.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功