# EventTriplesExtraction
EventTriplesExtraction based on dependency parser and semantic role labeling, 基于依存句法与语义角色标注的事件三元组抽取
文本表示一直是个重要问题,如何以清晰,简介的方式对一个文本信息进行有效表示是个长远的任务
我尝试过使用关键词,实体之间的关联关系,并使用textgrapher的方式进行展示,但以词作为文本信息单元表示这种效果不是特别好,所以,本项目想尝试从事件三元组的方式出发,对文本进行表示.
# 使用方式
from triples_extraction import *
extractor = TripleExtractor()
svos = extractor.triples_main(content)
print('svos', svos)
# 测试样例
content = '李克强总理今天来我家了,我感到非常荣幸'
svos = [
['李克强总理', '来', '我家'],
['我', '感到', '荣幸']
]
content = ''' 以色列国防军20日对加沙地带实施轰炸,造成3名巴勒斯坦武装人员死亡。此外,巴勒斯坦人与以色列士兵当天在加沙地带与以交界地区发生冲突,一名巴勒斯坦人被打死。当天的冲突还造成210名巴勒斯坦人受伤。
当天,数千名巴勒斯坦人在加沙地带边境地区继续“回归大游行”抗议活动。部分示威者燃烧轮胎,并向以军投掷石块、燃烧瓶等,驻守边境的以军士兵向示威人群发射催泪瓦斯并开枪射击。'''
svos = [
['以色列国防军', '实施', '轰炸'],
['冲突', '发生', '巴勒斯坦人与以色列士兵'],
['当天冲突', '造成', '受伤'],
['数千名巴勒斯坦人', '继续', '回归大游行抗议活动'],
['部分示威者', '投掷', '石块'],
['驻守边境以军士兵', '发射', '催泪瓦斯']
]
If any question about the project or me ,see https://liuhuanyong.github.io/
如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作,可联系我:
1、我的github项目介绍:https://liuhuanyong.github.io
2、我的csdn博客:https://blog.csdn.net/lhy2014
3、about me:刘焕勇,中国科学院软件研究所,lhy_in_blcu@126.com
没有合适的资源?快使用搜索试试~ 我知道了~
(源码)基于Python的海洋新闻知识图谱构建系统.zip
共67个文件
py:46个
pyc:12个
md:2个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 75 浏览量
2024-11-16
10:16:17
上传
评论
收藏 990KB ZIP 举报
温馨提示
# 基于Python的海洋新闻知识图谱构建系统 ## 项目简介 本项目是一个基于Python的海洋新闻知识图谱构建系统,旨在从海洋新闻网站中爬取新闻数据,提取新闻中的实体关系三元组,并将这些信息存储到数据库中,最终构建出海洋新闻领域的知识图谱。系统主要使用了Python的requests库进行网页请求,lxml库进行HTML解析,pyltp库进行中文自然语言处理,py2neo库进行Neo4j图数据库操作等。 ## 项目的主要特性和功能 1. 新闻爬虫模块能够自动从海洋新闻网站爬取新闻数据,包括新闻标题、日期、来源、摘要和正文等信息。 2. 实体关系提取模块利用自然语言处理工具LTP提取新闻中的实体关系三元组,如人名、地名等实体及它们之间的关系。 3. 数据库操作模块与MySQL和Neo4j数据库进行交互,将提取的实体关系数据存储在数据库中。 4. 知识图谱构建模块基于Neo4j图数据库,将实体关系数据转化为知识图谱,实现实体关系的可视化展示。
资源推荐
资源详情
资源评论
收起资源包目录
(源码)基于Python的海洋新闻知识图谱构建系统.zip (67个子文件)
database_crawler_total.py 5KB
database_interface.py 8KB
crawler_total_v1.py 10KB
crawler_total_v2_backup.py 10KB
Knowledge_map_v2_backup.py 2KB
crawler_total_v3.py 10KB
lexicon_backup
lexicon_label 71B
lexicon 27B
lexicon_1 31B
lexicon_label_1 104B
creat_triple_table_v2_backup.py 4KB
Main.py 4KB
Knowledge_map_v2.py 1KB
neo4j_interface.py 11KB
crawler_total_v2.py 10KB
crawler
__init__.py 368B
crawler_total_v3.py 8KB
database_test_total.py 10KB
sea_crawler_culture.py 3KB
crawler_total.py 7KB
sea_crawler_mil.py 6KB
sea_crawler_trave.py 4KB
crawler_total_v2.py 7KB
sea_add_news.py 2KB
sea_crawler_cbhg.py 6KB
sea_crawler_domestic.py 4KB
sea_crawler_edu.py 6KB
sea_crawler_economics.py 4KB
__pycache__
database_test_total.cpython-35.pyc 9KB
__init__.cpython-35.pyc 128B
sea_crawler_international.py 4KB
sea_crawler_tech.py 10KB
各个类型的记录.png 890KB
creat_triple_table_v2.py 4KB
__pycache__
neo4j_interface.cpython-35.pyc 6KB
pig_test.cpython-35.pyc 2KB
database_crawler_total.cpython-35.pyc 4KB
creat_triple_table_v2_backup.cpython-35.pyc 2KB
crawler_total_v2_backup.cpython-35.pyc 5KB
database_interface.cpython-35.pyc 6KB
README.md 2KB
miscellaneous
__init__.py 384B
database_test.py 7KB
test_todayhot.py 2KB
neo4j_interface.py 4KB
neo4j_test_2.py 2KB
Knowledge_map.py 5KB
pig_test.py 5KB
creat_triple_table.py 4KB
record.txt 0B
re01.py 2KB
ltp_test.py 2KB
useless.py 2KB
extracting_test_调试.py 2KB
extracting_test.py 2KB
neo4j_test.py 4KB
test.py 2KB
tld.py 1KB
EventTriplesExtraction
__init__.py 436B
triple_extraction.py 17KB
sentence_parser.py 7KB
.gitignore 11B
__pycache__
triple_extraction.cpython-35.pyc 13KB
sentence_parser.cpython-35.pyc 5KB
__init__.cpython-35.pyc 143B
sentence_parser.cpython-36.pyc 3KB
README.md 2KB
共 67 条
- 1
资源评论
t0_54coder
- 粉丝: 3055
- 资源: 5640
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于javaweb的小说网站系统毕业论文.doc
- 这款创意新年贺卡设计适合送给亲友,包含多种风格,用户可以根据需要进行修改和打印 新春大屏祝福的效果 这个示例使用了HTML和CSS来创建一个全屏的祝福页面,您可以根据需要进行修改和扩展
- 基于java的酒店管理系统.doc
- 截图,代码 ,生成库文件等等 ppp
- 基于事件的网络舆情分析系统源码+项目说明(高分项目)
- 基于web的企业人事信息管理论文.doc
- MFC多工具栏如何保存状态(续)
- Python基于事件的网络舆情分析系统源码+项目说明(高分项目)
- 基于SSH网上体育用品销售系统开发与设计毕业设计论文.doc
- 基于JAVA的文章发布系统的设计与实现论文.doc
- 【vue框架开发】html中实现vue响应式表单组件
- 基于ssh校园门户网站毕业论文.doc
- 线性调频脉冲回波信号的仿真matlab
- 高校社团管理系统基于Java技术的设计与实现
- JavaScript常见函数
- 酒装箱输送线 sw18全套技术开发资料100%好用.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功