# KGData
各个行业知识图谱分享,关系抽取,数据清洗,提供 neo4j 批量导入格式,图片不出来的看这里:https://www.jianshu.com/p/25e5e07b2464
__Menu__
| Topic | Description | status |
| :--------------------------------------- | :--------------------------------------- | --------------------------------------- |
| <a href="#百科数据">百科通用数据</a> | 百科通用数据 | 已完成,部分公开 |
| <a href="#医疗数据">医疗数据</a> | 疾病,症状,科室,用药等 | 已完成 |
| <a href="#垃圾分类">垃圾分类</a> | 上海垃圾分类数据 | 已完成,完全公开 |
| <a href="#汽车配件-车灯">汽车配件-车灯</a> | 各种型号各种年份汽车对应的各类车灯,安装方式 | 已完成 |
| <a href="#新冠疫情">新冠疫情</a> | 新冠疫情公开的行为轨迹,可供做知识推理【公益免费】 | V1.0完成 |
| <a href="#保险产品">保险产品</a> | 保险产品知识图谱,全网最全,种类超2.7w | 完成 |
| <a href="#产业链">产业链</a> | 行业,公司,产品,上下游 | 完成 |
| <a href="#">打井</a> | 打井知识图谱 | 已完成 |
| <a href="#">教育学-大学专业设置</a> | 教育学-大学专业设置 | 已完成 |
| <a href="#">高考</a> | 学校,专业,分数线等 | 已完成 |
| <a href="#">投资决策</a> | 创始人,企业,财务等 | 已完成 |
| <a href="#">行业专家圈子</a> | 实验室,论文等 | 已完成 |
# 《百科数据》
中文知识图谱,4000w实体,一亿关系,这是我精心整理、清洗、去重后的数据,数据格式已经处理,可用 neo4j-admin 直接导入,所有数据来源都是公开的百科或新闻数据。
由于 github文件大小限制,以下给出了部分数据,并附上了使用步骤,适合研究生交作业用,接受定制服务
## 使用步骤
### 1.首先你要自行安装 neo4j 下载地址:https://neo4j.com/download/
### 2.由于本方式是覆盖导入,建议创建一个全新的知识图谱库
### 3.解压后将两个文件放入 import 目录
### 4.在命令行执行导入语句
```
bin/neo4j-admin import --id-type=STRING --multiline-fields=true \
--nodes "import/entity10.csv" \
--relationships "import/relationship10.csv" \
```
tips:
#### 1.windows下请去掉命令中的换行符
#### 2.windows下如果提示路径不对,可以将文件路径替换为完整路径
导入成功显示如下:
```
IMPORT DONE in 3s 337ms.
Imported:
100000 nodes
88362 relationships
288361 properties
Peak memory usage: 1.03 GB
```
### 5.启动 neo4j,查看导入的数据
`MATCH (ee:my_entity) WHERE ee.name = "文天祥" RETURN ee;
`
点击展开子节点,返回效果如下
![image](https://github.com/chriswangweb/KGData/blob/master/img/1578500414912.jpg)
# 《医疗数据》
## V3.5以上版本导入方法:
### 1.stop要操作的库
### 2.操作库 manager-》open terminal
### 3.执行命令 bin/neo4j-admin load --from=/path/to/file/2020-03-241.dump --database=graph.db --force
## 旧的导入方法:
### 1.创建一个新的图谱(注意不要启动)
### 2.下载数据
例如:链接:https://pan.baidu.com/s/1kMynr6lu13wyqTag7xUlpQ
### 3.将数据解压到 data/databases 下
### 4.启动服务
### 5.查看效果
![image](https://github.com/chriswangweb/KGData/blob/master/img/6.gif)
### 6.微信小程序(微信搜索:小橙机器人)
![image](https://github.com/chriswangweb/KGData/blob/master/img/xiaocheng.gif)
#### 本图谱+NLU+DM+GPT-3
#### 扫码体验
![image](https://github.com/chriswangweb/KGData/blob/master/img/wechatBot.jpeg)
# 《垃圾分类》
### 1.使用方式同医疗数据
### 2.数据地址:https://github.com/chriswangweb/KGData/blob/master/%E5%9E%83%E5%9C%BE%E5%88%86%E7%B1%BB/graph.db.zip
### 3.效果
![image](https://github.com/chriswangweb/KGData/blob/master/img/7.gif)
### 4.落地效果
https://www.bilibili.com/video/BV1BM4y117q8/
#### 硬件列表
树莓派4B,舵机*4,PCA9685舵机驱动板*1,垃圾桶模型,摄像头,5块钱的音箱
![image](https://github.com/chriswangweb/KGData/blob/master/img/servo_motion.gif)
![image](https://github.com/chriswangweb/KGData/blob/master/img/PCA9685.png)
#### 架构图
![image](https://github.com/chriswangweb/KGData/blob/master/img/laji.png)
# 新冠疫情
### 这个研究没用,以后不再更新
### 全网首份包含患者出行轨迹的知识图谱,换了超过 10 个数据源,目前的数据源算是最好的,但是还是包含较多的脏数据,后续会整理个精准度更高的版本
### 整理步骤如下:
| Topic | Description |
| :--------------------------------------- | :--------------------------------------- |
| 病人基本信息 | ok |
| 关联病人 | - |
| 发病 | - |
| 确诊 | ok |
| 离鄂 | - |
| 出行信息 | ok |
| 活动 | ok |
### 1.使用方式同医疗数据
### 2.数据地址:https://github.com/chriswangweb/KGData/blob/master/ncov/graph.db.zip
网络不好的可以使用网盘地址
链接:https://pan.baidu.com/s/12-fLMV4jEc7BRXj4dUKQGg 密码:b08l
### 3.效果
![image](https://github.com/chriswangweb/KGData/blob/master/img/8.gif)
# 汽车配件-车灯
## 哪个男人会不爱车
### 1.使用方式同医疗数据
### 2.数据地址
### 3.效果
![image](https://github.com/chriswangweb/KGData/blob/master/img/9.gif)
# 保险产品
## 全网最全,种类超2.7w
- 公司名称
- 产品名称
- 产品类别
- 设计类型
- 产品特殊属性
- 承保方式
- 保险期间类型
- 产品交费方式
- 产品条款文字编码
- 产品销售状态
- 停止销售日期
### 1.使用方式同医疗数据
### 2.数据地址:链接: https://pan.baidu.com/s/1ItgHr_YmT1iNsWbdZ4FF8g 密码: <font color=#fff size=2>fh86</font> 闲鱼搜索鱼塘:知识图谱
### 3.效果
![image](https://github.com/chriswangweb/KGData/blob/master/img/10.gif)
![image](https://github.com/chriswangweb/KGData/blob/master/img/10.png)
# 工业产业链
## 工业产品分类,公司,产品,上下游(上下游数据对齐目前不足)
### 1.使用方式
```
LOAD CSV FROM 'file:///product.csv' AS line merge (:Product { id:line[0],name: line[1]})
LOAD CSV FROM "file:///product.csv" AS line match (from:Product{name:line[1]}),(to:Product{name:line[4]}) merge (from)-[r:Parent{level:line[3]}]->(to)
```
### 2.数据地址 https://github.com/chriswangweb/KGData/blob/master/%E4%BA%A7%E4%B8%9A%E9%93%BE/product.csv
### 3.效果
![image](https://github.com/chriswangweb/KGData/blob/master/img/product.png)
![image](https://github.com/chriswangweb/KGData/blob/master/img/product1.png)
# 联系作者
#### 作者微信:AI-decoder
# 搞得不赖,赏
![image](https://github.com/chriswangweb/KGData/blob/master/img/img321.png)
土豆片片
- 粉丝: 1852
- 资源: 5869
最新资源
- 《济南的冬天》教学设计与反思.docx
- 基于java+springboot+vue+mysql的古典舞在线交流平台 源码+数据库+论文(高分毕业设计).zip
- 形状检测32-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma数据集合集.rar
- 百度智能云千帆大模型平台推进企业多模态生成式AI应用
- 互联网金融发展指数 (第二期,2014年1月-2015年12月).zip
- 社区团购网站:技术驱动下的电子商务新模式
- 2025年人形机器人产业发展蓝皮书-量产及商业化关键挑战
- C# 面试题 100 问:从基础到进阶,全面解析与实战.docx
- 基于java+springboot+vue+mysql的读书笔记共享平台 源码+数据库+论文(高分毕业设计).zip
- Python+Django+Mysql个性化图书推荐系统 图书在线推荐系统 基于用户、项目、内容的协同过滤推荐算法 帮远程安装部署 一、项目简介 1、开发工具和实现技术 Python3.8,Djan
- 基于Java的环境保护与宣传网站的设计与实现毕业论文.doc
- 基于java+springboot+vue+mysql的海滨体育馆管理系统 源码+数据库+论文(高分毕业设计).zip
- 2025年 UiPath AI和自动化趋势:代理型AI的崛起及企业影响
- 基于java+springboot+vue+mysql的网上超市系统 源码+数据库+论文(高分毕业设计).zip
- 电力系统静态稳定性仿真simulink仿真 用simulink搭建搭建单机无穷大系统,对其静态稳定性进行仿真分析
- 柑橘多种疾病类型图像分类数据集【已标注,约1,000张数据】
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈