没有合适的资源?快使用搜索试试~ 我知道了~
多源异构数据的大规模地理知识图谱构建1
需积分: 0 1 下载量 102 浏览量
2022-08-04
12:37:08
上传
评论
收藏 2.51MB PDF 举报
温馨提示
试读
11页
摘要:虚拟地理环境作为新一代的地理语言,需要通过对多源异构时空数据的分析与挖掘,构建虚拟地理环境知识工程,实现“数据—信息—知识—智慧”的转化,促进智能虚拟地理
资源详情
资源评论
资源推荐
第
47
卷
第
8
期
测
绘
学
报
Vol.47
,
No.8
2018
年
8
月
ActaGeodaeticaetCarto
g
ra
p
hicaSinica Au
g
ust
,
2018
引文格式
:
蒋秉川
,
万刚
,
许 剑
,
等
.
多 源 异 构 数 据 的 大 规 模 地 理 知 识 图 谱 构 建
[
J
]
.
测 绘 学 报
,
2018
,
47
(
8
):
1051G1061.DOI
:
10.11947
/
j
.
AGCS.2018.20180113.
JIANG Bin
g
chuan
,
WAN Gan
g
,
XU Jian
,
et al.Geo
g
ra
p
hic Knowled
g
e Gra
p
h Buildin
g
Extractedfrom MultiGsourced
Hetero
g
eneousData
[
J
]
.ActaGeodaeticaetCarto
g
ra
p
hicaSinica
,
2018
,
47
(
8
):
1051G1061.DOI
:
10.11947
/
j
.AGCS.2018.20180113.
多源异构数据的大规模地理知识图谱构建
蒋秉川
1
,
2
,
万
刚
2
,
许
剑
1
,
3
,
4
,
李
锋
2
,
温荟琦
2
1.
地理信息工程国家重点实验室
,
陕西 西 安
710054
;
2.
信息 工 程大 学 地理 空 间信 息 学院
,
河南 郑 州
450001
;
3.
清华大学建筑学院
,
北京
100084
;
4.
西安测绘研究所
,
陕西 西安
710054
Geo
g
ra
p
hicKnowled
g
eGra
p
hBuildin
g
Extractedfrom MultiGsourced
Hetero
g
eneousData
JIANGBin
g
chuan
1
,
2
,
WANGan
g
2
,
XUJian
1
,
3
,
4
,
LIFen
g
2
,
WENHui
q
i
2
1.StateKe
y
Laborator
y
ofGeoGinformationEn
g
ineerin
g
,
Xi
’
an710054
,
China
;
2.InstituteofGeos
p
atialInformation
,
InformationEn
g
ineerin
g
Universit
y
,
Zhen
g
zhou450001
,
China
;
3.SchoolofArchitecture
,
Tsin
g
huaUniversit
y
,
Bei
j
in
g
100084
,
China
;
4.Xi
’
anResearchInstituteofSurve
y
in
g
andMa
pp
in
g
,
Xi
’
an710054
,
China
Abstract
:
Asanew
g
enerationof
g
eo
g
ra
p
hiclan
g
ua
g
e
,
virtual
g
eo
g
ra
p
hicenvironments
(
VGE
)
needsto
constructthevirtual
g
eo
g
ra
p
hicknowled
g
een
g
ineerin
g
throu
g
hthe anal
y
sisandexcavationofmultiG
sourced hetero
g
eneous s
p
atioGtem
p
oral data.Throu
g
h the transformation about
“
dataGinformationG
knowled
g
eGwisdom
”,
itcan
p
romotethera
p
idconversionandinte
g
rationof
g
eo
g
ra
p
hicknowled
g
efor
intelli
g
entVGEs
y
stem
,
whichma
yp
rovideatheoreticalandtechnicalsu
pp
ortforintelli
g
ent
p
rocessin
g
of
g
eo
g
ra
p
hicinformationandintelli
g
entserviceof
g
eo
g
ra
p
hicknowled
g
e.Knowled
g
e
g
ra
p
h
p
la
y
stheroleof
abrid
g
ebetween artificialintelli
g
ence andknowled
g
een
g
ineerin
g
forVGEs
y
stem.This
p
a
p
erfirstl
y
reviewedtheresearchstatusinknowled
g
e
g
ra
p
hand
g
eo
g
ra
p
hicknowled
g
e
g
ra
p
hfromthedomesticand
abroad
p
ers
p
ectives.Then
,
the construction
p
rocess of
g
eo
g
ra
p
hic knowled
g
e
g
ra
p
h is
p
ro
p
osed.
Furthermore
,
theke
y
technolo
g
iesof
g
eo
g
ra
p
hicknowled
g
e
g
ra
p
h are discussedin de
p
th.Finall
y
,
the
a
pp
licationdirectionof
g
eo
g
ra
p
hicknowled
g
e
g
ra
p
hisdiscussedandstated.Thestud
y
of
g
eo
g
ra
p
hic
knowled
g
e
g
ra
p
hinthis
p
a
p
erma
y
hel
p
torealizetheknowled
g
izationof
g
eo
g
ra
p
hicinformationand
p
romotetheintelli
g
entservicelevelforVGEs
y
stem.
Ke
y
words
:
virtual
g
eo
g
ra
p
hic environments
;
g
eo
g
ra
p
hic knowled
g
e
;
knowled
g
e
g
ra
p
h
;
g
eo
g
ra
p
hic
knowled
g
e
g
ra
p
h
Foundationsu
pp
ort
:
TheNationalDefenseScienceandTechnolo
gy
FoundationofChina
(
Nos.3601023
;
3601020
);
TheScienceandTechnolo
gy
Pro
g
ramofHenan
(
No.182102210147
);
TheO
p
enFundofStateKe
y
Laborator
y
ofGeoGinformation En
g
ineerin
g
(
No.SKLGIE2017GMG4G3
);
The FoundationforNew Research
DirectionofPLAInformationEn
g
ineerin
g
Universit
y
(
No.210502020
)
摘
要
:
虚拟地理环境作为新一代的地理语言
,
需要通过对多源异构时空数据的分析与挖掘
,
构建虚拟
地理环境知识工程
,
实现
“
数据
—
信息
—
知识
—
智慧
”
的转化
,
促进智能虚拟地理环境系统中地理知识的
快速转换和融合
,
从而为虚拟地理环境中地理信息的智能化处理
、
地理知识的智慧化服务提供支撑
.
知
识图谱是人工智能与虚拟地理环境知识工程相结合的桥梁
.
本文系统评述了知识图谱
、
地理知识图谱
的研究现状
,
提出了地理知识图谱的构建流程
,
重点研究了地理知识图谱构建的关键技术
,
讨论和阐述
了地理知识图谱的应用方向
.
本文的研究将有助于实现地理信息的知识化
,
提高虚拟地理环境系统的
智能化服务水平
.
关键词
:
虚拟地理环境
;
地理知识
;
知识图谱
;
地理知识图谱
Au
g
ust2018Vol.47No.8AGCS htt
p
:
∥xb.sinoma
p
s.com
中图分类号
:
P208
文献标识码
:
A
文章编号
:
1001G1595
(
2018
)
08G1051G11
基金项目
:
国防科技基金
(
3601023
;
3601020
);
河南省科技攻关计划
(
182102210147
);
地理信息工程国家
重点实验室开放研究基金
(
SKLGIE2017GMG4G3
);
信息工程大学校新兴科研方向培育基金
(
210502020
)
当前地理科 学 数据 丰 富但 知 识匮 乏
,
而智 能
化虚拟地理 环 境 需 要 构 建
VGE
知 识 工 程
[
1
]
,
智
慧城市的 建 设 也 需 要 构 建 地 理 知 识 基 础 设 施
[
2
]
(
g
eo
g
ra
p
hicknowled
g
einfrastructure
),
地 理 信
息服务必须实现从
“
数据
—
信息
—
知识
—
智慧
”
的
智能化转化
,
构建 面向 大 众的 地 理空 间 知识 服 务
体系
[
3G4
]
.
虚拟地理环境 作为 新 一代 的 地理 语 言
,
改 变
了传统的地理科 学 知识 的 表达 与 获取 方 式
,
加速
了地理数据
、
信息到知识的转换
,
是协助人类认识
地 理 世 界 和 解 决 地 理 问 题 的 新 型 地 理 分 析 工
具
[
5G6
]
.
VGE
知识工程是基于知识的智能虚拟地
理环境系统的支撑理论
、
方法和技术体系
,
其关键
问题是地理知识 的 表达 与 建模
、
知识 库 的构 建 和
管理
、
地理知 识 的智 慧 化服 务
[
1
]
.
将 人 工 智 能 与
地理空间信息领 域 相结 合
,
是解 决 虚拟 地 理环 境
智能化的重要手段
.
地理空间知识 的存 储
、
共享 和 分类 是 虚 拟 地
理环境系统通向智能服务的重要知识库支撑
.
在
大数据
、
人工智能等技术的推动下
,
需要利用高性
能计算
、
云计算
、
大数据可视分析
、
知识图谱等技
术体系
,
实现对多源异构时空数据的分析与挖掘
,
从地理数据到地 理 知识 的 转变
,
为虚 拟 地理 环 境
的智能化提供 技 术支 撑
.
在人 工 智能 领 域
,
知识
图谱
、
知识表示
、
知识链接等技术逐渐成为机器人
认知的重要 手 段
,
在 智 能 搜 索
、
机 器 翻 译
、
机 器 理
解
、
自然语言问答等领域得到了广泛应用
.
知识图
谱核心是构建相关领域的语义知识网络
,
对
VGE
知 识 的 表 达 与 建 模
、
VGE
知 识 库 的 构 建 和 管 理
、
VGE
知识的可视化方法具有广泛的借鉴意义
.
本文将知 识 图 谱 技 术 与 地 理 知 识 工 程 相 结
合
,
提出基于多源 异构 数 据的 大 规模 地 理知 识 图
谱的构建
,
目的是建立大规模的地理知识库
,
用于
融合语义关系和空间关系的地理智能搜索和地理
知识自然语言智 能 问答
,
最终 为 智能 虚 拟地 理 环
境系统的构建提供技术支撑
.
论文首先评述了知
识图谱及地理知识图谱的研究现状
;
然后
,
提出了
地理知识图谱构 建 的技 术 体系 和 流程
,
探讨 了 地
理知识图谱与其 他领 域 知识 图 谱的 区 别和 联 系
;
最后
,
讨论和阐述了地理知识图谱的应用方向
.
1
国内外研究综述
1.1
知识图谱
知识图谱是人 工智 能 领域 的 分支
,
是 大 数 据
时代知识表示最重要的一种方式
.
本质上是由具
有属性的实体通 过关 系 链接 而 成的 网 状知 识 库
,
即具有有向图结 构 的一 个 知识 库
,
其中 图 的节 点
代表实 体
(
entit
y
)
或 者 概 念
(
conce
p
t
),
而 图 的 边
代表实体
/
概念之间的各种语义关系
[
7
]
.
知识图谱的 概 念 起 源 于
20
世 纪
50
年 代 末
60
年 代 初 提 出 的 语 义 网 络
(
semanticnet
)
[
8
]
,
知
识 图 谱 的 发 展 在 相 关 文 献 中 都 有 了 深 入 的 阐
述
[
7G9
]
.
从
20
世 纪
70
年 代 出 现 的
“
专 家 系 统
(
ex
p
erts
y
stem
)”,
70
年 代 中 后 期 利 用 哲 学 领 域
的本 体 论 创 建 计 算 机 模 型
,
到 万 维 网 之 父
BernersGLee
提出 的
“
语 义 网
(
semanticweb
)”
[
10
]
和
“
链接数据
(
linkeddata
)”
[
11
]
,
都是
“
知识 图 谱
”
的前身
.
当前
,
开放 域 知识 图 谱比 较 有代 表 性的
有
:
DB
p
edia
[
12
]
、
YAGO
[
13
]
、
Probase
[
14
]
、
BableNet
[
15
]
等
,
国 内 的 有
Zhishi.me
[
16
]
、
CNG
DB
p
edia
[
17
]
,
见表
1
.
知识 图 谱 具 有 规 模 大
、
语 义
丰富
、
质量高和结构友好等特点
.
表
1
主要开放知识图谱的实体及关系数量
Tab.1 Thenumberofentitiesandrelationsofo
p
enKG
知识图谱 实体
/
概念数量 关系数量
YAGO 10Million 120Million
DB
p
edia 28Million 9.5Billion
Probase 2.7 Million 70Billion
BableNet 14Million 5Billion
1.2
地理知识图谱
对地理知识的 认识
,
不同 的 学者 有 不 同 的 看
法
,
大致可以分为
3
类
:
(
1
)
地理知识的专业性认识
.
地理知识包括
大量的地理概念
、
地理现象的描述
,
是关于地理时
空问题的认 知
、
理 解 与 规 律 表 达
[
18
]
,
是 高 层 次 的
地理信息
[
19
]
.
(
2
)
地理知识的泛在化认识
.
由于泛在地理
信息获取渠道的 不 断拓 展
,
认为 地 理知 识 是描 述
地球系统中自然和人文环境的信息
[
20
]
,
互联网中
2501
第
8
期 蒋秉川
,
等
:
多源异构数据的大规模地理知识图谱构建
隐含 了 大 量 的 地 理 知 识
[
21
]
,
是 广 义
GIS
的 知 识
支撑
[
22
]
.
(
3
)
地理知识的综合性认识
.
从地理知识共
享角度
,
按照不同的分类方法
,
将地理知识进行了
系统性的分类
.
代表性的有
:
文献
[
3
]
将虚拟地理
环境地理知识划 分 为事 实 型知 识
、
规则 及 控制 型
知识和决策型知识
3
个层 次
.
文献
[
1
]
认为 地 理
知识 基 础
(
g
eo
g
ra
p
hicknowled
g
ebase
,
GKB
)
包
括 地 理 实 体
(
g
eo
g
ra
p
hicob
j
ects
)、
地 理 结 构
(
g
eo
g
ra
p
hicstructures
)、
地 理 关 系
(
g
eo
g
ra
p
hic
relations
)、
地理 规 则
(
g
eo
g
ra
p
hicRules
)、
地 理 本
体
(
g
eo
g
ra
p
hicontolo
gy
)、
地 名 词 典
(
g
azetteer
)、
物理数 学 模 型
(
p
h
y
sicoGmathematicalmodels
)
和
外部知识
(
externalknowled
g
e
).
与地理知识图谱字面较为相近的概念是陈述
彭和廖克等提出的地学信息图谱
.
文献
[
23
]
认为
地学信息图谱是应用地学分析的系列多维图解来
描述现状
,
并通过 建立 时 空模 型 来重 建 过去 和 虚
拟未来
.
文献
[
24
]
认为 其 是一 种 空间 图 形谱 系
,
经过空间模型与 地 学认 知 的深 入 分析
,
可进 行 推
理
、
反演与预测
,
形成对事物和现象更深层次的认
识
.
由此可见
,
地学 信 息图 谱 是一 种 时空 分 析方
法
,
是 谱 系
(
s
p
ectrum
)
的 概 念
.
地 理 知 识 图 谱
(
g
eo
g
ra
p
hicknowled
g
e
g
ra
p
h
)
是 地 理 知 识 工 程
的一种知识表示
,
是网络图
(
g
ra
p
h
)
的概念
.
二者
有着本质的不 同
.
地理 知 识图 谱 的研 究
,
主要 是
作为开放语义网 的 一个 子 集出 现 的
,
代表 性 的成
果 有
:
GeoNames Ontolo
gy
,
LinkedGeoData
,
GeoWorldNet
等
[
25
]
.
针 对 地 理 知 识 图 谱 构 建 的
相关技术 研 究
,
主 要 有 地 理 实 体 抽 取
[
26G27
]
、
拓 扑
和 方 位 关 系 的 抽 取
[
28G29
]
和 地 理 知 识 图 谱 存
储
[
30G32
]
等
.
在地理知识 图 谱应 用 方面
,
典 型 的 有
地理知识语 义 共 享 网 络 系 统
[
33
]
(
GeoGWiki
)
和 基
于地理知识的地名词典
[
34
]
(
KIDGS
).
如图
1
所示
,
地理 知 识图 谱 的核 心 是 建 立 地
理知识库
,
在其基础上形成地理知识语义网
,
然后
通过语义模型
,
实现地理知识的语义搜索
、
地理知
识推荐
、
关联分析等功能
,
从而具备对地理
、
空间
上分散的人
、
环境
、
事件等进行大规模实时关联和
因果分析的能力
.
2
地理知识图谱构建
2.1
地理知识图谱的内涵
地理 知 识 图 谱 是 知 识 图 谱 在 地 理 学 的 拓
展
,
是结构化的地 理 语 义 知 识 库
,
通 过 形 式 化 地
描述地理学领域 的 概 念
、
实 体
、
属 性 及 其 相 互 关
系
,
使得概 念
、
实 体 间 相 互 联 结
,
构 成 网 状 知 识
结构
.
地理 知 识 可 采 用 资 源 描 述 框 架
(
resource
descri
p
tionframework
,
RDF
)
表 示 为 三 元 组 形
式
,
即
“‹
s
(
主 语
),
p
(
谓 语
),
o
(
宾 语
)›”,
形 成 由
“
点
—
边
”
组成的 大规 模 有向 图
,
如图
2
所 示
.
其
中点表示地理概念
、
地理实体及属性值
,
边表示概
念与概念之间的关系
、
概念与实体的关系
、
实体与
实体之间的关系
、
实体与属性的关系
、
属性与属性
值的关系
.
举例说明
,
如图
3
所示
,
实体 与 概 念 的 关 系
:
‹
中国
,
属于
,
国家
›;
实体 与 实体 之 间的 关 系
:‹
中
国
,
首都
,
北京
›;
实体与属性的关系
:‹
北京
,
人口
,
2069.3
万
›.
图
1
地理知识图谱概念图
Fi
g
.1 Conce
p
tma
p
of
g
eo
g
ra
p
hicknowled
g
e
g
ra
p
h
2.2
地理知识图谱的特点
地理知识图谱不单单是一个
“
增强型
”
的开放
域知识图谱
,
而是需要针对地理知识自身的特点
,
对知 识 的 概 念
、
实 体 和 关 系 进 行 拓 展
,
具 有 以 下
特点
:
(
1
)
地理知识图谱的构建是一项地理知识工
程
.
地理知识图谱的构建是对地理知识的形式化
表达的基础上
,
实现对地理知识抽取
、
融合
、
众包
、
表示
、
推理
、
链接
、
问答
、
语义搜索和可视化 等
,
是
一个系列的地理知识工程
.
(
2
)
地 理 知 识 图 谱 描 述 的 关 系 包 括 语 义 关
系
、
空间关系和 时 间关 系
.
开放 域 知识 图 谱描 述
的关系主要是实 体 之间 的 语义 关 系
,
地理 知 识图
谱除了描述语义 关 系外
,
还需 要 考虑 空 间关 系 和
时间关系的描述
.
如何建立地理时空关系和自然
语言空间关系的 映 射
,
是地 理 知识 图 谱构 建 的核
心关键问题
.
3501
剩余10页未读,继续阅读
曹将
- 粉丝: 21
- 资源: 308
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0