2. 什么是知识图谱?
知识图谱是由 Google 公司在 2021 年提出来的一个新的概念。从学术的角度,
我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络
〔Semantic Network〕的知识库〞。但这有点抽象,所以换个角度,从实际应
用的角度出发其实可以简单地把知识图谱理解成多关系图〔Multi-relational
Graph〕。
那什么叫多关系图呢?学过数据结构的都应该知道什么是图〔Graph〕。图是由
节点〔Vertex〕和边〔Edge〕来构成,但这些图通常只包含一种类型的节点和
边。但相反,多关系图一般包含多种类型的节点和多种类型的边。比方左下列
图表示一个经典的图结构,右边的图那么表示多关系图,因为图里包含了多种
类型的节点和边。这些类型由不同的颜色来标记。
在
知识图谱里,我们通常用“实体〔Entity〕〞来表达图里的节点、用“关系
〔Relation〕〞来表达图里的“边〞。实体指的是现实世界中的事物比方人、地
名、概念、药物、公司等,关系那么用来表达不同实体之间的某种联系,比方
人-“居住在〞-北京、张三和李四是“朋友〞、逻辑回归是深度学习的“先导知识〞
等等。
现实世界中的很多场景非常适合用知识图谱来表达。比方一个社交网络图谱里,
我们既可以有“人〞的实体,也可以包含“公司〞实体。人和人之间的关系可以
是“朋友〞,也可以是“同事〞关系。人和公司之间的关系可以是“现任职〞或者
“曾任职〞的关系。类似的,一个风控知识图谱可以包含“〞、“公司〞“通话〞
3. 知识图谱的表示