2019-TF17-阿里巴巴-华能威-知识图谱与智能搜索.pdf
转自CCF:https://dl.ccf.org.cn/lecture/lectureDetail?id=4409498440943616。 摘要:全网知识图谱有其独特的优势、价值,不仅帮助机器理解文本,也是智能信息服务的高效手段。知识图谱和搜索的结合越来越紧密,成为重要的数据和技术驱动。同时,知识图谱应用于智能问答,包括在有屏、无屏场景下也都发展迅速。当然知识图谱本身也面临很多的挑战、难题。本次报告分享这方面工作的一些经验和心得,希望对大家有所启发和帮助。 知识图谱是近年来信息技术领域的重要研究方向,尤其在智能搜索和问答系统中发挥着关键作用。阿里巴巴的神马知识图谱是这方面的典型实践,它致力于构建一个通用的知识图谱,旨在理解和组织互联网上的信息,为用户提供更智能、个性化的服务。 神马知识图谱是一个全面描绘客观世界的实体、概念及其相互关系的数据库。它的应用价值主要体现在以下几个方面: 1. **自然语言理解**:通过实体链接技术,知识图谱可以帮助计算机理解用户查询的意图,从而提高搜索的准确性。 2. **信息组织与智能服务**:知识图谱可以将互联网信息按实体、关系进行组织,不仅限于文字,还包括问答、图片、视频等内容,提供更加丰富和智能化的服务。 3. **用户画像构建**:通过捕捉用户的兴趣点,如关心的人物、事件、地点等,知识图谱能够帮助构建用户画像,进而优化信息推送,如信息流服务。 神马知识图谱的数据规模庞大,包含45亿条关系,覆盖了1700个不同的类型,涉及人物、地点、组织、电影等多个领域。它的发展历程展示了知识图谱在搜索、信息流、对话机器人和智能音箱等应用场景中的不断深化。 在技术实现上,神马知识图谱的构建主要包括以下几个关键点: 1. **知识表示和建模**:定义统一的Schema,包括类型、属性及其属性值,通过继承关系整合异构知识。 2. **知识抽取**:采用结构化、半结构化和自由文本三种方式抽取知识,结合自然语言处理和深度学习技术,确保知识的全面性和实时性。 3. **知识融合和挖掘**:通过Schema映射、实体对齐、属性融合、关系挖掘等方法,解决数据的不一致性和不确定性。 4. **应用层技术**:包括query实体识别和链接,内容分析,以及基于搜索数据的热度计算,提升查询理解和信息检索的效率。 在实际应用中,知识图谱与搜索的结合产生了显著的效果,如通过query分析与理解,提供语义查询、知识卡片、垂直搜索和知识推荐等功能。知识卡片覆盖了多个行业,如人物、视频、疾病、教育等,为用户提供一站式信息服务。同时,实体推荐利用深度学习模型,如DeepMatch,实现搜索结果的深度语义匹配,改善用户体验。 知识图谱是智能搜索和问答系统的核心组成部分,它通过整合和理解大量信息,提升了信息检索的智能性和用户体验。随着技术的发展,知识图谱在未来的应用场景将更加广泛,对于推动人工智能的进步具有重要意义。
- 粉丝: 9
- 资源: 31
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助