0 引言
随着“互联网+”在多领域的应用实施,不同电商平台纷纷推进国际化战略运行历程,业务逐渐由国内
向海外拓展,因此对于人机交互智能服务平台也提出了更高的要求.智能对话机器人开始不仅仅是支持中
文,而是要从中文去逐渐地拓展到东南亚、欧洲等更多的语系上.在多语言和国际化业务的背景下,特别
是从中文拓展到更多语言理解的时候,对话机器人可能面临着不同国家的用户、不同文化的用户,基本的
机器人问答处理流程已经无法满足企业和用户的业务需要
[1]
.
构建跨越语言鸿沟的机器人服务体系首要解决的问题是:不同语言的词项表示差别大,表音和表意
方式复杂多样纠错难,小语种文档量少训练质量差,多语言混排无法正确进行意图识别等.如何通过跨语
言的方式去匹配语义的相似度从文档当中找到答案,利用资源丰富的语言,帮助算法模型去理解资源稀缺
的语言,对于构建高质量跨语言机器人学习模型具有重要意义.
在如上背景下,本文以跨语言自迭代学习为切入点,以构建多语言智能服务机器人为任务,提出了
一种多语言深度学习迭代模型(cross-lingual deep learning iteration,CLDLI),旨在跨语言的不同地区和
文化差异场景下检验该智能问答机器人学习模型的有效性
[2-4]
.
1 多语言深度学习模型 1.1 机器问答处理流程
基本的问答机器处理流程和框架如图 1 所示.问答机器人接收用户输入的查询(Query),结合前几轮
输入的文本(Context)历史内容进行叠加后,传入意图识别模块生成分类模型;通过对话管理系统管理和控
制用户和机器人之间多轮对话的一个状态;最后根据意图识别的结果,从 3 种不同的 Bot 当中去选择一个
Bot 来回答用户的问题
[5]
.
图 1 传统机器人的问答处理框架流程 Fig.1 Traditional robot question and answer processing frame process
第 1 类是知识型问答(QA Bot).根据不同的知识结构来选择不同类型的技术进行应答,对于结构化知
识采用知识图谱(knowledge graph)或知识库问答(knowledge base question answering,KB-QA)的方式.
对于常见问答 FAQ 形式的知识类结构,采用文本相似度匹配的方式来从知识库里面寻找答案,而对于非
结构化形式的问答,则采用机器阅读理解技术进行回答,无需人工梳理.
第 2 类是任务型问答(Task Bot).对于如购买机票类的服务,通过填槽(Slot Filling)将用户意图进行解
析转化为明确指令;对于选购商品等直接性需求则通过对话工作室(Dialogue Studio)开启多轮对话上下文
评论0
最新资源