#### 一. 任务形式化
这个赛道的目标是设立基于知识图谱的主动聊天任务。[知识驱动对话-官网地址](http://lic2019.ccf.org.cn/talk)
##### 输入:
对话目标g,其中g=START->TOPIC\_A->TOPIC\_B;表示机器从冷启动状态主动聊到话题A,然后聊到话题B。意味着在该任务中,由机器主动的引导对话;在该任务中,具体的话题包括电影和娱乐人物主体。
相关知识信息M,其中M=f1,f2,...,fn. 包括三类,分别是:话题A的知识信息,话题B的知识信息,话题A和话题B的关联信息。在该任务中,具体的相关知识信息包括电影票房,导演和评价等,以SPO形式表示。也就是(Subject, Predicate, Object),即(实体一,谓词,实体二)。
当前对话序列H=u1,u2,...u(t-1)
##### 输出:
机器回复ut.
#### 二.数据介绍(见官方网站)
#### 三.评价方法
自动评估指标和人工评估指标结合。自动评估指标考虑三个层面的度量,分别是字级别(F1-score),词级别(BLEU)和回复多样性(DISTINCT)。关于回复多样性,还是基于词的计算,不过考察的是生成词的另外一个维度。在参考2中作者这样写道:
_distinct-1 and distinct-2
are respectively the number of distinct unigrams and bigrams divided by total number of generated words_
#### 四.一般流程
参考PyTorch官方提供的tutorial(见参考4),从seq2seq的角度解决问题的方法是,将多轮对话拆分成平行句。例如,针对当前对话序列H=u1,u2,...u(t-1),可以拆分成t-2组样本,分别是:u1->u2;u2->u3;...;u(t-2)->u(t-1);但是,这样的划分方式存在明显的问题是:句子之间的平滑。这应该是一个问题,但是还没有深入思考过。
#### 五.想法实现
目前,重构了PyTorch官方的Chatbot的Tutorial代码,将各个模块解耦出来,顺带发现了一个Bug。在此基础上,准备实现一个baseline,[代码地址](https://github.com/zhpmatrix/lic2019-competition)
实现思路上,主要参考论文《A Knowledge-Grounded Neural Conversation Model》,包括两个主要部分:
第一:如何将知识图谱的信息嵌入到模型中;
第二: memory机制的实现;
补充:
IJCAI16的文章《Neural Generative Question Answering》的3.2节提出了两种方式用于输入和KG的交互:
第一: Bilinear Model
第二: CNN-based Matching Model
参考:
0.www2018,《DKN: Deep Knowledge-Aware Network for News Recommendation》
1.[第六届全国社会媒体处理大会-SMP2017中文人机对话技术评测(ECDT)](http://ir.hit.edu.cn/SMP2017-ECDT)
包含两个任务:用户意图领域分类和特定域任务型人机对话在线评测
2.《A Diversity-Promoting Objective Function for Neural Conversation Models》
3.《A Persona-Based Neural Conversation Model》
4.[chatbot tutorial with pytorch](https://pytorch.org/tutorials/beginner/chatbot_tutorial.html)
5.[2018JDDC的对话比赛亚军方案](https://github.com/Dikea/Dialog-System-with-Task-Retrieval-and-Seq2seq)
6.[机器如何猜你所想?阿里小蜜预测平台解密](https://102.alibaba.com/detail?id=193)
7.[拆开阿里小蜜的内核,看智能人机交互的实现逻辑](https://102.alibaba.com/detail?id=114)
8.[一文揭秘!自底向上构建知识图谱全过程
](https://102.alibaba.com/detail?id=134)
9.[为电商而生的知识图谱,如何感应用户需求?](https://102.alibaba.com/detail?id=179)
10.[健康知识图谱,阿里工程师如何实现?
](https://102.alibaba.com/detail?id=176)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的竞赛项目学习资料,作为参考学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 2019语言与智能技术竞赛-基于知识图谱的主动聊天源码+学习说明.zip
资源推荐
资源详情
资源评论
收起资源包目录
2019语言与智能技术竞赛-基于知识图谱的主动聊天源码+学习说明.zip (6个子文件)
code_20105
utils.py 5KB
train_eval.py 9KB
preprocess.py 8KB
main.py 4KB
model.py 8KB
README.md 4KB
共 6 条
- 1
资源评论
土豆片片
- 粉丝: 1562
- 资源: 5642
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功