与去年题基本相同
一、n-gram
1.什么是n-gram模型
2.给定一个句子,写出1-gram,2-gram,3-gram
3.四个句子作为训练集,计算第二问句子的2-gram概率
二、分词
1.常见的中文分词方式
2.HMM的组成,HMM如何实现分词和词性标注
三、机器翻译
1.画出机器翻译图示,通过概率公式说明翻译过程
2.画出神经机器翻译模型,介绍翻译过程
四、词向量
1.离散化表示的缺点
2.介绍两种词向量
五、迁移学习
源数据有标签,目标数学没有标签
六、介绍一个先进的技术、谈谈看法、发展、展望
评论0