机器翻译+对话系统中的评价指标_机器翻译的评分标准资源-CSDN文库

需积分: 33 84 浏览量 2017-12-02 20:49:50 上传评论收藏 92KB DOC 举报

资源推荐

资源详情

资源评论

Blue 评测

（一）

Blue 通常用来度量一组机器产生的翻译句子集合 (candidates)与一组人工翻译句子集合

(references)的相似程度。Blue 的具体计算过程看下图：

在这

里解

释一

下：

式中

的 n

为当

前匹

配

n-

gram 的长度，这里的 N=4(也可以是其 1,2,3),是 n-gram 匹配权重，BP 是用来对过短候选翻

译的惩罚系数，是利用当前 n-gram 匹配对候选机器翻译基于精度的评测

式中：为 n-gram 同

时在一组人翻译和机器翻译中出现

次数最大的值，而

为 n-gram 在机器翻译中出现的次数。

注：该图来自维基百科

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

内容反馈

brith_for_AI

粉丝: 19
资源: 4

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip