# transeval
## 一、基本介绍
transeval是基于GPT-4模型的中英人工翻译可解释性质量评估模型。借鉴MQM等传统笔译评估框架,国内外高校、翻译协会认证考试评分细则,设计了一套基于并适用于大语言模型的人工翻译可解释性自动评估流程,模拟了人工翻译质量评估并输出类似人工翻译质量评估的结果,包括译文的错误位置、错误类型、错误严重程度和错误解释。
## 二、评估流程
(1)切分文本:将输入的原文本按照段落切分为若干字数相近的段落,切分过程由GPT实现;
(2)对齐文本:将原文、参考译文、待评估译文对齐,对齐由GPT实现;
(3)评估文本:将原文、参考译文、待评估译文以及评估标准,按照一定的prompt框架(LangGPT)组织为自然语言指令,让GPT-4模型进行评估,并输出JSON结构的评估结果。
<img src="https://picbed-1324358826.cos.ap-beijing.myqcloud.com/typechoimage-20240413155721877.png" alt="image-20240413155721877" style="zoom: 80%;" />
## 三、测试集
对评估模型从如下五个维度进行评估:错误类型、错误数量、错误共现(不同类型错误同时出现)、是否有参考译文、GPT输出结果是否稳定等方面进行测试。
测试集来自于中英CATTI三级笔译试题,参考译文来自于XXLIN1987公众号和某网校提供的译文。
XXLIN1987译文:https://mp.weixin.qq.com/s/y8gvX5qDY8LPMTiKIAOCYw
某网校译文:https://www.examw.com/catti/bycj/test/
测试结果如下:
![image-20240413160728234](https://picbed-1324358826.cos.ap-beijing.myqcloud.com/typechoconclusion.png)
test_code文件夹下提供了测试使用的Python代码;
test_set文件夹下是所有的测试集文件,文件夹命方式为:编号-评估维度-(错误类型)。
测试集下载后建议用Excel打开查看,步骤如下:
(1)下载测试集;
(2)打开一个新的Excel工作簿;
(3)从“数据-获取和转换数据-从文本/CSV”打开.csv文件。
![image-20240413162242582](https://picbed-1324358826.cos.ap-beijing.myqcloud.com/typechoimage-20240413162242582.png)
没有合适的资源?快使用搜索试试~ 我知道了~
基于GPT-4模型的中英人工翻译可解释性质量评估.zip
共15个文件
csv:9个
py:4个
md:1个
需积分: 5 0 下载量 130 浏览量
2024-05-11
20:50:01
上传
评论
收藏 304KB ZIP 举报
温馨提示
GPT, 通常指的是“Generative Pre-trained Transformer”(生成式预训练转换器),是一个在自然语言处理(NLP)领域非常流行的深度学习模型架构。GPT模型由OpenAI公司开发,并在多个NLP任务上取得了显著的性能提升。 GPT模型的核心是一个多层Transformer解码器结构,它通过在海量的文本数据上进行预训练来学习语言的规律。这种预训练方式使得GPT模型能够捕捉到丰富的上下文信息,并生成流畅、自然的文本。 GPT模型的训练过程可以分为两个阶段: 预训练阶段:在这个阶段,模型会接触到大量的文本数据,并通过无监督学习的方式学习语言的结构和规律。具体来说,模型会尝试预测文本序列中的下一个词或短语,从而学习到语言的语法、语义和上下文信息。 微调阶段(也称为下游任务训练):在预训练完成后,模型会被应用到具体的NLP任务中,如文本分类、机器翻译、问答系统等。在这个阶段,模型会使用有标签的数据进行微调,以适应特定任务的需求。通过微调,模型能够学习到与任务相关的特定知识,并进一步提高在该任务上的性能。 GPT模型的优势在于其强大的生成能力和对上下文信息的捕捉能力。这使得GPT模型在自然语言生成、文本摘要、对话系统等领域具有广泛的应用前景。同时,GPT模型也面临一些挑战,如计算资源消耗大、训练时间长等问题。为了解决这些问题,研究人员不断提出新的优化方法和扩展模型架构,如GPT-2、GPT-3等,以进一步提高模型的性能和效率。
资源推荐
资源详情
资源评论
收起资源包目录
基于GPT-4模型的中英人工翻译可解释性质量评估.zip (15个子文件)
content
test_set
01_3-error_type-Linguistic_conv.csv 22KB
03_1-occurring_errors-fidelity.csv 25KB
03_2-occurring_errors-fluency.csv 25KB
05_stability.csv 27KB
04_reference-without_reference.csv 18KB
01_1-error_type-fidelity.csv 25KB
02_error_num-linguistic_convent.csv 66KB
conclusion.png 405KB
01_2-error_type-fluency.csv 25KB
04_reference-with_ref.csv 20KB
test_code
transeval_fluency.py 5KB
transeval_linguistic_convention.py 5KB
text_split.py 3KB
transeval_fidelity.py 5KB
README.md 2KB
共 15 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3824
- 资源: 5376
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功