RuSentEval
语言来源,编码器力量!
RuSentEval是用于俄语句子嵌入的评估工具包。
在此存储库中,您可以找到数据和脚本来评估句子嵌入的质量。
RuSentEval,这是针对俄罗斯的14个探测任务的增强集合,其中包括尚未探索的任务。 我们使用互补的探测方法的组合来探索两种语言学上相对的两种语言(俄语和英语)在五种多语言转换器中各种语言属性的分布。
我们的结果提供了有趣的发现,这些发现与对语言知识的表示方式的普遍理解相矛盾,并表明尽管语言有所不同,但某些属性还是以类似的方式学习的。
经过测试的模型和结果
该代码与作为HuggingFace库的一部分发布的模型兼容。
俄罗斯型号:
RuBERT (库拉托夫,阿克希波夫,2019年)DeepPavlov的RuBERT(俄语,带套管,12层,隐藏768、12头,180M参数)已在Wikipedia的俄语部分和新闻数据上进行了
评论0
最新资源