文本分析项目-源码

所需积分/C币:9 2021-02-24 23:49:30 148KB ZIP
14
收藏 收藏
举报

德语句子的自动复杂度评估 团队成员 里奥·阮·拉乌尔·贝格·康拉德·斯特劳布·蒂尔·诺彻 邮件地址 现有代码片段 利用的图书馆 运行代码(稍后将设置主入口点) 下载数据集: python download_data.py 项目状态 数据分析 我们的主要数据源是TextComplexityDE 19数据集( ),其中包含1000个德语句子,由外语学习者在7点Likert量表上标记为A级和B级,其中1表示低复杂度,高可读性句子,而7则相反。 其中900个句子来自23篇德国Wikipedia文章,其余100则来自Leichte Sprache。 数据集中的每个句子至少由5个人标记,数据集中提供了它们的平均评分。 除了复杂性/可读性之外,还收集了句子的可理解性和词汇难度得分。 图:饼图显示(四舍五入的)评级分布。 评级不是平均分配的,因为平均没有句子收到7,而很少有人得到6。在句子的

...展开详情
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

关注 私信
上传资源赚钱or赚积分
最新推荐
文本分析项目-源码 9积分/C币 立即下载
1/0