没有合适的资源?快使用搜索试试~ 我知道了~
SICK-E-balanced数据集
共7个文件
tsv:6个
ds_store:1个
需积分: 0 1 下载量 107 浏览量
2023-12-02
14:52:39
上传
评论
收藏 138KB ZIP 举报
温馨提示
SICK-E数据集是一种用于情感分析的语料库,旨在评估情感分类器的性能。该数据集包含来自电影评论的文本,其中每条评论都附带了相应的情感标签(正面或负面)。 SICK-E数据集的特点是它只包含英文评论,并且每个评论都经过了预处理,以去除任何非文本字符和标点符号。此外,该数据集还提供了每个评论的词频分布和平均词长等信息。 SICK-E数据集的另一个重要特点是它的平衡性。在情感分析任务中,数据集的平衡性非常重要,因为正面和负面情感的评论数量往往不均衡。SICK-E数据集通过随机选择正面和负面评论来平衡数据集中的情感分布,从而使得情感分类器的训练更加公平。 SICK-E数据集的文本数据经过随机选择和平衡处理,使得正面和负面评论的数量相等,从而使得情感分类器的训练更加公平。该数据集适用于评估和优化情感分类器的性能,以及研究情感词典的构建和其他相关任务。
资源推荐
资源详情
资源评论
收起资源包目录
SICK-E-balanced-20231016T061449Z-001.zip (7个子文件)
SICK-E-balanced
.DS_Store 6KB
2-balance
SICK_DEV_US.tsv 15KB
SICK_TEST_US.tsv 146KB
SICK_TRAIN_US.tsv 133KB
3-balance
SICK_DEV_ALL_S.tsv 23KB
SICK_TRAIN_ALL_S.tsv 196KB
SICK_TEST_ALL_S.tsv 220KB
共 7 条
- 1
资源评论
三月七꧁꧂
- 粉丝: 1656
- 资源: 29
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功