没有合适的资源?快使用搜索试试~ 我知道了~
missing_word_locator:使用机器学习技术为 Kaggle 的 Billion Word Imputation ...
共15个文件
py:12个
gitignore:1个
md:1个
需积分: 5 0 下载量 75 浏览量
2021-07-05
09:06:58
上传
评论
收藏 17KB ZIP 举报
温馨提示
缺少词定位器 介绍 这是使用 Kaggle 的 Billion Word Imputation 数据集的缺失词定位器,位于此处: 我们最初将这个项目建模为十亿字估算挑战的完整提交,但是预测单词位置和它被证明是哪个单词的挑战对我们的计算资源和时间来说非常繁重。 相反,我们选择关注在句子中定位缺失词的问题。 我们使用两种方法来预测缺失词的位置: 使用棕色聚类对词进行聚类的平均感知器,并以 n-gram 作为特征 使用长距离二元组的马尔可夫链 我们发现平均感知器的成功率在 50% 左右达到峰值,而马尔可夫链模型为 30%。
资源推荐
资源详情
资源评论
收起资源包目录
missing_word_locator-master.zip (15个子文件)
missing_word_locator-master
.gitignore 23B
averaged_perceptron.py 5KB
run_averaged_perceptron.py 704B
ap_utils.py 4KB
smooth_ldb.py 3KB
averaged_perceptron2.py 7KB
xtest.py 1KB
ntest.py 1KB
ngram_smooth.py 3KB
README.md 844B
ngram_probs.py 2KB
test.py 2KB
README_LDB 2KB
ldb_prob_sum.py 3KB
ldb_probs.py 3KB
共 15 条
- 1
资源评论
行者无疆0622
- 粉丝: 26
- 资源: 4631
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功