没有合适的资源?快使用搜索试试~ 我知道了~
Plagiarism-Dectector-2021:最终的Udacity纳米学位项目
共18个文件
png:6个
py:3个
ipynb:3个
需积分: 10 0 下载量 50 浏览量
2021-03-08
05:51:05
上传
评论
收藏 541KB ZIP 举报
温馨提示
抄袭项目,机器学习部署 该存储库包含用于使用AWS SageMaker部署a窃检测器的代码和相关文件。 项目概况 在这个项目中,您将负责构建a窃检测器,该检测器将检查文本文件并执行二进制分类。 根据该文本文件与提供的源文本的相似程度,将该文件标记为抄袭或不抄袭。 侦查窃是一个活跃的研究领域。 这项任务很艰巨,解释的答案和原始作品之间的区别通常并不那么明显。 该项目将分为三个主要笔记本: 笔记本1:数据探索 加载窃文本数据的语料库。 探索现有的数据功能和数据分布。 这第一台笔记本是不是在你的最终项目要求提交的。 笔记本2:功能工程 清理并预处理文本数据。 定义用于比较答案文本和源文本的相似性的特征,并提取相似性特征。 通过分析不同功能之间的相关性来选择“良好”功能。 创建包含用于训练/测试数据点的相关功能和类标签的训练/测试.csv文件。 笔记本3:在SageMaker中训
资源推荐
资源详情
资源评论
收起资源包目录
Plagiarism-Dectector-2021-main.zip (18个子文件)
Plagiarism-Dectector-2021-main
helpers.py 5KB
2_Plagiarism_Feature_Engineering.ipynb 107KB
notebook_ims
matrix_2.png 26KB
matrix_3_match.png 24KB
matrix_1.png 34KB
matrix_rules.png 60KB
common_subseq_words.png 132KB
matrix_6_complete.png 24KB
problem_unittests.py 6KB
source_sklearn
train.py 2KB
plagiarism_data
train.csv 6KB
test.csv 2KB
README.md 2KB
1_Data_Exploration.ipynb 34KB
data.zip (1).man 111KB
data.zip.man 111KB
3_Training_a_Model.ipynb 47KB
data.zip 111KB
共 18 条
- 1
资源评论
子皮论
- 粉丝: 31
- 资源: 4590
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功