没有合适的资源?快使用搜索试试~ 我知道了~
Fake-News-Detector:基于机器学习的虚假新闻检测器
共43个文件
png:17个
ipynb:8个
csv:4个
需积分: 3 20 下载量 118 浏览量
2021-05-12
13:19:02
上传
评论 3
收藏 215.26MB ZIP 举报
温馨提示
假新闻检测器 欢迎分类为假新闻。 目标 端到端的机器学习管道将: 提取原始文本数据。 将原始文本数据处理为段落向量 将受过训练的有监督学习分类器应用于段落向量,以将原始文本标记为fake或not_fake fake 知识 比较当今使用的词嵌入应用程序的不同方法 在两者上都使用像Gensim这样的神经嵌入实现 词向量化和 段落矢量化 超调谐神经嵌入算法作为端到端流水线的一部分 使用标准的行业分类器,并将其与端到端管道集成 对多阶段机器学习管道进行故障排除 结构 (第一阶段)假新闻分类: 分类器应用程序伪造新闻文本。 嵌入代码是为学生事先准备的,因此他们可以专注于应用分类器基础知识。 将关注度量(精度,召回率,F1)和模型选择 (第2阶段)文本嵌入技术: 什么是Word2Vec,什么是Paragraph2vec 回顾历史策略以及word2vec为什么效果更好 TF IDF(历史简
资源推荐
资源详情
资源评论
收起资源包目录
Fake-News-Detector-master.zip (43个子文件)
Fake-News-Detector-master
Phase_01_Progress.ipynb 48KB
Phase_03_report_plus.ipynb 47KB
Phase_02.ipynb 87KB
Phase_01.ipynb 53KB
Personal.ipynb 156KB
doc2vec.bin.gz 78.36MB
images
nfl.png 49KB
linefit.png 61KB
dataset.png 18KB
standardLogisticFunction.png 26KB
unbalanced.png 132KB
logistic.png 92KB
cross-validation.jpg 19KB
gridsearch.png 262KB
odds.png 247B
skip-gram.png 40KB
overview_paragraph.png 41KB
tfidf.jpg 85KB
cbow.png 43KB
odds_double.png 724B
odds_ratio.png 29KB
overview_word.png 31KB
AdaBoost_part.png 55KB
GradientBoosting_scheme.png 42KB
testtrainvalidation.png 37KB
LICENSE 1KB
README.md 2KB
Phase_02_Progress.ipynb 61KB
data
Doc2Vec(dmm,d50,n10,w8,mc5,s0.001,t4,0.001,iter40,epochs10) 33.26MB
embeddings2.txt 18.95MB
fake_or_real_news.csv 55.37MB
movie_reviews.csv 73.45MB
grad.csv 5KB
tfidf_matrix_2500_700.bin 33.83MB
embeddings.txt 18.95MB
tfidf_pca_vec.py 2KB
onion_reuters_embeddings.csv 24.81MB
papers
Word2Vec original paper.pdf 109KB
Paragraph2Vec original paper.pdf 286KB
tfidf_pca_vec.py 2KB
.gitignore 1KB
Phase_03_report.ipynb 1.03MB
Phase_03.ipynb 25KB
共 43 条
- 1
资源评论
马未都
- 粉丝: 18
- 资源: 4687
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功