没有合适的资源?快使用搜索试试~ 我知道了~
Attention-Based-Siamese-Text-CNN-for-Stance-Detection:复旦大学自然语言处理...
共50个文件
py:37个
md:3个
csv:2个
需积分: 29 5 下载量 196 浏览量
2021-05-13
14:59:33
上传
评论 1
收藏 14.59MB ZIP 举报
温馨提示
假新闻挑战 这是NLP课程的最终项目。 我们的工作包括以下几个部分: 数据预处理 常规机器学习方法 Seq2seq注意模型 TextCNN和暹罗网络 其他(例如比赛中的相关工作,未来的工作) 1.数据预处理 我们提供了几种数据预处理方法:BoW(单词袋),TF-IDF,word2vec,doc2vec。 每个py文件都会生成x_1(文档表示形式)x_2(标题表示形式)和y(标签)。 这些数据可以作为间谍数据输出,可以在模型中使用。 2.常规机器学习 我们提供py文件以通过常规机器学习(例如SVM,随机森林)对实例进行分类,代码在sklearn上实现。 环境要求:sklearn numpy 3. Seq2seq注意模型 这些代码通常基于一个带有预训练模型的基于注意力的序列到序列模型( )。 要使用代码生成文本摘要。 运行:python3 run_summarization.py -
资源推荐
资源详情
资源评论
收起资源包目录
Attention-Based-Siamese-Text-CNN-for-Stance-Detection-master.zip (50个子文件)
Attention-Based-Siamese-Text-CNN-for-Stance-Detection-master
conventional_ML
naive_ml.py 11KB
LICENSE 1KB
TextCNN_Siamese
read_data.py 564B
util.py 1KB
main_v5_FineGrain.py 8KB
TokenizeSentences.py 182B
siameseTextCNN.py 5KB
main_v5.py 8KB
cnn_loaddata.py 3KB
siameseTextCNN_v3.py 5KB
main_v5_FullDoc.py 8KB
cnn_loaddata_v2.py 3KB
siameseTextCNN_v2.py 5KB
main_v5_FullDoc_FineGrain.py 8KB
fnc_data
train_1.txt 217KB
UCL_Repeat
util.py 11KB
model
model.checkpoint.index 533B
model.checkpoint.data-00000-of-00001 11.45MB
model.checkpoint.meta 52KB
checkpoint 89B
train_stances_origin.csv 4.06MB
data_handle.py 2KB
train_bodies_origin.csv 3.58MB
eval.py 964B
README.md 954B
pred.py 4KB
final_pj.pdf 810KB
preprocessing
doc2vec.py 69B
read_data.py 564B
write_doc2vec.py 674B
TokenizeSentences.py 182B
doc2vec_readdata.py 2KB
data_preprocessing.py 3KB
write_txt.py 1KB
untitled0.py 2KB
data_pre_v2.py 3KB
untitled1.py 3KB
readme.md 2KB
attention_based_seq2seq
util.py 2KB
inspect_checkpoint.py 1KB
LICENSE.txt 11KB
batcher.py 18KB
data.py 11KB
decode.py 11KB
model.py 25KB
__init__.py 0B
beam_search.py 8KB
README.md 8KB
run_summarization.py 16KB
attention_decoder.py 12KB
共 50 条
- 1
资源评论
男爵兔
- 粉丝: 45
- 资源: 4591
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功