# GPT-stego-WHU-CSC-IH
武汉大学国家网络安全学院信息隐藏2022年结课项目,设计了基于ADG算法的GPT隐写文本生成器,提供了完整的实验代码与模型,功能丰富而简陋(笑)
基于ADG的算法,设计了温度机制作为优化。
参考项目
<https://github.com/Morizeyao/GPT2-Chinese>
<https://github.com/Mhzzzzz/ADG-steganography>
模型下载地址(提取码:fpyu)
<https://pan.baidu.com/share/init?surl=nbrW5iw34GRhoTin8uU2tQ>
没有合适的资源?快使用搜索试试~ 我知道了~
武汉大学国家网络安全学院信息隐藏2022年结课项目,设计了基于ADG算法的GPT隐写文本生成器,
共72个文件
txt:32个
py:25个
pyc:5个
需积分: 5 0 下载量 41 浏览量
2024-05-11
20:49:53
上传
评论
收藏 1.28MB ZIP 举报
温馨提示
GPT, 通常指的是“Generative Pre-trained Transformer”(生成式预训练转换器),是一个在自然语言处理(NLP)领域非常流行的深度学习模型架构。GPT模型由OpenAI公司开发,并在多个NLP任务上取得了显著的性能提升。 GPT模型的核心是一个多层Transformer解码器结构,它通过在海量的文本数据上进行预训练来学习语言的规律。这种预训练方式使得GPT模型能够捕捉到丰富的上下文信息,并生成流畅、自然的文本。 GPT模型的训练过程可以分为两个阶段: 预训练阶段:在这个阶段,模型会接触到大量的文本数据,并通过无监督学习的方式学习语言的结构和规律。具体来说,模型会尝试预测文本序列中的下一个词或短语,从而学习到语言的语法、语义和上下文信息。 微调阶段(也称为下游任务训练):在预训练完成后,模型会被应用到具体的NLP任务中,如文本分类、机器翻译、问答系统等。在这个阶段,模型会使用有标签的数据进行微调,以适应特定任务的需求。通过微调,模型能够学习到与任务相关的特定知识,并进一步提高在该任务上的性能。 GPT模型的优势在于其强大的生成能力和对上下文信息的捕捉能力。这使得GPT模型在自然语言生成、文本摘要、对话系统等领域具有广泛的应用前景。同时,GPT模型也面临一些挑战,如计算资源消耗大、训练时间长等问题。为了解决这些问题,研究人员不断提出新的优化方法和扩展模型架构,如GPT-2、GPT-3等,以进一步提高模型的性能和效率。
资源推荐
资源详情
资源评论
收起资源包目录
武汉大学国家网络安全学院信息隐藏2022年结课项目,设计了基于ADG算法的GPT隐写文本生成器,提供了完整的实验代码与模型,功能丰富而简陋(笑).zip (72个子文件)
content
gui.py 2KB
generater.py 10KB
generate_texts
text.txt 2KB
extract
text.txt 14B
cache
vocab_guwen.txt 127KB
vocab_seg.txt 374KB
vocab_all.txt 84KB
make_vocab.sh 114B
make_vocab.py 1KB
vocab_small.txt 61KB
vocab.txt 107KB
experiment
plot
tem_ppl.py 1KB
tem_kl.py 1KB
tem_emb.py 1KB
evaluate.py 2KB
title.txt 540B
main.py 4KB
cache
vocab_guwen.txt 127KB
vocab_seg.txt 374KB
vocab_all.txt 84KB
make_vocab.sh 114B
make_vocab.py 1KB
vocab_small.txt 61KB
vocab.txt 107KB
generater_ADG.py 12KB
tem_test.py 3KB
tokenizations
encoder.json 26B
vocab.bpe 21B
tokenization_bert_word_level.py 20KB
tokenization_bert.py 19KB
bpe_tokenizer.py 4KB
thulac_dict
seg 30B
__pycache__
tokenization_bert.cpython-39.pyc 15KB
tokenization_bert_word_level.cpython-38.pyc 15KB
tokenization_bert.cpython-38.pyc 15KB
Hamming.py 4KB
generate_baseline.py 6KB
generate_text.py 6KB
README.md 454B
resualt
200_512.txt 90KB
200_256.txt 50KB
tem_250_256.txt 70KB
tem_150_256.txt 70KB
tem_300_256.txt 70KB
ham1_200_256.txt 13KB
150_256.txt 47KB
250_256.txt 50KB
base_200_256.txt 4KB
ham_200_256.txt 13KB
200_384.txt 70KB
0.85_200_256.txt 50KB
tem_200_256.txt 70KB
noham_200_256.txt 13KB
tem_ham.py 2KB
generater_temperature.py 10KB
tokenizations
encoder.json 26B
vocab.bpe 21B
tokenization_bert_word_level.py 20KB
tokenization_bert.py 19KB
bpe_tokenizer.py 4KB
thulac_dict
seg 30B
__pycache__
tokenization_bert_word_level.cpython-38.pyc 15KB
tokenization_bert.cpython-38.pyc 15KB
Hamming.py 4KB
generated
1025-4.txt 0B
0-0.txt 2KB
1025-1.txt 2KB
1025-3.txt 2KB
1025-2.txt 2KB
generate_text.py 9KB
baseline.py 6KB
README.md 492B
共 72 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3811
- 资源: 4660
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- ModStartCMS v8.4.0 框架稳定性持续迭代,修复部分已知问题
- bleder 教室学校学生教育室办公室考试
- 人脸检测-使用OpenCV实现的动漫+漫画人脸检测算法-附项目源码-优质项目实战.zip
- 道路贴图,材质材料免费
- 人脸检测-基于OpenCV+Node.js+WebSockets实现的实时人脸检测应用-附项目源码-优质项目实战.zip
- 一些常见的MySQL死锁案例-mysql-deadlocks-master(源代码+案例+图解说明)
- UE4动画烘焙器-ue4.27
- 新建文件夹.zip
- 1103a2a791bbd96ea98021062e327495b1c422e32fb27e0c2d6404b1bd74b692.gif
- 同城相亲交友php小程序
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功