# 对话机器人训练实验 - 基于seq2seq及attention机制
项目是基于官方的[对话机器人教程](https://pytorch.org/tutorials/beginner/chatbot_tutorial.html)进行改写的。可以实现基于原始的对话语料(一问一答形式)训练深度学习对话机器人。
具体可实现效果如下:
![](examples/chat_record1.png)
## 项目构成
```
├── corpus 存放语料及语料预处理代码
├── data.py 数据预处理
├── data_transform.py 将数据转化成模型能够接收的格式
├── evaluate.py 测试模型
├── main.py 训练主程序
├── model.py 编码器-解码器模型
├── models 存储模型
├── settings.py 项目参数
├── train.py 训练相关代码
├── utilis.py 工具函数
└── vocabulary.py 将文本字符转化为字典
```
## 如何训练模型?
修改setting文件的若干参数, 其他参数都可以不用管, 必须要修改的是以下参数:
- corpus_name语(料名称), 最后模型的命名会根据这个来;
- data_file(数据所在位置),可选: corpus/qingyun_seg或corpus/xhj_seg,
以青云语料数据为例, 数据形式如下(需要分词):
```
南京 在 哪里 | 在 这里 了
咋死 ??? 红烧 还是 爆炒 | 哦 了 哦 了 哦 了 , 咱 聊 点 别的 吧
你 个 小 骚货 , 哥哥 的 巴操 你 爽 不 爽 ? | 不要 这样 说 嘛 ! 很 不 文明 哦
额 麻麻 怎么 会 有 那 玩意儿 | 无法 理解 您 的话 , 获取 帮助 请 发送 help
孩纸 , 新年 快乐 | {r + }同 乐同乐 , 大家 一起 乐 ~
拿 尿 冲 一 冲 | 今天 这 天气 很 适合 聊天 的 说
```
- 语料的处理的方法名称:read_voc_method, 可选:qingyun或xhj, 两者分别对青语云和小黄鸡语料
在配置完其他训练相关参数以后, 可以运行以下代码来训练模型:
```
python main.py
```
这样就会在models下面出现相应的模型, 然后我们可以通过运行以下代码来测试模型的效果:
```
python evaluate.py
```
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【项目资源】: 包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】: 所有源码都经过严格测试,可以直接运行。 功能在确认正常工作后才上传。 【适用人群】: 适用于希望学习不同技术领域的小白或进阶学习者。 可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】: 项目具有较高的学习借鉴价值,也可直接拿来修改复刻。 对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】: 有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 鼓励下载和使用,并欢迎大家互相学习,共同进步。
资源推荐
资源详情
资源评论
收起资源包目录
基于seq2seq和注意力机制训练对中文话机器人.zip (34个子文件)
资料总结
__init__.py 0B
evaluate.py 3KB
corpus
__init__.py 0B
raw_data
__init__.py 0B
xiaohuangji 23.33MB
prepare_qy.py 670B
prepare_xhj.py 1KB
__pycache__
prepare_qy.cpython-36.pyc 823B
__init__.cpython-36.pyc 157B
prepare_xhj.cpython-36.pyc 910B
seg_sentence.py 264B
qingyun.csv 6.78MB
__pycache__
__init__.cpython-36.pyc 148B
qingyun_seg 7.94MB
xhj_seg 27.24MB
main.py 2KB
train.log 4KB
examples
chat_record1.png 58KB
data_transform.py 2KB
vocabulary.py 2KB
model.py 5KB
data.py 3KB
utilis.py 4KB
.gitignore 21B
settings.py 959B
train.py 6KB
__pycache__
data.cpython-36.pyc 3KB
data_transform.cpython-36.pyc 3KB
settings.cpython-36.pyc 913B
model.cpython-36.pyc 4KB
train.cpython-36.pyc 4KB
utilis.cpython-36.pyc 3KB
vocabulary.cpython-36.pyc 2KB
README.md 2KB
共 34 条
- 1
资源评论
- 清秋*2024-06-12资源很好用,有较大的参考价值,资源不错,支持一下。
- m0_748945612024-03-16资源很实用,内容详细,值得借鉴的内容很多,感谢分享。
妄北y
- 粉丝: 1w+
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功