没有合适的资源？快使用搜索试试~ 我知道了~

Sequence to Sequence模型理解

6 下载量 120 浏览量 2021-01-20 11:21:23 上传评论收藏 98KB PDF 举报

温馨提示

试读

1页

借鉴博客：几张图彻底搞定Seq2Seq Sequence to Sequence模型由两部分组成：Encoder和Decoder。在机器翻译过程中，假设要将汉语翻译成英语，首先，我们需要两个词典，一个是汉语的词语与数字（index）的一一对应的词典，另一个是英语单词与数字（index）的一一对应的词典，这样，就可以由词语得到数字，也可以由数字得到词语。 1.Encoder部分：对于输入的一句汉语，将其切割成汉语词语，通过查汉语词典得到词语对应的数字，将每个数字转换为一个固定长度的向量，作为循环神经网络RNN的输入，例如X1,X2,X3X_1,X_2,X_3X1,X2,X3，先输入X1X

资源详情

资源评论

Sequence to Sequence模型理解模型理解

借鉴博客：几张图彻底搞定Seq2Seq

Sequence to Sequence模型由两部分组成：Encoder和Decoder。在机器翻译过程中，假设要将汉语翻译成英语，首先，我们需要两个

词典，一个是汉语的词语与数字（index）的一一对应的词典，另一个是英语单词与数字（index）的一一对应的词典，这样，就可以由

词语得到数字，也可以由数字得到词语。

1.Encoder部分：对于输入的一句汉语，将其切割成汉语词语，通过查汉语词典得到词语对应的数字，将每个数字转换为一个固定长度的

向量，作为循环神经网络RNN的输入，例如X1,X2,X3X_1,X_2,X_3X1,X2,X3，先输入X1X_1X1，与初始状态H0H_0H0一起，得到

H1H_1H1，然后由X2X_2X2和H1H_1H1得到H2H_2H2，再由H2H_2H2和X3X_3X3一起得到H3H_3H3，这个H3H_3H3即最后一个隐

状态作为向量C传入Decoder。

2.Decoder部分：里面也是一个循环神经网络RNN，向量C作为这个RNN的初始隐状态，由英语词典将英语词语转换为数字，并转换为

向量作为Decoder中RNN的输入，与初始隐状态一起得到各个时间的隐状态，隐状态与一个数相乘经过softmax之后得到图中的OiO_iOi

，是一个概率分布，再经过argmax得到一个整数YiY_iYi，这个数通过英语词典得到其对应的英语单词。

作者：weixin_45997688

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

评论收藏

内容反馈

Sequence to Sequence模型理解

评论0

最新资源

Sequence to Sequence模型理解

评论0

最新资源

相关推荐

sequence-to-sequence learning

sequence to sequence

SequenceToSequence

Python-RLSeq2Seq用于SequencetoSequence模型的深度强化学习

seq_to_seq模型代码和数据

lstm_seq2seq.py例子

Sequence-Models:动手序列模型

论文研究-基于改进Sequence-to-Sequence模型的文本摘要生成方法.pdf

Custom_Task_Sequence_Part_1(Flexsim基础模型)

NER-Sequence-labeling--Textcnn-bilstm-crf-pytorch:pytorch用Textcnn-bilstm-crf模型实现命名实体识别

MATLAB时间代码顺序-Sequence-Models-on-Stanford-Treebank:斯坦福树上的序列模型

matlab代码左移-Sequence-Models:序列模型

基于深度学习的智能聊天机器人的研究

伯禹学习平台：动手学深度学习3

Oracle_Data_Integrator应用指南

Sequence-Models-coursera:安德鲁·伍（Andrew Ng）在Coursera上的序列模型。 编程作业和测验解决方案

基于python的使用TensorFlow实现的Sequence to Sequence的聊天机器人模型项目源码

笔记：动手学深度学习pytorch（机器翻译，Transformer，注意力机制和Sequence to sequence模型）

自然语言处理.zip

精通hibernate：对象持久化技术孙卫琴第二版part2

精通Hibernate：对象持久化技术第二版part3

freemarker总结

Oracle8i_9i数据库基础

Activiti6.0教程例子下载

并行程序设计导论课后答案_2.7z

加速度积分求速度和位移的c语言算法程序

数据结构课设用C、C++写旅游区景点导游系统头文件(用文件存储，DFS，DIJ算法），完全免费！没有要积分，能多给我点点赞吗？

DeepLearning之LSTM模型输入参数：time_step, input_size, batch_size的理解

Vulkan编程指南.pdf

Sequence-Models-coursera:安德鲁·伍（Andrew Ng）在Coursera上的序列模型。编程作业和测验解决方案