CHATGPT原理浅析.rar资源-CSDN文库

共1个文件

doc：1个

需积分: 1 16 浏览量 2023-04-15 11:59:24 上传评论收藏 2.87MB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

package

CHATGPT 原理浅析.rar （1个子文件）

CHATGPT 原理浅析.doc 3.13MB

ChatGPT 是基于 GPT(Generative Pre-Trained Transformer)自然语言处理模型的

多模态聊天机器人。

ChatGPT 核心是基于 RNN、LSTM、Attention、Transformer 模型演进发

展而来的，通过自监督学习(SSL, Self Supervised Learning)预训练、监督学

习优调(Fine Tuning)、强化学习实现非监督学习训练的自然语言处理的大语

言模型(LLM, Large Language Model)。

RNN(Recurrent Neural Network)、LSTM(Long Short Term)是早期的循

环网络模型，Attention 是机器翻译、问答等 Seq2Seq 场景下用于对输入与

输出 Tokens 进行对齐的方法，Transformer 是基于 Self-Attention 机制，

通过对输入 Tokens 进行语境关联改进 Seq2Seq 实现的模型。

自监督学习基于对部分数据自动生成标签来训练模型学习另一部分数据的特

征，可用于机器视觉、自然语言处理模型预训练。

随着多模态(Multi-Modal)技术的发展，ChatGPT 自然发展为多模态大语言

模型(MLLM, Multi-modal Large Language Model)，该模型可以通过文字、

图片等形式实现与外部的交互。

在作为大规模语言模型的训练时，GPT 先基于自监督学习自动预训练模

型，再基于监督学习利用人工方法实现对预训练后的 GPT 模型的优调

(Fine-Tuning)；然后用优调后的模型预测答案，再经过人工后打分训练

强化学习中的奖励模型(Reward Model)；之后基于 GPT 模型的策略模

型生成答案，用训练的奖励模型作为价值函数对答案打分，然后，再基

于打分更新策略模型参数。基于第二及第三步，循环更新模型。

自然语言处理基础

一、循环神经网络(RNN)

循环神经网络(RNN)是早期处理序列化数据或时序数据的神经网络框架，通过记

住之前的信息，结合当前的输入信息，预测输出，可以用于解决语言翻译、语音

识别等问题。

循环神经网络框架及在时间轴展开的形式。

[图片来自网络]

循环神经网络的权重矩阵。

[图片来自网络]

循环神经网络类型。

[图片来自网络]

二、长短期记忆神经网络(LSTM)

作为普通循环神经网络的改进，通过输入门、输出门、遗忘门来控制信息，解决

上下文依赖过远的问题，缓解梯度消失问题。

[图片来自网络]

双向长短期记忆神经网络，通过之前的信息及未来的信息对当前状态或输出进行

预测，以提高预测的准确性。

[图片来自网

络]

三、门控循环单元(GRU)

与长短期记忆神经网络近似，通过重启(Reset)门及更新(Update)门控制信息的

内容反馈

程序袁小子

粉丝: 53
资源: 754

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip