关于ChatGPT的五个最重要问题.pdf资源-CSDN文库

网络

人工智能

需积分: 1 3 浏览量 2023-05-29 15:55:29 上传评论收藏 3.07MB PDF 举报

资源推荐

资源详情

资源评论

关于 ChatGPT 的五个最重要问题

我们判断，如果 ChatGPT 不犯大错，两年之内，整个科技行业甚至人类社会都会被颠覆一

遍。倒计时已经开始了。

在 ChatGPT 纪元中，提问题的能力和判断力也许是人类最重要的两个能力。我们这里提出五

个关键问题，并且试图抛开网络上的二手观点，做出基于原理的判断。

 更详细的科普文可以参考这篇：了解 AIGC 中的 ChatGPT 和 LLM

 其中包含如何在公司快速便捷地使用 ChatGPT

 针对中台业务场景的应用：ChatGPT 在中台业务应用的可能性与探索

这篇文章会尽量用准确的说明与类比（如何区分准确的类比和偷换概念的类比）去解读技术。

但是对于这样一个非常新、非常颠覆、大家对原理和应用都还没形成共识的技术，不了解技术

细节就去打比方，难免信口开河。所以我们会先尽量无损地把需要的技术细节都盘清楚，然后

再去进行抽象和提取本质。

哪五个问题？

1. 是什么：ChatGPT 是范式突破吗？和过往 AI 有什么不同？

2. 会怎样：ChatGPT 两年内会达到什么水准？

3. 行业格局：ChatGPT 以及 GPT 有壁垒吗？

4. 如何参与：我们未来应该如何使用 ChatGPT？

5. 人文：人类和 ChatGPT 的本质区别是什么？对人类社会的冲击？

还有一个不需要讨论的重要问题：ChatGPT 不会开源的，因为 AGI 是一个危险品。国内那些依

赖开源+抄的公司可以死心了。指望原子弹开源吗？

我们搞清楚这五个问题，就能判断市面上大多数解读 ChatGPT 的观点，无论从技术、商业、

投资，等等角度，是否靠谱了。其实就两个关键

1. 对 ChatGPT 新能力的认知：这新能力是什么，有什么意义？

2. 对“能力获取难度”的认知：ChatGPT 如何获得的？难度有多大？

文章结尾我们会做一下总结。让你下次见到某大模型，可以判断这是 ChatGPT 的 80%还是

技术讲解环节：“自回归”“大语言模型”是两个关键词

 自回归的意思是，我先用模型预测下一个词是什么，然后把预测出来的词带入模型，去预

测再下一个词是什么，不断迭代。这是过往语言模型的通用范式。也能让各类语言类任务

统一成“生成式”任务

 大语言模型是因为 GPT 的海量数据与参数。大语言模型本身也值得技术科普一下，我们在

第一个问题中展开

大佬们都认可 AGI 的重要意义，但是对于 ChatGPT 是不是有“范式突破”，是不是 AGI，有重大

分歧。大佬们无法形成共识，我们有两种选择，一种是做“early-adoptor”，早期采用者（特点

是懂技术，有 vision，想通过技术带来巨大改变），去在体验和探索中形成自己的观点；一种是

做“early-mass”，早期大众（特点是厌恶风险，希望追求确定的改善），等着标准成熟，应用也

有定论，再去采用。作为中台，我们需要抓住 IEG early-adoptor 的身份。所以我们需要在纷杂

的信息中形成自己的理解和主张。

这次讨论就想达到这个目的。数科和算法同学会保证信息的准确，知之为知之不知为不知，但

是观点、主张、区别、共识，需要老板们自己推演出。

开头：ChatGPT 的最基本版历史

虽然想直接开始问题，但是一定程度的技术科普还是必要的。这样能在思考问题的时候更加高

效。我们着重参考两篇综述，尽量抓重点：

1. 大语言模型技术精要（链接）

2. ChatGPT 的各项超能力从哪里来（链接）

第一份综述主要讲了大语言模型发展中的关键技术突破，第二份综述主要讲了 ChatGPT 发展

过程中的几个重要模型“做到了什么”和“有什么与众不同的做法”。我们把两篇文章的重点挑出

来，标注一下里程碑事件，和其意义。

事件

意义

Transformer 问世

让深度学习模型可以“自由吸

收”数据中的知识

大语言模型突破了参数和算力限制，从此语言模型也进入

参数越多，数据越大，模型效果越好的时代。

LLM 内战，逐渐吊打老 NLP

Google 的 Bert 路线和

OpenAI 的 GPT 路线各有所长

GPT 通过“自然语言生成任务”，兼容了几乎所有 NLP 问

题；但是 Bert 比 GPT2 表现好。此时大语言模型已经开始

吊打传统 NLP 模型了

GPT3 问世

展示 in-context learning 能

力，简单调教下就能吊打精

调过的很多模型

一方面让 GPT 模式初现一统江湖的潜质，一方面 GPT3 的

in-context learning 能力，展示了和过往 ML 的 fine-

tuning 模式的本质区别，我们在下面单独详细展开

- InstructGPT

ChatGPT 的交互模式，让

GPT 的能力，更加贴近人类

真实交互方式

在 in-context learning 基础之上，进一步降低了

prompting 的门槛；一定程度解决了 GPT-3 生成结果与用

户期望不一致的非预期输出，大幅降低了有害的、错误或

偏差的输出结果，让 GPT 更符合人类胃口

- GPT 读代码

代码训练能力的提升是 GPT3

到 GPT3.5 的重要迭代之一，

模型可从而可以生成代码和

理解代码

Codex 模型读了大量代码，之后的 GPT3.5 模型涌现出了

inference 的能力。不光能读懂和生成代码，对语言本身

的理解和推理能力也解锁了

- RLHF

ChatGPT 背后的核心技术之

一，让模型学习人类的偏好

全称是 reinforcement learning from human feedback，通

过构建人类反馈数据集，训练一个 reward 模型，模仿人

类偏好对结果打分，是 GPT-3 后时代 LLM 越来越像人类

对话的核心技术

ChatGPT

InstructGPT 的亲戚，但一些

优化方式也带来了 ChatGPT

的更泛化和准确能力，再次

引爆了 AIGC

ChatGPT 总体来说和 InstructGPT 一样是使用 RLHF 进行训

练，但模型是基于 GPT3.5，而且数据设置上也不同。

ChatGPT 是一个输入，模型给出多个输出，然后人给结果

排序，让模型可以学习人类的排序策略，即使是一本正经

的胡说八道看起来也很合理的样子。

这里面再强调一个关键点。GPT3 之后，很多能力是“涌现”的。即不是线性发展，可预测的，

而是突然就有了。至于这对于 OpenAI 的人是早晚会发生，还是完全未预料，我们就不知道

了。这几个“涌现”出的能力，尤其是 inference 的能力，是 ChatGPT 和过往 AI 的范式不同，

也会是我们这次讨论关注的重点。“涌现”也是大语言模型很神奇的一点，这些能力我们发现模

型随着数据量和模型大小的提升，就突然具备了，但是我们对这些能力怎么出现的，只有猜

想，没有共识。这篇文章有一个比较全面的总结和比较。

剩余27页未读，继续阅读

评论收藏

内容反馈

Wis57

粉丝: 304
资源: 450

关于ChatGPT的五个最重要问题.pdf

关于ChatGPT的五个最重要问题1.pdf

关于ChatGPT的五个最重要问题 2023最新.pdf

ChatGPT从入门到精通.pdf

ChatGPT从入门到精通-压缩版.pdf

如何向ChatGPT提问以获得高质量答案.pdf

《ChatGPT中文版提示词手册，学完工作效率提升百倍！.pdf》

ChatGPT从入门到精通（保姆级教程）.pdf

Exploring the Power of ChatGPT 9781484295281.pdf

ChatGPT使用方法、公司团建活动项目策划案例分析.pdf

行业研究：SAM，机器视觉领域的ChatGPT.pdf

人工智能行业：GPT4及ChatGPT相关应用梳理-报告汇(vicsdf.com).pdf

ChatGPT4.0论文（中文）-开放的人工智能.pdf

ChatGPT对保险业发展的利弊之析及应对之策.pdf

人工智能专题研究（一）：ChatGPT的出现有望加速我国在人工智能领域政策的出台.pdf

提示技巧工程完全指南 .pdf

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

HAI-2024斯坦福AI指数报告（中文译版）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

4个亲测好用的ChatGPT4渠道

民宿网站

AI在工程咨询领域的应用及挑战研究.pdf

学术海报模板+论文科研+研究生

北森能力测评题库.zip

chrome-win64.zip

最新资源