没有合适的资源?快使用搜索试试~ 我知道了~
提高ChatGPT可靠性的技术
需积分: 0 0 下载量 194 浏览量
2023-04-10
22:23:32
上传
评论
收藏 5.84MB PDF 举报
温馨提示
试读
28页
本文介绍了一些提高大型语言模型的一些技巧以提升可靠性
资源推荐
资源详情
资源评论
提高可靠性的技术
当 GPT-3 执行任务失败时,你应该怎么办?
寻找更好的提示以得出更可靠的答案?
投资数千个示例来微调自定义模型?
假设模型无法完成任务,然后继续?
没有简单的答案——这取决于情况。但是,如果您的任务涉及逻辑推理或复杂性,请考虑尝试本文中的技术
来构建更可靠、性能更高的提示。
为什么 GPT-3 在复杂任务上失败
如果你被要求将 13 乘以 17,你会立即想到答案吗?对于我们大多数人来说,可能不是。然而,这并不意味
着人类无法进行两位数的乘法运算。只需几秒钟和一些笔和纸,计算出 13 x 17 = 130 + 70 + 21 = 221 并不
太费力。
同样,如果你给 GPT-3 一个太复杂的任务,在它计算下一个标记所需的时间内无法完成,它可能会做出不正
确的猜测。然而,与人类相似,这并不一定意味着模型无法完成任务。有了一些时间和空间来推理,模型仍
然可以可靠地回答。
例如,如果您提出 text-davinci-002 以下关于杂耍球的数学问题,它会错误地回答:
这是否意味着 GPT-3 不能做简单的数学题?不; 事实上,事实证明,通过用 提示模型 Let's think step
by step ,模型可靠地解决了问题:
当然,仅凭一个例子很难判断这个 Let's think step by step 技巧是否在一般情况下确实有效,或者只是
在这个特定问题上走运。但它确实有效。在单词数学问题的基准测试中,这个 Let's think step by step
技巧大大提高了 GPT-3 的解决率,从毫无价值的 18% 提高到不错的 79%!
模型功能取决于上下文
在学习使用 GPT-3 时,一个常见的概念错误是认为它的功能在所有情况下都是固定的。例如,如果 GPT-3
答错了一个简单的逻辑问题,那么它一定无法解决简单的逻辑问题。
问:杂耍演员有 16 个球。 一半的球是高尔夫球,一半的高尔夫球是蓝色的。 有多少个蓝色高尔夫球?
A:有 8 个蓝色高尔夫球。
问:杂耍演员有 16 个球。 一半的球是高尔夫球,一半的高尔夫球是蓝色的。 有多少个蓝色高尔夫球?
A:让我们逐步考虑。
一共有16个球。
一半的球是高尔夫球。
这意味着有 8 个高尔夫球。
一半的高尔夫球是蓝色的。
这意味着有 4 个蓝色高尔夫球。
但正如 Let's think step by step 示例所示,GPT-3 的明显故障有时可以通过更好的提示来纠正,从而帮
助模型引导自己朝着正确的输出方向发展。
如何提高复杂任务的可靠性
本文的其余部分分享了提高大型语言模型在复杂任务上的可靠性的技术。尽管某些技术特定于某些类型的问
题,但其中许多技术都是建立在可应用于广泛任务的一般原则之上的,例如:
给予更明确的指示
将复杂任务拆分为更简单的子任务
构建指令以保持模型执行任务
在回答之前提示模型解释
询问许多可能答案的理由,然后综合
生成许多输出,然后使用模型选择最好的一个
微调自定义模型以最大化性能
将复杂的任务拆分成更简单的任务
给模型更多时间和空间思考的一种方法是将任务分解成更简单的部分。
例如,考虑一个任务,我们向模型询问有关某些文本的多项选择题——在本例中,是一个线索游戏。当直接
询问时, text-davinci-002 无法将线索 3 和 5 放在一起,并且回答错误:
尽管线索 3 和 5 确定了上校 Mustard 是天文台中唯一的人并且天文台中的人拥有烛台,但模型无法将
它们组合成 (a) 是的正确答案。
但是,我们可以将任务分为三部分,而不是直接询问答案:
首先,一条一条地过一遍线索,考虑线索是否具有潜在相关性
第二、结合相关线索推理出问题的答案
根据以下线索回答下列多项选择题。
线索:
1. 斯嘉丽小姐是休息室里唯一的人。
2.拿烟斗的人在厨房里。
3. 穆斯塔德上校是天文台里唯一的人。
4. Plum 教授既不在图书馆也不在台球室。
5.拿着烛台的人在天文台。
问题:穆斯塔德上校拿着烛台在天文台吗?
(a) 是; 穆斯塔德上校拿着烛台在天文台
(b) 否; 穆斯塔德上校不在天文台拿着烛台
(c) 未知; 没有足够的信息来确定穆斯塔德上校是否带着烛台在天文台
解决方案:
(c) 未知; 没有足够的信息来确定穆斯塔德上校是否带着烛台在天文台
第三,写下最终答案:(a)、(b) 或 (c)
通过给模型更多的时间和空间来思考,并按照推理计划引导它,它能够找出 (a) 是的正确答案。
将复杂指令拆分为更小的子任务的另一个好处是,它可以帮助让模型专注于每个子任务。
例如,如果我们要求 text-davinci-002 用原始语言对文本进行总结,模型可以回归为英语:
使用以下线索,按照以下步骤回答以下多项选择题:
(1) 首先,一条一条地梳理线索,考虑线索是否具有潜在相关性
(2)其次,结合相关线索推理出问题的答案
(3) 第三,将答案映射到多项选择答案之一:(a)、(b) 或 (c)
线索:
1. 斯嘉丽小姐是休息室里唯一的人。
2.拿烟斗的人在厨房里。
3. 穆斯塔德上校是天文台里唯一的人。
4. Plum 教授既不在图书馆也不在台球室。
5.拿着烛台的人在天文台。
问题:穆斯塔德上校拿着烛台在天文台吗?
(a) 是; 穆斯塔德上校拿着烛台在天文台
(b) 否; 穆斯塔德上校不在天文台拿着烛台
(c) 未知; 没有足够的信息来确定穆斯塔德上校是否带着烛台在天文台
解决方案:
(1) 首先,一条一条地梳理线索,考虑线索是否具有潜在相关性:
线索 1:斯嘉丽小姐是休息室里唯一的人。 这条线索无关紧要。
线索 2:拿着烟斗的人在厨房里。 这条线索无关紧要。
线索 3:穆斯塔德上校是天文台里唯一的人。 这个线索是相关的。
线索 4:普拉姆教授既不在图书馆也不在台球室。 这条线索无关紧要。
线索 5:拿着烛台的人在天文台。 这个线索是相关的。
(2)其次,结合相关线索推理出问题的答案:
线索3和线索5都说拿烛台的人在天文台。 天文台里只有穆斯塔德上校一个人,所以拿烛台的人就是穆斯塔德上校。
(3) 三、写出最终答案:
(a) 是; 穆斯塔德上校拿着烛台在天文台
但是,如果我们先让模型识别文本的语言,然后再对文本进行总结,就会变得更可靠:
使用文本的原始语言总结文本。 摘要应该是一句话长。
Text:
"""
La estadística (la forma femenina del término alemán Statistik, derivado a su vez
del italiano statista, "hombre de Estado")• es una ciencia que estudia la
variabilidad, colección, organización, análisis, interpretación, y presentación de
los datos, así como el proceso aleatorio que los genera siguiendo las leyes de la
probabilidad.• La estadística es una ciencia formal deductiva, con un conocimiento
propio, dinámico y en continuo desarrollo obtenido a través del método científico
formal. En ocasiones, las ciencias fácticas necesitan utilizar técnicas estadísticas
durante su proceso de investigación factual, con el fin de obtener nuevos
conocimientos basados en la experimentación y en la observación. En estos casos, la
aplicación de la estadística permite el análisis de datos provenientes de una
muestra representativa, que busca explicar las correlaciones y dependencias de un
fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
"""
Summary:
文本解释说,统计学是一门研究数据的可变性、收集、组织、分析、解释和呈现,以及按照概率法则生成数据的随
机过程的科学。
首先,确定文本的语言。 其次,用课文原文概括课文。 摘要应该是一句话长。
Text:
"""
La estadística (la forma femenina del término alemán Statistik, derivado a su vez
del italiano statista, "hombre de Estado")• es una ciencia que estudia la
variabilidad, colección, organización, análisis, interpretación, y presentación de
los datos, así como el proceso aleatorio que los genera siguiendo las leyes de la
probabilidad.• La estadística es una ciencia formal deductiva, con un conocimiento
propio, dinámico y en continuo desarrollo obtenido a través del método científico
formal. En ocasiones, las ciencias fácticas necesitan utilizar técnicas estadísticas
durante su proceso de investigación factual, con el fin de obtener nuevos
conocimientos basados en la experimentación y en la observación. En estos casos, la
aplicación de la estadística permite el análisis de datos provenientes de una
muestra representativa, que busca explicar las correlaciones y dependencias de un
fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
"""
Language:
在回答之前提示模型解释
另一个提高答案可靠性的强大技术是促使模型逐渐推理出答案,而不是立即跳到最终答案。通过“大声思
考”,模型更有可能得出正确答案。
零射击
方法
由Takeshi Kojima 等人出版。在 2022 年,提示模型推理出答案的最简单方法是简单地在答案前添加 Let's
think step by step. 图 2 说明了一个示例:
资料来源:Takeshi Kojima 等人的*Large Language Models are Zero-Shot Reasoners *(2022)
结果
将这个简单的技巧应用于 MultiArith 数学数据集,作者发现 Let's think step by step 准确度翻了四
倍,从 18% 到 79%!
Spanish
La estadística es una ciencia que estudia la variabilidad, colección, organización,
análisis, interpretación, y presentación de los datos, así como el proceso aleatorio
que los genera siguiendo las leyes de la probabilidad.
剩余27页未读,继续阅读
资源评论
AE86Jag
- 粉丝: 43
- 资源: 18
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功