2023/6/28 11:12
又一恐怖技能!卡耐基梅隆大学发布超强智能体,炸翻科研圈
https://mp.weixin.qq.com/s/ZeKau9til_Lya2NCEXHbiA
1/12
又一恐怖技能!卡耐基梅隆大学发布超强智能体,炸翻科研圈
文 | 小 戏
一名普通博士生的工作日常是什么?上 网 查 查 资 料 ? 读 读 文 献 ? 根 据 各 种 完 善 工 具 的 API
或 者 文 档 写 两 行 代 码 , 然 后 再 输 给 实 验 机 器 完 成 高 精 度 的 实 验 ?仔细思考一下我们这些所
谓“科研工作者”的工作流,却细思极恐的发现,我们现在能做的事儿,好像大部分 GPT-4 都能
做!
小戏 2023-04-14 12:06 发表于四川
原创
夕小瑶科技说
2023/6/28 11:12
又一恐怖技能!卡耐基梅隆大学发布超强智能体,炸翻科研圈
https://mp.weixin.qq.com/s/ZeKau9til_Lya2NCEXHbiA
2/12
终于,“ 机器取代打工人”的预言来到了科研领域,最近,卡 耐 基 梅 隆 大 学 化 学 工 程 系 的 学 者
构 建 了 一 个 基 于 大 规 模 语 言 模 型 ( LLMs) 的 自 主 科 研 智 能 体 ( 尚 且 没 有 给 他 命 名 , 且 叫
他 小 A) , 实 现 了 一 个 可 以 从 自 主 设 计 、 规 划 到 执 行 复 杂 的 科 学 实 验 的 完 整 系 统 。
单谈一体化,自动化巴拉巴拉显得有点抽象,小A究竟可以做到什么事呢,举个例子,来看下
面 这 张 图 , 假 设 我 希 望 设 计 一 个 可 用 于 执 行 铃 木 反 应 ( Suzuki Reaction ) 和 薗 头 耦 合 反 应
(Sonogashira Reaction)的方案如下图 A 模块所示,论 文 作 者 给 小 A 提 供 了 一 系 列 溶 液 与
试 剂 以 及 必 要 的 操 作 设 备 , 但 是 并 没 有 告 诉 小 A 具 体 应 该 选 择 哪 一 个 溶 液 与 试 剂 完 成 反
应 。并且颇为阴险的,论文作者要求小 A 使用 Heater Module 智能加热模块,但是这个模块
其实是在 GPT-4 训练数据截止日后发布的。
2023/6/28 11:12
又一恐怖技能!卡耐基梅隆大学发布超强智能体,炸翻科研圈
https://mp.weixin.qq.com/s/ZeKau9til_Lya2NCEXHbiA
3/12
来让我们看小A做了什么,可以注意一下,我们给小A的输入事实上只要“完成xx反应”这么一句
简单的 P rompt。因此,小 A首 先 开 始 从 互 联 网 上 搜 索 所 需 反 应 、 它 们 的 化 学 计 量 和 条 件 的
信 息 等 等 , 这 些 过 程 被 记 录 在 上 图 D 模 块 中 。通过搜索,我们可以看到小A选择了相应正确
的反应试剂。在所有的芳基卤化物中,它选择了卤代苯对铃木反应进行偶联,选择了碘代苯对
薗头耦合反应进行偶联。值得注意的是,这些选择结果来源于搜索,因此这种行为在每次运行
2023/6/28 11:12
又一恐怖技能!卡耐基梅隆大学发布超强智能体,炸翻科研圈
https://mp.weixin.qq.com/s/ZeKau9til_Lya2NCEXHbiA
4/12
时都会发生变化,这事实上赋予了小A重复实施不同试验方案以获取更多更有意义信息的可能
性。
在 小 A 完 成 对 不 同 试 剂 、 催 化 剂 的 选 择 后 , 小 A使 用 Python 计 算 了 具 体 实 验 中 所 有 反 应
物 所 需 要 的 体 积 、 容 量 等 信 息 , 并 且 编 写 完 成 了 试 验 方 案 。这个试验方案将以执行代码的
方式输入给配备给小A的操作设备,如上图 E 模块所示,使得操作设备可以自动的执行小A设
计的试验。
而 最 有 趣 的 是 , 在 论 文 作 者 给 小 A 挖 坑 的 地 方 , 小 A 确 实 犯 了 一 个 错 误 , 它 错 误 的 使 用 了
Heater Module 智能加热模块的名称。这导致了这个名称与下游设备说明文档里的名称的不匹
配,当 小 A意 识 到 这 个 错 误 时 , 小 A 查 阅 了 文 档 并 及 时 改 正 了 自 己 的 错 误 ! 从 而 成 功 的 运
行 了 自 己 输 出 的 代 码 。
这套异常“合理”的工作流程,加上神奇的自我纠错的功能,老实说已经不单单是一体化,自动
化那么简单了。回想知乎里那些有关“生化环材”的吐槽,很多无非都是在说进实验室干着“烧炉
子,养耗子,过柱子”的活,但 如 果 小 A真 能 得 以 普 及 , 那 将 很 大 程 度 上 完 成 从 琐 碎 工 作 中
解 放 ( 取 代 ) 科 研 工 作 者 的 目 标 。
那么小A究竟是如何 拥有 完成上述一整套 操作 的功能的呢?让 我们 一起进入这篇可 谓“ 未来 时
代”先锋号的论文。
论 文 题 目 :
EmergentAutonomousScientific Research Capabilities of Large Language Models
论 文 链 接 :
https://arxiv.org/abs/2304.05332
系统架构
首先来让我们详细看一下小A的整体架构,智 能 体 系 统 ( 小 A) 主 要 由 四 个 组 件 组 成 , 分 别
是 “网 络 搜 索 器 ”、 “文 档 搜 索 器 ”、 “代 码 执 行 器 ”以 及 “自 动 化 模 块 ”。如果把这四个模块比喻
为小A的四肢,那么“规划器”(Planner)相当于小A的大脑,用来接受人类输送给小A的任务描
述 Prompt ,并协调四个组件分别按需完成工作。在论文中,规 划 器 本 身 就 可 以 理 解 为 一 个
GPT-4, 规 划 器 的 协 调 、 推 理 、 判 断 、 决 策 等 等 能 力 均 是 来 源 于 GPT-4 的 无 穷 潜 力。相比
于“大脑”,其余的动作执行就会简单许多在每一个特定状态,小A其实只有四种动作选择,分
别是:
访问互联网,接入 Google 进行查询操作