GPT 的出现,不得不说是人类整个科技发展史上的里程碑。那么你知道 GPT 到
底有多聪明吗?它的边界在哪?我们这个系列将为您着重阐述这一点。
各种领域的数学建模
数学推理不仅仅是一种解决数学练习和问题的技能,它也是一种理解和交流各种
背景和情况的工具。在本文中,我们将评估 GPT-4 运用数学思想和技巧解决现实
世界问题的能力,其中一些问题不是严格意义上的数学,但需要定量思维。我们
在下文中展示了 GPT-4 是如何成功地为一个需要大量跨学科知识的复杂系统建
立一个可信的数学模型的,而 ChatGPT 却未能取得有意义的进展。
GPT-4 建立了一个数学模型,用于分析《星际争霸 2》职业选手在比赛中随时间变化的功率
费米问题。费米问题是数学建模问题的一种特殊类型。费米问题涉及对难以或无
法直接测量的数量或现象进行有根据的猜测,使用逻辑、近似和数量级推理。例
如,一些众所周知的费米问题是:"芝加哥有多少个 钢琴调音师?"和 "太阳峰
色的电场在其到达地球的过程中振荡了多少次?"。要解决这些问题,几乎不需
要额外的信息,它需要定量思维和一般知识。在此,我们展示了 GPT-4 在用定量
思维回答费米问题方面的杰出 能力。我们在下图中展示了两个例子,GPT-4 通
过层层合理的假设和有根据的猜测对它们进行尝试,而 ChatGPT 则立即承认失败,
几乎没有显示出数学思维的痕迹。尽管 GPT-4 的最终答案可能相差甚远,但它在
这些问题上表现出了令人印象深刻的攻击角度。