"李星:从ChatGPT的诞生中我们学到了什么"
李星在论文中探讨了ChatGPT的诞生对人工智能领域的影响。他认为,ChatGPT是一个崭新的起点,对语言模型的理论基础进行了深入的分析,并探讨了人工智能发展的历程。
一、ChatGPT的理论基础
ChatGPT是一种大语言模型(Large Language Model),它基于next token prediction和masked language modeling两种语言模型。Next token prediction是指单向推导,即知道最前面的话,一步步推导出后面的话,每次推导时都找最有道理的一个字,从而递归串出一整句话。另一种则是先确定开头结尾的内容,据此去推测中间的内容。
二、ChatGPT与“无限猴子定理”
ChatGPT可以说是一只升级版的、讲逻辑、懂道理的猴子。“无限猴子定理”认为,让一只猴子在打字机上随机地按键,当按键时间达到无穷时,猴子几乎必然能够打出任何给定的文字。ChatGPT的选择则是基于模型运算,把大概率有用的字词留下,无用的字词撇去,从而得到一句符合人类逻辑的话。
三、人工智能发展的历程
人工智能的发展历程大概可分为三个阶段。1950年,图灵最早提出了人工智能的概念,他在论文中直截了当地提问,“机器是否可能具有人类智能?”开创了人工智能领域的先河。1997年,IBM的超级计算机“深蓝”以2胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里·卡斯帕罗夫,一时间轰动全球。再后来,机器学习算法如雨后春笋般涌现,包括线性回归法、逻辑回归法、决策树法、随机森林法、最近邻居法、贝叶斯法、支持向量机法、k均值法、强化学习法等,每一个新算法都是对旧算法的改进与提升。
四、机器学习的三类方式
机器学习中主要有三类学习的方式,分别是监督式学习、非监督式学习和强化学习。监督学习是从外部监督者提供的带标注训练集中进行学习(任务驱动型)。非监督式学习则是一个典型的寻找未标注数据中隐含结构的过程(数据驱动型)。强化学习则会告诉模型自身好不好,给予模型更大的探索自由,从而突破监督式学习的天花板。
五、深度学习
深度学习的基础是神经网络,即通过模拟人的神经元系统做出判断。神经网络有输入层、输出层和隐含层,输入通过非线性函数的加权后得到了最终的输出,而我们要做的就是根据误差准则调整权重参数,不需要、也不可能完全知道这些参数选择的具体原因。深度学习的基础是神经网络,可以多加一些隐含层,以更好地刻画现实。
ChatGPT的诞生对人工智能领域的影响是巨大的,它拓宽了我们的思路,给予我们新的灵感。我们可以从ChatGPT的成功中学习到很多东西,理解出什么,都值得进一步分析。