ChatGPT 开发商 14 日在官方部落格宣布推出 GPT-4,使用微软(Microsoft)的
Azure 公用云端服务平台进行训练,跟过去的版本相比规模更庞大。这代表该模
型受过更多资料训练、模型档案更具份量,营运成本也更昂贵。
此外,OpenAI 宣称,GPT-4 在许多专业测试的表现已「可媲美人类」 (human-level
performance)。
OpenAI 表示,GPT-4 生成的答案错误更少、正确性比 GPT-3.5 高 40%,也较不会
超脱常轨、大聊禁忌话题,在许多标准化测验的表现甚至比人类优秀。值得注意
的是,GPT-3.5 及 GPT-4 闲聊时差别虽不大,但若任务够复杂,GPT-4 比 GPT-3.5
更可靠、有创意且能处理更多微妙指令。
根据 OpenAI 说法,GPT-4 可在律师资格考试击败 90%人类、在国际生物奥林匹
亚(Biology Olympiad)击败 99%高中生。事实上,GPT-4 在至少 34 种涵盖总经、写
作、数学等领域的测验皆名列前茅。