人类最厉害的莫过于缜密的大脑,而现在,有研究表明,这一人类最后的堡垒或将被攻破。
研究人员已经开发出第一种非侵入性的方法来确定内在言语(inner speech)的要点,为不能说
话的人提供了一个可能的沟通渠道。
在一项开创性的研究中,科学家们利用类似 ChatGPT 的生成式预训练转换器(GPT)人工智能
模型,通过功能性磁共振成像(fMRI)记录,被动解码人类思想,准确率高达 82%。
大多数现有的思维转语言技术使用大脑植入物,监测一个人运动皮层的活动并预测嘴唇试图
形成的词语。但神经科学家希望使用非侵入性技术,如 fMRI,来破译内在言语,而不需要
手术。
现在,研究人员通过将 fMRI 监测神经活动的能力与人工智能语言模型的预测能力相结合,
向前迈出了一步。
为了理解思维背后的实际含义,美国德克萨斯大学奥斯汀分校的计算机科学家 Alexander
Huth 和 Jerry Tang 及其同事将功能性磁共振成像(fMRI)与被称为大型语言模型(LLM)的人工智
能算法结合起来。大型语言模型是 ChatGPT 等工具的基础,经过训练可以预测一段文本中的
下一个单词。
在 5 月 1 日发表于《自然-神经科学》的这项研究中,科学家们让 3 名志愿者躺在 fMRI 扫描
仪中,记录下他们每人听 16 个小时播客时的大脑活动。
通过测量志愿者大脑的血流量,并将这些信息与他们所听故事的细节以及大型语言模型理解
单词之间关系的能力相结合,研究人员开发了一个编码图谱,描绘了每个人的大脑对不同单
词和短语的反应。
接下来,研究人员记录了参与者在听故事、想象讲故事或观看不含对话的电影时的 fMRI 活
动。
研究人员将他们之前为每个人编码的模式和确定一个句子可能如何基于其他单词构建的算
法结合起来,试图对这种新的大脑活动进行解码。
结果发现,GPT 人工智能模型从感知言语、内在言语甚至无声视频中生成了可理解的单词序
列,准确率非常高:
◆感知言语(受试者听播客):解码准确率 72-82%。
◆内在言语(受试者在脑海中叙述一分钟的故事):准确率为 41-74%。
- 1
- 2
前往页