单项选择题:
注意力机制(Attention)的主要用途是什么?
A. 优化模型训练速度
B. 提高模型准确率
C. 选择重要的信息并忽略不相关的信息
D. 改进模型的可解释性
答:C
Transformer 模型是基于什么理论构建的?
A. 递归神经网络(RNN)
B. 卷积神经网络(CNN)
C. 注意力机制(Attention)
D. 自组织映射(SOM)
答:C
GPT 和 BERT 的主要区别是什么?
A. GPT 是基于 Transformer 的,而 BERT 不是
B. BERT 是基于 Transformer 的,而 GPT 不是
C. GPT 使用了单向自注意力,而 BERT 使用了双向自注意力
D. GPT 和 BERT 在基本结构上没有区别
答:C
在注意力机制中,“Q”、“K”和“V”分别代表什么?
A. 查询、密钥和值
B. 查询、键入和验证
C. 快速、关键和验证
D. 问题、知识和视觉
答:A
Transformer 模型是如何解决长距离依赖问题的?
A. 通过递归神经网络(RNN)
B. 通过卷积神经网络(CNN)
C. 通过注意力机制(At