大语言模型面试题，校招面试必备，给自己面试增加成功的概率_大模型面试八股文资源-CSDN文库

版权申诉

5星 · 超过95%的资源 79 浏览量 2023-08-23 11:17:30 上传评论收藏 81KB DOC 举报

资源推荐

资源详情

资源评论

一、大模型常识面

1.1 简单介绍一下大模型【LLMs】？

大模型：一般指 1 亿以上参数的模型，但是这个标准一直在升级，目前万亿参数以上的模型也有了。大语言模型（Large Language

Model，LLM）是针对语言的大模型。

1.2 大模型【LLMs】后面跟的 175B、60B、540B 等指什么？

175B、60B、540B 等：这些一般指参数的个数，B 是 Billion/十亿的意思，175B 是 1750 亿参数，这是 ChatGPT 大约的参数规模。

1.3 大模型【LLMs】具有什么优点？

. 可以利用大量的无标注数据来训练一个通用的模型，然后再用少量的有标注数据来微调模型，以适应特定的任务。这种预训

练和微调的方法可以减少数据标注的成本和时间，提高模型的泛化能力；

. 可以利用生成式人工智能技术来产生新颖和有价值的内容，例如图像、文本、音乐等。这种生成能力可以帮助用户在创意、

娱乐、教育等领域获得更好的体验和效果；

. 可以利用涌现能力（Emergent Capabilities）来完成一些之前无法完成或者很难完成的任务，例如数学应用题、常识推理、

符号操作等。这种涌现能力可以反映模型的智能水平和推理能力。

1.4 大模型【LLMs】具有什么缺点？

. 需要消耗大量的计算资源和存储资源来训练和运行，这会增加经济和环境的负担。据估计，训练一个 GPT-3 模型需要消耗约

30 万美元，并产生约 284 吨二氧化碳排放；

. 需要面对数据质量和安全性的问题，例如数据偏见、数据泄露、数据滥用等。这些问题可能会导致模型产生不准确或不道德

的输出，并影响用户或社会的利益；

. 需要考虑可解释性、可靠性、可持续性等方面的挑战，例如如何理解和控制模型的行为、如何保证模型的正确性和稳定性、

如何平衡模型的效益和风险等。这些挑战需要多方面的研究和合作，以确保大模型能够健康地发展。

二、大模型强化学习面

2.1 简单介绍强化学习？

强化学习：（Reinforcement Learning）一种机器学习的方法，通过从外部获得激励来校正学习方向从而获得一种自适应的学习能力。

2.2 简单介绍一下 RLHF？

基于人工反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF）：构建人类反馈数据集，训练一个激励模型，模

仿人类偏好对结果打分，这是 GPT-3 后时代大语言模型越来越像人类对话核心技术。

三、大模型【LLMs】微调篇

3.1 大模型【LLMs】泛化问题？

泛化（Generalization）模型泛化是指一些模型可以应用（泛化）到其他场景，通常为采用迁移学习、微调等手段实现泛化。

3.2 大模型【LLMs】微调问题？

微调（FineTuning）针对大量数据训练出来的预训练模型，后期采用业务相关数据进一步训练原先模型的相关部分，得到准确度更高的

模型，或者更好的泛化。

通过在一个已经训练好的模型的基微调，可以让模型更专注于新任务或领域的特点，提高模型的性能和准确度。微调也可以让模型更容

易适应不同的输入输出格式，以及不同的评估指标。

3.3 大模型【LLMs】微调有哪些优点？

微调是一种常用的迁移学习方法，它可以利用预训练模型的通用知识，同时减少训练时间和数据需求。

在大语言模型上，微调是指在预训练好的大型语言模型基础上，针对特定任务进行额外训练。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余5页未读，立即下载

内容反馈

版权申诉

LIJIAN1239

2024-02-24

资源内容详实，描述详尽，解决了我的问题，受益匪浅，学到了。

xuxu1116

粉丝: 2w+
资源: 69

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip