【免费】大模型自动生成SFT指令总结资源-CSDN文库

需积分: 0 141 浏览量更新于2024-02-06 收藏 2.06MB PDF 举报

自动生成指令 Self-Instruct 1. Self-Instruct 数据生成流程 2. 生成任务指令 3. 确定指令是否代表分类任务 4. 生成任务输入和输出 5. 过滤低质量数据 6. 参考资料 ### 大模型自动生成SFT指令总结 #### 1. Self-Instruct 数据生成流程 Self-Instruct 是一种利用大规模预训练语言模型自动生成任务指令的方法。这种方法的核心在于它能够不断迭代地生成高质量的指令和相应的输入输出数据。下面详细介绍Self-Instruct数据生成的具体流程： - **初始化指令池**：手动构建一个小型指令数据集合，这个集合包含了175个任务指令，用于初始化指令池。这些任务指令涵盖了各种类型的任务，包括但不限于文本生成、分类等。 - **生成新指令**：接下来，从指令池中随机抽取8个任务指令（其中6条来自初始的人工编写指令，2条是模型迭代生成的，最开始时由于没有模型生成的指令，因此会直接从初始的175条指令中随机选取8条）。这些指令被用作上下文示例，用于引导预训练语言模型GPT-3生成更多的新任务指令。 #### 2. 生成任务指令在生成任务指令的过程中，涉及到了几个关键步骤： - **构造上下文示例**：从指令池中随机抽取的8个指令被拼接为上下文示例。 - **生成新指令**：使用这些上下文示例引导GPT-3生成新的指令。 - **迭代生成**：这一过程会持续进行，直到模型自己停止生成新的指令，或者达到长度限制，或者是单步中生成了过多的示例。 #### 3. 确定指令是否代表分类任务生成的指令需要经过进一步的判断，以确定它们是否代表了分类任务。对于分类任务，通常需要明确的类别标签和输入。因此，如果判断出某个指令是分类任务，则需要进一步生成类别标签和输入数据。 - **分类任务判断**：通过对模型生成的指令进行分析，确定其是否属于分类任务。 - **生成类别标签与输入**：如果是分类任务，则通过模型输出类别标签和输入数据。 #### 4. 生成任务输入和输出对于非分类任务，需要生成相应的输入和输出数据。这些数据用于训练和评估模型的效果。 - **生成输入**：对于非分类任务，需要生成合适的输入数据。 - **生成输出**：根据输入数据，模型需要生成对应的输出数据。 #### 5. 过滤低质量数据为了确保数据的质量，需要对生成的数据进行过滤，去除低质量的数据点。 - **质量检查**：通过一系列的质量标准，对生成的数据进行检查。 - **数据过滤**：根据检查结果，过滤掉不符合要求的数据点。 - **后处理**：对过滤后的数据进行必要的后处理操作，确保数据的准确性和一致性。 #### 6. 参考资料 Self-Instruct方法的相关参考资料可以提供更深入的理解和技术细节。 - **技术论文**：查阅相关的技术论文，了解Self-Instruct方法的设计原理和技术实现。 - **开源代码库**：参考Self-Instruct项目的开源代码库，了解具体的实现细节和应用案例。 - **社区讨论**：参与社区的讨论，了解其他研究者对该方法的看法和应用经验。 Self-Instruct是一种高效且自动化的生成任务指令的方法，它通过迭代的方式不断优化生成的数据质量，从而提高模型的性能。这种方法不仅适用于自然语言处理领域，还可能扩展应用于其他领域的任务指令生成。

⾃

动

⽣

成指

令

elf

nstru

.

elf

nstru

数据

⽣

成

流

程

.

⽣

成

任

务

指

令

.

确

定

指

令

是

否

代

表

分

类

任

务

.

⽣

成

任

务

输

⼊

和

输

出

.

过

滤

低

质

量

数据

.

参

考

资

料

具

有

代

表

性

的

⼯

作

如

Self-Instruct

，

利

⽤

⼤

模

型

的

⽣

成

能

⼒

⾃

动

⽣

成指

令

。

Self-instruct

数据

⽣

成

过

程

是

⼀个

迭

代

引

导

算

法

。

Self-Instruct

数据

⽣

成

流

程

⽣

成

instruction

提

示

数据

with open(os.path.join(args.batch_dir, "machine_generated_instruction

s.jsonl"), "a") as fout:

while len(machine_instructions) < args.num_instructions_to_generat

batch_inputs = []

for _ in range(args.request_batch_size):

# sample machine instructions from the pool

（

从

⽣

成

模

型

中

选

，

表

示

最

少

的

条

数

。

这

⾥

为

prompt_instructions = sample_machine_instructions(

machine_instructions,

similarities=None,

n=2)

# sample human instructions from the pool

从

默

认

的

175

条

中

选

再

选

⼏

条

，

相

当

于

⼀

共

选

了

条

，

其

中从

175

条

中

选

条

，

使

⽤

LLM

⽣

成

条

（

最

开

始

的

时

候

，

machine_instructions

为

空

，

因

此

会

直

接

从

175

条

中

直

接

选

条

）

prompt_instructions += random.sample(seed_instructions, ar

gs.num_prompt_instructions - len(prompt_instructions))

random.shuffle(prompt_instructions)

prompt = encode_prompt(prompt_instructions, classification

=args.use_clf_seed_tasks_only)

batch_inputs.append(prompt)

results = make_gpt3_requests(

engine=args.engine,

prompts=batch_inputs,

max_tokens=1024,

temperature=0.7,

top_p=0.5,

frequency_penalty=0,

presence_penalty=2,

stop_sequences=["\n\n", "\n16", "16.", "16 ."],

logprobs=1,

n=1,

best_of=1,

api_key=args.api_key,

organization=args.organization,

)

instructions = []

all_metadata = []

for result in results:

new_instructions = post_process_gpt3_response(result["resp

onse"])

instructions += new_instructions

Python

剩余20页未读，继续阅读

资源推荐

资源评论

dreampai

粉丝: 4
资源: 6

大模型自动生成SFT指令总结

大模型+自动生成问答对

中文对话0.2B小模型开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部

中文对话0.2B模型，开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全码

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码

训练医疗大模型，实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)

大语言模型浅探一.pdf

大语言模型浅探谈，包括GPT模型、RWKV模型

盘点国内热门AI大模型.docx

大语言模型提示词工程原理及最佳实践-郑昊pdf.pdf

高效定制 大型语言模型 (LLM).pdf

llama3-中文微调训练集，让llama3更懂中文

ChatGPT的原理分析

ChatLM-mini-Chinese-main.zip

收录现实中文版ChatGPT的各种技术路线，数据及其他资料

ChatGPT_InstructGPT详解 - 知乎.pdf

sfg-pet-clinic:SFT宠物诊所

stable-diffusion部署需要的包

大规模语言模型：从理论到实践

Notepad++ 8.5.6最新版 64位安装包

人工智能大模型介绍.pptx

diabetes糖尿病数据集

21个免费无限制免登录chatgpt资源， OpenAI GPT-4\3.5 模型的智能对话链接

libomp140.x86-64.dll

ChatGPT智能AI机器人微信小程序源码-带部署教程

int201 Decision Computation and Language xjtlu 复习笔记

transformer代码

线性代数-同济大学第七版

Matlab深度学习工具箱

基于Qwen2.5-7B-Instruct的大模型微调实战指南

最新资源

高效定制大型语言模型 (LLM).pdf