指令数据集(DINO :sauropod: )
该存储库包含的代码。 本文介绍了从在structiø纳秒(DINO的方法称为d atasets :sauropod: ),使经过预训练的语言模型能够从头开始生成整个数据集。
:wrench: 设置
有关DINO的所有要求都可以在requirements.txt找到。 您可以使用pip install -r requirements.txt在新环境中安装所有必需的软件包。
:speech_balloon: CLI用法
单一文字
要为(单个)文本分类生成数据集,可以按以下方式使用DINO:
python3 dino.py \
--output_dir <OUTPUT> \
--task_file <TASK> \
--num_entries_per_label <N>
其中<OUTPUT>是将生成的数据集写入其中的目录, <TASK>是包含任务规范的JSON文件(请参阅
评论0
最新资源