恕我直言，很多小样本学习的工作就是不切实际的.pdf资源-CSDN文库

版权申诉

187 浏览量 2023-08-12 22:16:21 上传评论收藏 2.35MB PDF 举报

：“恕我直言，很多小样本学习的工作就是不切实际的.pdf” ：本文探讨了小样本学习的现状，指出许多现有方法在实际应用中的局限性，特别是过度依赖大型验证集进行参数调整和prompt选择的问题。【部分内容】分析：小样本学习（Few-shot Learning）是一个热门的机器学习领域，它旨在解决在有限数据条件下训练模型的问题。传统的小样本学习方法通常需要一个大规模的训练集，然后在测试时使用少量样本进行预测。然而，这种设定与现实世界中的小样本场景相去甚远，因为在实际应用中往往缺乏大量的训练数据。随着GPT3等大模型的出现，小样本学习的思路发生了转变。研究人员开始利用预训练模型，仅用几条或几十条样本进行finetune，这种方式更接近现实中的小样本学习需求。Prompt技术在此过程中起到了关键作用，通过设计特定的finetune任务形式，将与任务相关的提示信息引入模型，以更好地利用预训练模型的结构和先验知识。尽管基于prompt的方法在减少训练数据量方面取得了进展，但NYU、Facebook和CIFAR的研究人员指出，即使这种方法也不是真正的小样本学习，因为它们仍然依赖大型验证集进行prompt选择和调参。真正的“True Few-Shot Learning”应该既没有额外的数据分布辅助，也没有大量的训练或验证数据，因为获取标注数据的成本高昂。论文提出了True Few-Shot Learning的概念，并对比了几种小样本学习情况，包括传统的有大量数据的有监督学习、Multi-Distribution Few-Shot、Tuned Few-Shot以及True Few-Shot。作者质疑了在没有足够验证数据的情况下，如何有效地调整模型参数。为此，他们提出了两种策略：k折交叉验证（CV）和类似在线学习的交叉验证（MDL）。这两种方法试图在训练集和验证集之间找到平衡，最小化样本损失的差异，以实现更好的模型泛化能力。实验结果显示，无论模型大小，使用CV和MDL方法选择prompt都能在LAMA数据集上得到一定的效果。LAMA是一个评估语言模型知识提取能力的数据集，通过比较不同prompt，研究发现这些方法在限制验证集的情况下仍能有效改善模型性能。本文对当前小样本学习方法进行了批判性的反思，强调了在资源有限的环境下进行模型优化的挑战，并提出了新的交叉验证策略以适应真正的True Few-Shot Learning。这一研究对于推动小样本学习理论的发展和实际应用具有重要意义，未来的研究应更加关注在有限资源条件下的模型学习能力和泛化性能。

资源推荐

资源详情

资源评论

恕

我

直

⾔

，

很

多

⼩

样本

学

习

的

⼯

作

就

是

不

切

实

际

的

⽂

𝕚𝕧𝕖𝕟

编

⼩

轶

以

前

的

⼩

样本

学

习

（

Few-shot Learning

），

是

需

要

⽤

⼀个

巨

⼤

的

训

练

集

训

练

的

。

测

试

时

只

给

出

n-way k-shot

，

在

这

N * k

个

样本

上

学

习

并

预

测

。

我

第

⼀

次

看

到

这

种

任

务

设

定

的

时

候

真

是

⾮

常

失

望

：

这

和

现

实

情

况

的

需

求

也

相

差

太

远

了

！

真

实

场

景

下

的

⼩

样本

学

习

，

哪

有

⼤

量

的

训

练

数据

呢

？

从

GPT3

开

始

，

学

术

界

开

启

了

⼀个

新

的

⼩

样本

⻛

潮

。

借

助

预

训

练

模

型

，

⼈们

只

给

出⼏

条

或

⼏

⼗

条样本

作为

训

练

集

，

⽤

⼩⼩

训

练

集

进

⾏

finetune

。

看

到

这

些

⼯

作

，

我

觉

得

这

样

才

是

真

正

的

⼩

样

本

学

习

！

最

近

有

⼀

些

⼯

作也

在

这

种

任

务

设

定

下

取

得

了

不

错

的

进

展

。

所

谓

prompt

，

就

是

结

合

具

体

场

景

，

设

计

新

的

finetune

任

务

形式

，

从

⽽

将

与

当

前

任

务

相

关

的

提

示

信

息

（

prompt

）

引

⼊

模

型

，

以

此

更

好

地

利

⽤

预

训

练

模

型

的

结

构

与

先

验

知

识

。

我

们

⼤

名

鼎鼎

的

GPT

系

列

就

是

这

么

⼲

的

。

⽐

如

我

们

拿

GPT3

做

的

finetune

，

直

接

喂

给

他

⼀

串

“Question

：

问题

内

容

Answer

：

”

，

剩

下

的

答

案

部

分

就

让

GPT3

⾃

⼰

填

完

。

𝕚𝕧𝕖𝕟

2021-06-16

12:05

原

创

夕

⼩

瑶

的

卖

萌

屋

剩余7页未读，继续阅读

评论收藏

内容反馈

版权申诉

普通网友

粉丝: 1272
资源:
5619

恕我直言，很多小样本学习的工作就是不切实际的.pdf

恕我直言，很多小样本学习的工作就是不切实际的.rar

小样本情况基于深度学习的水下目标识别研究.pdf

阿里小样本学习参考论文.pdf

恕我直言，你的实验结论可能严重依赖随机数种子！ .pdf

恕我直言，你的模型可能并没看懂 prompt 在说啥.pdf

直言判断及其结构与种类.pdf

一年级拼音故事 小乌龟找工作.pdf

恕我直言，你的模型可能并没看懂 prompt 在说啥.rar

恕我直言，你的实验结论可能严重依赖随机数种子！ .rar

2021上中学教资系统班—综合素质9—逻辑1.18.pdf

刷题 行测易错题刷题营.pdf

电子商务直言式标题例子.pdf

退休老教师直言：初中数学,牢记这28种题型,孩子3年都稳居前三!.pdf

国外交流必备的英语句子借鉴参考.pdf

施工现场安全管理工作认识.pdf

坚强独立名言语录.pdf

暑假作业：初中语文古诗文名句.pdf

我的伯父鲁迅先生1-.pdf

恕我直言，你的shell脚本你根本没学好1

我的奋斗目标作文450字,小升初.pdf

如何对老板表忠心.pdf

道德与法治全册单元测试卷及答案.pdf

邮政营销员高级考试题.pdf

新版小学四年级道德与法治上册期末考试题加答案.pdf

浅谈如何用创新理念开展工会工作.pdf

2021年人教版四年级上册《道德与法治》期中考试题【附答案】.pdf

部编版四年级道德与法治上册期末考试题附答案.pdf

架构师（2019年3月）.pdf

餐饮考试试题借鉴.pdf

最新资源

一年级拼音故事小乌龟找工作.pdf

刷题行测易错题刷题营.pdf