对
⽐
学
习
有
多
⽕
?
⽂
本
聚
类
都
被
刷
爆
了
…
⽂
|
花
⼩
花
Posy
⼤
家
好
,
我
是
⼩
花
。
对
⽐
学
习
的
⼤
⽕
🔥
越
来
越
旺
了
,
已
然
从
CV
蔓
延
到
NLP
了
。
今
天
给
⼤
家
介
绍
的
正
是
⼀
篇
将对
⽐
学
习
应
⽤
到
⽂
本
聚
类
上
的
⼯
作
,
NAACL21
新
鲜
出
炉
的
paper——
《
Supporting Clustering with Contrastive
Learning
》。
该
⼯
作
在
8
个
短
⽂
本
聚
类
数据
集
上
取
得
了
显
著
提
升
(
⽐
如
正
确
率
提
升
3%~11%)
。
所
谓
对
⽐
学
习
,
重
点
在
于
对
⽐
,
那
对
⽐
的
对
象
是
谁
?
答
⽈
:
增
强
的
数据
。
假
设
如
果
两个
增
强
句
⼦
的
原句
⼦
⼀
样
,
那
么
拉
近
它
们
,
否
则
推
远
它
们
。
在
CV
领
域
,
对
⽐
学
习
是
和
携数据
增
强
⼀
起
出
道
的
。
给
定
⼀
张
图
⽚
,
⽣
成
不
同
的
变
体
去
增
强
它
,
然
后
⽤
对
⽐
思
想
去
学
习
。
NLP
领
域
也
如
法
炮
制
。
给
⼀个
句
⼦
,
使
⽤
数据
增
强
去
⽣
成
和原句
⼦
语
义
相
似
的
句
⼦
。
⽐
如
下
⾯
的
例
⼦
[1]
:
如
果
两个
增
强
句
⼦
来
⾃
同
⼀个
原句
⼦
,
那
么
它
们
是
同
源
的
,
否
则
是
不
同
源
的
。
本
⽂
发
现
,
利
⽤
对
⽐
学
习
的
特
性
,
即
拉
近
同
源
句
⼦
、
拉
远
不
同
源
句
⼦
,
可
以
解
决
短
⽂
本
聚
类
问题
中
⼀个
令⼈
头
疼
的
问题
——
如
果
学
习
过
程
开
始
时
,不
同
类
别
在
表
示空
间
中
就
彼
此
重
叠
,
那
么
不
管
怎
么
学
习
都
很
难
将
各
个
类
别
区
分
开
。
下
图
是
原
⽂
中
对
⽐
的
原
始
数据
的
分
布
(Original)
和
使
⽤
聚
类
(
Clustering
)
模
型
学
习
后
的
分
布
。
花
⼩
花
P
osy
2021-04-22
22:20
原
创
夕
⼩
瑶
的
卖
萌
屋