喜欢此内容的⼈还喜欢
近期神奇机器学习应⽤⼤赏
⽂ | ⽩鹡鸰给⼩轶讲了个笑话
编 | ⼩轶发出哈哈哈哈的声⾳
⼤家好久不⻅呀这⾥是你们的⽩鹡鸰,不知道各位有没有想我反正我是有想各位了~由于各种
⼤⼈的原因,最近在卖萌屋存在感不⾼。虽然还要再等⼀段时间才能搞事情,但是,在⽇常的
刷⽂章过程中,⽩鹡鸰实在是被整乐(yue)了,于是忍不住提前爬上来众乐乐⼀波。
众所周知,Arxiv本质上是⼀个预注册研究想法的⽹站,优点是⽂章更新⼜多⼜快,缺点是⽂
章质量良莠不⻬,全得靠⼈⾁分辨。今天的主题就是最近⽩鹡鸰看到的⼀些Arxiv上机器学习
领域有趣的⽂章,⽆论它们的质量如何,那研究内容实在是真的独特到让⼈忍不住多看⼀眼。
基于卷积神经⽹络的⻢匹情感识别
Emotion Recognition in Horses with Convolutional Neural Networks
https://arxiv.org/abs/2105.11953
“您了解⻢吗?您关⼼⻢吗?这位朋友,请允许我⽤⼏分钟的时间,向您介绍⼀下基于卷积神
经⽹络的⻢的⾯部表情识别模型。”
两位来⾃MIT的朋友⼋成是期末要交AI⼤作业了,硬⽣⽣搞出了这么个玩意⼉。没有专业⼈⼠
⽀持的标注,400张图⽚的训练集和80张图⽚的验证集,就提⼀个问题——为什么要上CNN
呢?迫击炮打蚊⼦⼤概就是指这种情况吧。他们还特地做了个交互界⾯,上传图⽚,哦,是⼀
匹好奇的⻢。厉害,厉害。然⽽,我不关⼼⻢,我⽬前⻅到的会关⼼⻢的情绪的也只有你们
俩,好了,下⼀个。
基于视觉的猪对新鲜事物的偏好⾏为识别
Vision-based Behavioral Recognition of Novelty Preference in Pigs
https://arxiv.org/abs/2106.12181
⼈的悲欢并不相通,但脑回路可能产⽣共鸣。UIUC不同专业的同学们,联合起来!动物学农
业学再加上⼀个计算机的,他们的课题是猪对新事物的认知情况。标了⼏段视频,然后,
LRCN。就报告内容⽽⾔,看起来⽐做⻢脸识别的那⼀组专业⼀点,好⽍还知道调⼀调预训练
模型的参数,结果可视化也还可以,如果我是动物⾏为学课程的⽼师应该能给个A+。不过,仔
细想想这⼀组的分⼯,怎么都有点后背发凉。
⼈⼯智能,让孩⼦的数学学习“减负”!
FINNger -- Applying Artificial Intelligence to Ease Math Learning for Children
https://arxiv.org/abs/2105.12281
为什么会变成这样呢……明明数学是快(diao)乐(fa)的,机器学习也是快(diao)乐(fa)的,两件
快乐事情重合在⼀起,得到的,本该是像梦境⼀般幸(tu)福(ding)的时间……但是,为什么,
会变成这样?让幼⼉园⼩朋友学编程难不难我不知道,但好⽍教材还是⼈写的,但这拿机器学
习来教数学,还真就不是⼈⼲事了,啊!
这篇论⽂的实质是⼿势识别,在⼩朋友做完计算题之后,图像识别检查正确答案。但是,这应
⽤背景真的太迷惑了,我把⾃⼰带⼊了⼀下⼩朋友,如果都学会了加减乘除这样抽象的逻辑思
维,写⼏个数字必然不在话下,何必还要⽤⼿指来⽐划呢?⽽作者宣称的“这是⾯对⽋发达地
区的教育⼿段”也不成⽴,因为这样的教育仪器做出来,成本绝对⾼于⼈⼯,对操作者的教育
⽔平也有所要求,根本不是⽋发达地区负担得起的。这个动机简直透着⼀股“何不⻝⾁糜”的味
道。
基于机器学习和⾃然语⾔处理的MBTI⼈格预测
Extending the Abstraction of Personality Types based on MBTI with Machine
Learning and Natural Language Processing
https://arxiv.org/abs/2105.11798
看着⽂中罗列的机器学习⽅法,让⼈回忆起了被综述类⼤作业⽀配的恐惧。当你对要综述的学
科和相关⼯作理解不够深刻时,⽆论⼀篇⽂章与这⻔学科的实质任务有什么关联,都只能胡乱
复述⼀遍好凑字数。然⽽,本科⽣⽔⽔报告还可以理解,⼀个国际⼼理学协会的成员还这样泄
洪就离谱了呀。针对特定领域的数据驱动型研究,对数据集的特征没有描述和总结,对任务没
有定义和限制。Logic Regression与BERT⻬⻜,SVM与LSTM共⼀⾊。如果是回顾型⼯作,
就该介绍⼀下过往的相关研究;如果是开创型⼯作,那好⽍也该说明应⽤的算法的合理性。然
⽽,翻开论⽂⼀看,这密密麻麻⼏⼗⻚的没个重点,结论更是迷迷惑惑,横竖看了半天,原来
全篇都写着两个字:“灌⽔”!
基于机器学习的⾯部⻣骼⽣⻓预测
Prediction of the Facial Growth Direction with Machine Learning Methods
https://arxiv.org/pdf/2106.10464
通过⼈在幼年时期头⻣的形状,预测其成年时⾯相的变化。其实这个⼯作挺有价值的,⽐如说
对⾛失⼉童、⽆名⼫体的鉴别,或者医美⽅⾯都⽤得上,说不定还能给中国传统⽂化之算命提
供⼀定的可解释性。但是,这个模型建不建得出来出来要打个问号:如果以头⻣的数据作为输
⼊,那这个任务隐含的假设是⼩时候⻓相相似的⼈在成⻓过程中⾯部变化的倾向也会相似,⽽
实际上,基因、成⻓环境、⽣活习惯等因素都对⼈的⻓相有重要的影响。此外,如果真的想为
这个任务建⼀个数据集,那么⼗年左右的数据采集周期是必不可少的。只能说,祝研究者好运
:)
▲a)中是头⻣的⼀些特征点标注,b)和c)分别是头⻣横向/纵向⽣⻓的图例。
利⽤深度学习的⾜球防守⾏为效果评估
What Happened Next? Using Deep Learning to Value Defensive Actions in
Football Event-Data
https://arxiv.org/abs/2106.01786
欧洲杯期间发篇深度学习+⾜球防守的⽂章听起来还是很合理的。今天研究防守中具体⾏为的
效果,明天说不定就能做防守策略,再过⼀阵⼦,四舍五⼊就可以不⽤请⾜球教练了,这可真
是节约经费的好办法。不过这个任务中,最难的应该是收集球员的数据,毕竟不同的⼈在应对
局势时的选择是不⼀样的,想准确预测个体⾏为建议输⼊端多加⼏个博弈模型。此外,⼈在极
限情况下的爆发⼒是难以预计的,为了增加系统的稳定性,建议未来的⾜球⽐赛将⼈换成机器
⼈,从⽽⽅便控制数值上限。不过好像这样⼀来还是不够简便,不如直接在计算机⾥做⼏个⼈
物模型跑跑VR⾜球⽐赛——
体育⽐赛就是⽤来挑战⼈类极限的娱乐活动,正搁这⼉玩的起劲
呢,⾮要⽤精密的计算破坏这种参与感,⽖巴
。
家居装潢必备神经⽹络
Style Similarity as Feedback for Product Design
https://arxiv.org/pdf/2105.12256
“我要⽤神经⽹络来搞设计。”
“呃……”
“设计的是装修⻛格。”
“好耶!”
“设计装修⻛格的本质是识别图⽚。”
“呃……”
“可以给⽤户推荐特定⻛格的家具产品。”
“……”
这⼤概就是我在看论⽂的时候的⼼情波动。⽼实说,这个想法还挺诱⼈的,如果只需要输⼊户
型,地理位置,想要的装修⻛格,计算机就能⾃动帮你⽣成装修⽅案,甚⾄还找好装修⽅案⾥
所有商品的购买途径。那么这个世界上应该会少很多类似于⻔⼝放⼈俑,屋顶吊画檐的装修事
故。然⽽,理想是美好的,现实是惨烈的,⽂章的开头吹上了天,⽽实际功能只是⻛格识别
+相似推荐,和装修限定版的电商推荐算法没什么本质区别,实在是欺骗感情。
基于深度神经⽹络的⾮侵⼊式电⼒负载监控
More Behind Your Electricity Bill: a Dual-DNN Approach to Non-Intrusive Load
Monitoring
https://arxiv.org/pdf/2106.00297
乍⼀看,⽩鹡鸰还以为这篇⽂章是讲通过电费评估信贷能⼒的,还暗笑莫不是“不想查电表的
研究⼈员不是好⾦融⼤佬” 。然⽽,实际上这是正⼉⼋经⽤电表波动估计家电使⽤情况的研
究。本质是通过输出波形还原多个输⼊波的问题基于的原理是不同的电器耗电的波形和频率都
有各⾃独⽴的特征。虽然波的叠加是线性的,看起来没必要⽤机器学习。但是在正常情况下,
要知道每个家庭有哪些电器和这些电器在不同⼯作状态下的耗能模式显然不是⼀件合法的事情
(除⾮你真的⼲了什么要让⼈查电表的事情)。⽽且,⼀般来说,电⼒监控也不是针对任何个
体的⾏为,⽽是为了获得群体的⽤电习惯,从⽽更好地分配电⼒,需要处理的数据不仅量⼤还
具有多样性。因此,⽤DNN来做电⼒监控监控还是合理的。
当然,想想这项技术还可以⽤来检测个⼈的活动轨迹和⽣活习惯,还是有点令⼈⽑⻣悚然
的。
▲基于DNN还原的部分电器耗电模式
基于视觉的⻝物识别与⻝谱评估
A Review of the Vision-based Approaches for Dietary Assessment
https://arxiv.org/pdf/2106.11776
The Food Recognition Benchmark: Using DeepLearning to Recognize Food on
Images
https://arxiv.org/abs/2106.14977
不会吧不会吧,连图⽚识别⻝物式营养学都配拥有综述和benchmark了?看到这两篇⽂章的时
候,我的认知出现了⼀些动摇。即使我们身处在⼀个⼀道菜只拥有⼀份配⽅的世界,能⽤⼀模
⼀样的⽕候,做出份量完全⼀样的⻝物,请问⽕腿和⼈⼯⾁怎么区分?⻓得像樱桃的红酒鹅肝
⼜该怎么处理?更别提,最近开始流⾏⽤草莓做成的⻓得像草莓的⻰吟草莓了。
即使能够解决
靠图⽚估计⻝物重量的问题
,图⽚这种单⼀模态的输⼊也完全⽆法提供⾜够⽤来确认⻝物品种
的信息啊。如果说,这个任务追求的只是粗糙的⻝物品种识别和单位重量内热量范围估计,好
吧,当我没说。但是这⼀点点的估计失误,⼏百卡的热量可能就吃进去了,这可令⼈放⼼不下
啊。
▲⾼贵的⻰吟草莓闪耀着⾦钱的光芒
来之不义的⼈脸数据集
Indian Masked Faces in the Wild Dataset
https://arxiv.org/abs/2106.09670
拿⼀个新发布的数据集作为压轴,是想说两件事:
1. 作为研究者,请注意道德底线。
2. 作为普通⼈,请注意保护隐私。
这篇⽂章的作者认为他们提供了⼀个具有多样性的⾯部有遮挡数据集,是在为新冠时期带⼝罩
的⾯部识别任务提供帮助。⽽我认为,这群作者为了⽔⽂章丢掉了他们底线。他们在未经授权
的情况下,从Instagram上下载了他⼈的⾃拍图像,⽽基于这些数据提出的挑战,却未必是⼀
个有价值的任务。事实上,⼈脸识别技术已经⽐较成熟,⽤⾃⼰带⼝罩的样⼦多刷刷屏幕,⼿
机已经能学会⾃动解锁。可以说,这项技术的上限基本已经摆在那⾥了,实装效果只和软硬件
配置条件有关。在这种情况下,为了发篇⽂章侵犯他⼈隐私,这种⾏为必须谴责。另⼀⽅⾯,
这也说明了社交平台上发⾃拍确实是⼀件有⻛险的事情,这批研究者还只是拿脸来学学模型,
万⼀哪天⾃拍被⽤来FakeGAN了,哦呵呵呵呵呵呵。
最后的话
与往期各种nb到闪闪发光的推⽂不同,今天的故事是围绕Arxiv上更能代表世界的参差——甚
⾄是下限的那批⽂章展开的。有许许多多的⼯作,在假设没有说清楚,问题价值没有评估好的
情况下,就稀⾥糊涂地开⼯了。他们的作者可能是迫于课程压⼒、或者学位要求,制造了⼀堆
创新性⽋缺,实验不充分的⽂本,还勇⽓可嘉地投放到了Arxiv上分享。不过,祸兮福兮,他
们的⽂章凑巧被浪⾏⻜翔的⽩鹡鸰看到了,于是,⾄少拿来奇⽂共欣赏,成功吸引到与原本⽂
章质量不符的关注度了(⼿动滑稽)。
最后,请⼤家注意:
Arxiv有⻛险,刷⽂需谨慎!
萌屋作者:⽩鹡鸰
⽩鹡鸰(jí líng)是⼀种候⻦,天性决定了会横跨很多领域。已在上海交⼤栖息四年,进⼊了名
为博⼠的换⽑期。⽬前以图像语义为⻝,但私下也对⾃然语⾔很感兴趣,喜欢在卖萌屋轻松不
失严谨的氛围⾥浪~~形~~⻜~~翔~~
知乎ID也是⽩鹡鸰,欢迎造访。
作品推荐:
1. NLP太卷,我去研究蛋⽩质了~
2. ⾕歌40⼈发表59⻚⻓⽂:为何真实场景中ML模型表现不好?
3. 学术&⼯业界⼤佬联合打造:ML产品落地流程指南
寻求报道、约稿、⽂案投放:
添加微信xixiaoyao-1,备注“商务合作”
后台回复关键词【⼊群】
加⼊卖萌屋NLP/IR/Rec与求职讨论群
后台回复关键词【顶会】
获取ACL、CIKM等各⼤顶会论⽂集!
若被制裁,中国AI会雪崩吗?
夕⼩瑶的卖萌屋
微信扫⼀扫
关注该公众号
⽩鹡鸰 2021-07-05 12:05
原创
夕⼩瑶的卖萌屋