腾讯&阿里&携程面试题汇总（精华版）.pdf_enginemodulesareoutofdate资源-CSDN文库

版权申诉

24 浏览量 2024-03-27 16:37:40 上传评论收藏 399KB PDF 举报

资源推荐

资源详情

资源评论

阿

里

一

面

没打招呼突击电话面试（30min）

地点ok？时间ok？（base杭州，暑期，全部okokok）简单自我介绍一

下，项目经历选一个说说？

项目中对于没有标签的数据，怎么处理，还有什么别的方法？（我用的远

程监督，别的还有one-shotzero-shotlabelembedding）

假设一个情景题，微博创立初期，短文本，10w数据集，无监督，分类怎

么做（我答的用labelembedding做或者用embedding+聚类kmeans）

embedding怎么实现？（fasttextorword2vec，不能用BERT，数据量

大不合适）补充：你说的是词向量，句子向量怎么做呢（+averagepooling最

常用，还有别的方法没列举）

除了你说的方法，还有别的方法可以吗？U-learning听说过吗？（没听

清？啥learing？这个真不知道，只听说过Q-learning）

kmeans的k怎么选择，这么做效果好吗？为什么？（k不知道，具体情况

具体分析吧（编不出来了），效果不好）

那如果不用聚类，别的方法怎么做，提示：抽取关键字（关键字抽取可以

用词与句子做相似度匹配）

按你说的做不具有通用性，那如果是长文本，又怎么做，有什么区别（长

文本用词频统计+停用词过滤）

你没回答出我想要的答案，因为一个微博可能属于多个类别（多类别无监

督分类）

快排知道吗？稳定不？（不稳定，因为会交换顺序）

bagging、boosting知道吗？（知道，属于ensemble，叽里哇啦叽里哇

啦）

用啥语言，用啥框架（python，pytorch）

反问：实习时间？

反问：表现如何？

个人体会：面试官人超好，很客气。感觉工程能力还有待提高，很多东西

还是停留在理论上。kmeans自己挖的坑，无语了。。。后面问了大佬，这个情

景题可能是LDA之类的主题模型，或者是手动标记数据，再训练。或者是用迁

移学习。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余5页未读，立即下载

内容反馈

版权申诉

凛鼕将至

粉丝: 4379
资源: 272

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip