没有合适的资源?快使用搜索试试~ 我知道了~
腾讯&阿里&携程面试题汇总(精华版).pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 24 浏览量
2024-03-27
16:37:40
上传
评论
收藏 399KB PDF 举报
温馨提示
试读
6页
腾讯&阿里&携程面试题汇总(精华版)
资源推荐
资源详情
资源评论
阿
里
一
面
没打招呼突击电话面试(30min)
地点ok?时间ok?(base杭州,暑期,全部okokok)简单自我介绍一
下,项目经历选一个说说?
项目中对于没有标签的数据,怎么处理,还有什么别的方法?(我用的远
程监督,别的还有one-shotzero-shotlabelembedding)
假设一个情景题,微博创立初期,短文本,10w数据集,无监督,分类怎
么做(我答的用labelembedding做或者用embedding+聚类kmeans)
embedding怎么实现?(fasttextorword2vec,不能用BERT,数据量
大不合适)补充:你说的是词向量,句子向量怎么做呢(+averagepooling最
常用,还有别的方法没列举)
除了你说的方法,还有别的方法可以吗?U-learning听说过吗?(没听
清?啥learing?这个真不知道,只听说过Q-learning)
kmeans的k怎么选择,这么做效果好吗?为什么?(k不知道,具体情况
具体分析吧(编不出来了),效果不好)
那如果不用聚类,别的方法怎么做,提示:抽取关键字(关键字抽取可以
用词与句子做相似度匹配)
按你说的做不具有通用性,那如果是长文本,又怎么做,有什么区别(长
文本用词频统计+停用词过滤)
你没回答出我想要的答案,因为一个微博可能属于多个类别(多类别无监
督分类)
快排知道吗?稳定不?(不稳定,因为会交换顺序)
bagging、boosting知道吗?(知道,属于ensemble,叽里哇啦叽里哇
啦)
用啥语言,用啥框架(python,pytorch)
反问:实习时间?
反问:表现如何?
个人体会:面试官人超好,很客气。感觉工程能力还有待提高,很多东西
还是停留在理论上。kmeans自己挖的坑,无语了。。。后面问了大佬,这个情
景题可能是LDA之类的主题模型,或者是手动标记数据,再训练。或者是用迁
移学习。
资源评论
凛鼕将至
- 粉丝: 4379
- 资源: 272
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功