# text_match
全球人工智能技术创新大赛(赛道三: 小布助手对话短文本语义匹配)
https://tianchi.aliyun.com/competition/entrance/531851/introduction
基于BERT finetune和logistic regression的ensemble方法
第一阶段:基于bert-base-chinese的预训练参数,固定除了bert.embeddings.word_embeddings之外的部分,用训练+测试集做mask位置的预测,专门学习token embedding。
第二阶段:在上一步的基础上,用多个不同的seed生成的随机划分,[CLS]预测句子二分类是否相关,mask位置继续做预测,进行finetune。
第三阶段:提取[CLS]的隐状态向量,拼接上tf-idf、bm25等各种向量,用LR预测结果,然后ensemble。
好家伙VCC
- 粉丝: 1968
- 资源: 9137
最新资源
- 将一个单链表{a1,b1,a2,b2……an,bn}拆分成 {a1.a2…an}和{bn.bn-1.……b1}.html
- 中国电子学会2024年9月份 机器人 Scratch Python c++编程各级别真题
- 【java毕业设计】社区医院管理服务系统源码(springboot+vue+mysql+说明文档+LW).zip
- 内网穿透技术natapp,免费的,简单实用
- 【java毕业设计】人职匹配推荐系统源码(springboot+vue+mysql+说明文档+LW).zip
- 【java毕业设计】springboot基于java的电缆行业生产管理系统(springboot+mysql+说明文档).zip
- C#面向对象编程大作业,银行管理系统.zip(源码+db文件)与数据库的增删改查,sqlite
- 【java毕业设计】springboot房屋租赁系统(springboot+vue+mysql+说明文档).zip
- 【java毕业设计】人事管理系统源码(springboot+vue+mysql+说明文档+LW).zip
- 基于MATLAB车牌识别设计源码【含界面GUI】.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈