# text_match
全球人工智能技术创新大赛(赛道三: 小布助手对话短文本语义匹配)
https://tianchi.aliyun.com/competition/entrance/531851/introduction
基于BERT finetune和logistic regression的ensemble方法
第一阶段:基于bert-base-chinese的预训练参数,固定除了bert.embeddings.word_embeddings之外的部分,用训练+测试集做mask位置的预测,专门学习token embedding。
第二阶段:在上一步的基础上,用多个不同的seed生成的随机划分,[CLS]预测句子二分类是否相关,mask位置继续做预测,进行finetune。
第三阶段:提取[CLS]的隐状态向量,拼接上tf-idf、bm25等各种向量,用LR预测结果,然后ensemble。
好家伙VCC
- 粉丝: 2306
- 资源: 9142
最新资源
- 基于web的在线学习管理系统设计与实现
- 基于JavaWeb的汽车租赁平台论文.doc
- 基于javaweb的KTV点歌管理系统论文.doc
- 预警插件-Fine-report11
- 建设项目现场高温人员中暑事故应急预案.docx
- 建设项目工程超高层测量放线控制方案.docx
- 建筑公司建设项目现场雷电事故应急预案.docx
- 建筑公司员工食物中毒事故应急预案.docx
- 建筑公司建设项目现场风灾事故应急预案.docx
- 建筑集团建设项目火险应急预案.docx
- 深圳建设施工项目物体打击事故应急预案.docx
- 深圳建设项目高处坠落事故应急预案.docx
- 深圳建设项目机械伤害事故应急预案.docx
- 深圳建设项目施工现场各类事故应急预案.docx
- 深圳建设项目现场触电应急预案.docx
- 深圳建设项目坍塌事故应急预案.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈