蚂蚁金服比赛15th2632.zip资源-CSDN文库

共43个文件

py：25个

md：9个

xml：6个

需积分: 5 191 浏览量 2023-09-30 18:15:45 上传评论收藏 2.88MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

蚂蚁金服比赛15th2632.zip （43个子文件）

ATEC-NLP-master

.idea

ATEC-蚂蚁金服NLP.iml 398B

markdown-navigator

profiles_settings.xml 104B

vcs.xml 180B

misc.xml 317B

modules.xml 292B

encodings.xml 781B

markdown-navigator.xml 5KB

复赛

model

DIIN

SelfAteen.py 33KB

fusegate.py 33KB

char.py 36KB

README.md 239B

DRCN

AE.py 57KB

wordEmbFixed.py 33KB

GRU.py 64KB

cos-atten.py 60KB

WordChar.py 43KB

README.md 384B

2Layer.py 68KB

LanguageModel

LM.py 18KB

README.md 69B

DecomposeAttention

cnn-da.py 56KB

unique.py 72KB

unique-cnn.py 72KB

decomWordChar.py 62KB

decomChar.py 16KB

README.md 622B

ESIM

REAME.md 177B

esim.py 33KB

ShortCut

wordchar.py 46KB

README.md 58B

README.md 160B

初赛

features

charlevel_bow.py 9KB

dataset

atec_nlp_sim_train_add.csv 5.37MB

atec_nlp_sim_train.csv 3.32MB

xgboost_main.py 3KB

model

DSSM.py 11KB

SiameseLstm.py 5KB

CharAndPinyin.py 11KB

RnnCnn.py 11KB

README.md 368B

CharAndWord.py 11KB

script

split_data.py 945B

README.md 3KB

# ATEC-NLP 蚂蚁金服比赛 15th/2632 ATEC比赛是一次让人难忘的比赛，经常看到其他的小伙伴频频上分给自己带来的压力。这对我来说也是一次难得的学习机会，同时也有幸跟很多知名大佬同台竞技，其中的乐趣到现在还怀念。希望有机会能再遇到那些人，再比一次。比赛的总结写在了博客中 https://blog.csdn.net/cuihuijun1hao/article/details/82318792 目录中的代码很多都是我的尝试代码，以下是各个代码的数据表现初赛模型 | 线下F1 分数|线上提交 ------------ | -------------| ------------- CharAndPinyin.py | 0.52|未尝试 CharAndWord.py | 0.55| 0.638（融合） RnnCnn.py |0.53|0.61 DSSM.py | 0.33|0.41 xgboost_main.py | 0.27|未尝试复赛模型 | 测试集分数|线上提交 ------------ | -------------| ------------- Siamese+传统特征|0.698|0.7008 复赛模型（DecomposeAtteintion） | 测试集分数|线上提交 ------------ | -------------| ------------- cnn-da.py | 0.683|未尝试 decomChar.py |0.685| 未尝试 decomWordChar.py | 0.688|0.7006(单模型) unique.py | 0.682|未尝试 unique-cnn.py | 0.685|未尝试注意：DRCN模型测试集分数是从初赛数据中随机挑出3万个数据进行的实验，因为那个时候比赛时间不多了，线上排队时间太长，所以拿小数据进行了实验。复赛模型（DRCN） | 测试集分数|线上提交(A榜)|线上提交（B榜） ------------ | -------------| -------------|------------- 2layer.py | 0.591|0.7129（单模型）|0.7218(模型融合) AE.py |不收敛| 未尝试|未尝试 cos-atten.py | 0.564|未尝试|未尝试 GRU.py | 无记录，但是记得效果不好|未尝试|未尝试 WordChar.py | 0.582|0.7086|未尝试 WordEmbFixed.py|0.546|未尝试|未尝试注意：这次比赛中，并没有给ESIM模型足够的重视，就跑了一次就没再调，后来知道其他队伍都是靠这个模型上分的，心里也是比较遗憾。所用的数据也是初赛数据随机挑出的3万条复赛模型（ESIM） |测试集分数 ------------ | ------------- esim.py | 0.56 注意：DIIN 模型比赛最后一天写的，对应分数都线上训练数据测试集数据。复赛模型（DIIN） |线上测试集分数 ------------ | ------------- char.py | 0.71 fusegate.py |0.64 SelfAtten.py | 0.68 模型融合|测试集分数|提交分数 ------------ | -------------| ------------- Siamese 传统特征 + Descompose Atten Word Char + DRCN Word + DRCN Char|0.7152|未尝试 Decompose Attention Word Char + DRCN Word + DRCN Char|0.7173|未尝试 DRCN Word+DRCN Char + DIIN Char|0.7242|0.733（最终分数） DRCN Word+DRCN Char + DIIN Char + Decompose Attention + Siamese 传统特征|未尝试（没来得及）|未尝试

评论收藏

内容反馈