# fwwb14_semantic_similarity
服务外包大赛19年选题14-运用文本相似度实现(证券)智能客服【恒生电子】,回笼觉国家队代码
# How to use
- 在`./data/test/row/test.csv`文件内按照格式填写客户询问,如图:
![](./code/data/test/1.png)
- 运行`create_test.py`,获得处理好的测试集
- 运行`generate_result.py`,得出**top1**结果和**top5**结果,在`./result.csv`,如图:
![](./code/data/test/2.png)
- 若增加标准问,则在‘./data/test/row/standard_question.csv’内在’a’列增加元素即可,其他步骤不变
# Ticks
```
1) Spacy爬虫;
2) 数据处理与可视化;
3) 数据清洗;
4) 单次级别和字符级别输入;
5) 特征工程Magic Feature;
6) RNN模型搭建;
7) 炼丹调参;
8) 模型融合;
```
# Reference
- [atec](<https://github.com/zle1992/atec>)
- [经验分享:关于预训练词向量](<https://zhuanlan.zhihu.com/p/55320266>)
没有合适的资源?快使用搜索试试~ 我知道了~
服务外包大赛19年选题14-运用文本相似度实现(证券)智能客服【恒生电子】,回笼觉国家队代码.zip
共192个文件
pyc:73个
py:54个
ipynb:14个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 65 浏览量
2023-10-23
10:19:45
上传
评论 1
收藏 43.06MB ZIP 举报
温馨提示
服务外包大赛19年选题14-运用文本相似度实现(证券)智能客服【恒生电子】,回笼觉国家队代码.zip
资源推荐
资源详情
资源评论
收起资源包目录
服务外包大赛19年选题14-运用文本相似度实现(证券)智能客服【恒生电子】,回笼觉国家队代码.zip (192个子文件)
setup.cfg 26B
train_cut.csv 4.53MB
feats2_train.csv 1.22MB
data_shuffle.csv 1.19MB
feats1_train.csv 538KB
titledata.csv 473KB
feats0_train.csv 311KB
result.csv 153KB
standard_question.csv 6KB
test.csv 121B
word.data 368KB
word.data 368KB
.editorconfig 409B
.gitignore 342B
word_dp_feats_26_rnn0_dam_3.h5 17.73MB
word_dp_feats_26_rnn0_dam_1.h5 17.73MB
MANIFEST.in 55B
tox.ini 554B
CutWord&&My_w2v.ipynb 81KB
CutWord&&My_w2v-checkpoint.ipynb 81KB
CutWord&&w2v-checkpoint.ipynb 76KB
pre_w2v-checkpoint.ipynb 55KB
pre_w2v.ipynb 55KB
构造测试集.ipynb 54KB
构造测试集-checkpoint.ipynb 54KB
rule for desitence.ipynb 35KB
clean .ipynb 23KB
Observation.ipynb 23KB
Observation-checkpoint.ipynb 23KB
模型可视化.ipynb 18KB
模型可视化-checkpoint.ipynb 18KB
规则加分测试.ipynb 18KB
prob.json 436KB
settings.json 239B
README.md 975B
框架.md 929B
ss.md 37B
train_word.model 2.68MB
train_char.model 2.23MB
word_embed_weight.npy 1.75MB
char_embed_weight.npy 1.46MB
word_embed_weight.npy 1.03MB
char_embed_weight.npy 877KB
word_embed_weight.npy.vocab.npy 31KB
【char】dam.png 273KB
【word】my_rnn.png 194KB
cnn_esim.png 153KB
esim.png 153KB
【word】dam.png 42KB
2.png 10KB
rnn0_dam.png 7KB
1.png 6KB
CNN.py 21KB
test_fuzzywuzzy.py 18KB
ESIM.py 16KB
multi_perspective.py 14KB
help_add.py 11KB
process.py 11KB
ABCNN.py 11KB
fuzz.py 9KB
MatchZoo.py 9KB
feats1.py 7KB
generate_result.py 7KB
Attention.py 7KB
RNN.py 7KB
help.py 7KB
train.py 7KB
SpatialGRU.py 7KB
train_ronghe.py 7KB
train_ronghe_past.py 6KB
generate_result_single.py 6KB
test_fuzzywuzzy_hypothesis.py 5KB
w2v.py 5KB
Match.py 5KB
layers.py 4KB
MatchTensor.py 4KB
benchmarks.py 4KB
CutWord.py 4KB
Feats.py 4KB
fuck_config.py 4KB
middlewares.py 4KB
bimpm.py 3KB
config.py 3KB
settings.py 3KB
utils.py 3KB
StringMatcher.py 2KB
Cross.py 2KB
pinyin.py 2KB
pinyin.py 2KB
make_feats.py 2KB
feats0.py 2KB
MyPooling.py 2KB
MyPooling.py 2KB
MyPooling.py 2KB
probspider.py 1KB
feats3.py 1KB
setup.py 1KB
MyEmbeding.py 1KB
string_processing.py 780B
create_test.py 647B
共 192 条
- 1
- 2
资源评论
天天501
- 粉丝: 605
- 资源: 4666
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功