# 2021年华为杯第十八届中国研究生数学建模竞赛D题解决方案
## 环境搭建
* python3.7, pillow, tqdm, torchfile, pytorch1.1+ (for inference)
```
pip install pillow
pip install tqdm
pip install torchfile
conda install pytorch==1.1.0 torchvision==0.3.0 -c pytorch
```
* 接下来克隆这个仓库:
```
git clone https://github.com/rnzhiw/HuaweiCupMathModel.git
```
## 问题分析
* 第一问采用随机森林+相关性分析筛选20个变量
* 第二问采用决策树回归、线性回归、梯度提升向量机、随机 森林回归、多层次感知机回归、XGBoost 回归和LightGBM 模型对生物活性预测。最终得出LightGBM 模型的效果比较好
* 第三问采用多层感知机(MLP)对化合物的 ADMET 性质进行预测。训练集采用90%的样本,测试集采用10%的样本。五种性质的平均准确率为90.5%
* 第四问采用改进型贪心调优
## 模型结构
第三问的模型结构彩图
![Image discription](img/model_structure.png)
介绍
在该问题中,学习率为0.01的时候有比较好的效果,准确率达到了90.5%,使用了Dropout、Dice Loss、Adam 优化器、Poly 学习率衰减和 Kaiming 初始化。
接下来是模型在lr=0.01的情况下的五种性质预测准确率图:
![Image discription](img/experiment.jpg)
## License
This repository is released under the Apache 2.0 license as found in the [LICENSE](https://github.com/rnzhiw/Parallel_hyperparameter_optimization_for_loan_default_prediction/blob/main/LICENSE.md) file.
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
* 第一问采用随机森林+相关性分析筛选20个变量 * 第二问采用决策树回归、线性回归、梯度提升向量机、随机 森林回归、多层次感知机回归、XGBoost 回归和LightGBM 模型对生物活性预测。最终得出LightGBM 模型的效果比较好 * 第三问采用多层感知机(MLP)对化合物的 ADMET 性质进行预测。训练集采用90%的样本,测试集采用10%的样本。五种性质的平均准确率为90.5% * 第四问采用改进型贪心调优
资源推荐
资源详情
资源评论
收起资源包目录
HuaweiCupMathModel-master.zip (20个子文件)
HuaweiCupMathModel-master
img
experiment.jpg 223KB
model_structure.png 19KB
utils.py 2KB
data
ADMET.csv 117KB
ADEMT_test_pre.csv 5KB
question1_2.ipynb 337KB
Molecular_Descriptor_test.csv 172KB
Molecular_Descriptor.csv 6.13MB
ER郷activity.csv 118KB
question4_result.csv 785B
ADMET_test.csv 5KB
test.py 1KB
train.py 6KB
dataloader.py 2KB
LICENSE 11KB
model.py 2KB
dice_loss.py 752B
draw.py 587B
README.md 2KB
valid.py 1KB
共 20 条
- 1
爱吃花椒的Yu酱
- 粉丝: 42
- 资源: 25
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
- 3
- 4
- 5
- 6
前往页