# 2018-TianChi-Double-high-Round-1
2018年天池美年双高初赛代码
#### 数据链接:https://pan.baidu.com/s/1DWdxtHv7EegLRW7HFLwSSQ 密码:34f7
### 0.make_TXT_to_PANDAS.py 将原始txt数据转化为pandas可读数据
### 1.wish_train_label.py 清洗数据的标签
### 2.clean_data_part.py 清晰0得到的数据 默认选择初赛b数据
### bk_up.py 模型训练 大约3小时 默认选择清洗后的初赛b数据
### 运行环境详见附件:windwos10 python3.5 环境
### 内存需求 12g及其以上
### 磁盘需求 5g及其以上
### 线下结果大约为 0.0290x附近
# 思路:
## 数据分为 定量/定性 两个部分
### 定量的数据清洗主要是洗掉 类似 25 25 这样的错位数据 和 替换数据中的一些特殊字符 类似于 圆角/半圆角
### 对于定性的部分,主要是一些指标数据,这部分直接采用 labelencode 编码
## 数据中存在很多文字描述,提取文字中的数值,同时另外一部分的文字信息采取tfidf
### 基本全部运行需要2小时,其中模型特征提取部分比加快,测试部分由于采取了10 flod,因此速度比较慢
### 全部数值特征 --- 第一个版本baseline
### 数值+文本提取的数值 --- 第二个版本baseline
### 数值+文本提取的关键字 --- 第三个版本baseline
### 数值+文本数值+关键字+tfidf --- 第四个版本baseline
没有合适的资源?快使用搜索试试~ 我知道了~
毕业设计&课设-2018年天池美年双高初赛代码.zip
共8个文件
py:4个
txt:2个
md:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 163 浏览量
2024-06-22
21:20:24
上传
评论
收藏 12KB ZIP 举报
温馨提示
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
资源推荐
资源详情
资源评论
收起资源包目录
毕业设计&课设-2018年天池美年双高初赛代码.zip (8个子文件)
comp_code
运行环境的文件.txt 4KB
README.md 1KB
code
2.clean_data_part.py 16KB
run.bat 104B
bk_up.py 15KB
0.make_TXT_to_PANDAS.py 2KB
1.wish_train_label.py 1KB
readme.txt 409B
共 8 条
- 1
资源评论
毕业小助手
- 粉丝: 2739
- 资源: 5597
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 昆仑通态与欧姆龙温控器 台达变频器 联合通讯控制器件:昆仑通态MCGS TPC7062,欧姆龙E5CC型号温控器,台达VFD
- Labview 用DBC文件解析CAN报文以及DBC格式发送CAN,调用的dll有说明文档 2013,2016,2019版本
- 基于Java实现的人脸识别考场管理系统后端设计源码
- 基于Java和Lua语言的danmakuMusic弹幕音乐网站后端搜索模块设计源码
- 基于JavaScript语言的DIY项目设计源码
- 复合材料加工技术及装备发展综述_陈清良 (1).pdf
- 基于FFmpeg的简易音频编码器设计源码
- 基于JavaScript和微信小程序的行李箱设计源码
- 基于HTML/CSS/JavaScript的zx_health疫情健康系统设计源码
- 基于SwiftUI的心电图波形图设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功