制造下载地址、数据集资源下载-ZShiJ的资源-CSDN下载

电商平台用户行为分析与可视化数据集.zip

电商平台用户行为分析与可视化数据集

评级：0

浏览量：35

资源大小：257KB

上传时间：2024-06-09

所需积分： 3
基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究数据集.zip

文章：基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究：https://blog.csdn.net/m0_53054984/article/details/139297863 蓝莓在全球范围内备受欢迎，其独特的风味和丰富的营养价值令消费者为之倾倒。蓝莓生长对适宜气候和土壤的依赖，因此主要分布于北美、欧洲、澳洲等地区。野生蓝莓养殖目前正处于蓬勃发展的阶段，吸引了越来越多的投资者和农户投身其中。全球对健康食品的需求不断增加，野生蓝莓以其天然的营养价值和丰富的抗氧化物质而备受瞩目。然而，养殖野生蓝莓也面临一系列挑战，包括气候不稳定、疾病威胁和市场价格波动。因此，成功的野生蓝莓养殖需要不断的创新和可持续的农业实践，以满足日益增长的全球市场需求。

评级：0

浏览量：35

资源大小：574KB

上传时间：2024-06-02

所需积分： 0
high_diamond_ranked_10min.csv

机器学习算法（七）数据集 high_diamond_ranked_10min

评级：0

浏览量：18

资源大小：1.38MB

上传时间：2024-05-24

所需积分： 2
penguins_raw.csv

机器学习算法（五）数据集 penguins_raw

评级：0

浏览量：9

资源大小：52KB

上传时间：2024-05-24

所需积分： 2
基于数据挖掘与机器学习揭秘脱发主因之-脱发数据集

文章：[基于数据挖掘与机器学习揭秘脱发主因](https://blog.csdn.net/m0_53054984/article/details/138665006) 随着年龄增长，脱发成为许多人关注的健康问题之一。头发的丰盈与否不仅影响着外貌，更与个体的健康状态息息相关。本数据集汇集了各种可能导致脱发的因素，包括遗传因素、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等。通过数据探索分析，深入挖掘这些因素与脱发之间的潜在关联，从而为个体健康管理、医疗干预以及相关产业的发展提供有益参考。本数据集汇集了各种可能导致脱发的因素，包括遗传因素、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等。通过数据探索分析，可以深入挖掘这些因素与脱发之间的潜在关联，再通过可视化和统计检验探究脱发的影响因素，最后建立逻辑回归模型和随机森林模型，并且得出影响模型的重要特征。

评级：0

浏览量：66

资源大小：85KB

上传时间：2024-05-12

所需积分： 1
多维因素与学生辍学风险预测数据集

数据集收录了一个高等教育机构提供的各种本科学位就读的学生的全面情况。包括：人口统计学数据、社会经济因素和学术数据，以及学生入学时的相关信息，如申请方式、婚姻状况、所选课程等。通过评估课程单位的学分/注册/评估/批准以及他们各自的成绩，可以预测估计每个学期末学生的整体表现。文章：https://blog.csdn.net/m0_53054984/article/details/138424068 附录：https://blog.csdn.net/m0_53054984/article/details/138503378

评级：0

浏览量：25

资源大小：429KB

上传时间：2024-05-06

所需积分： 2
工业蒸汽量预测数据集.zip

燃料在燃烧时加热水生成蒸汽，蒸汽压力推动汽轮机旋转，然后汽轮机带动发电机旋转，产生电能。在这一系列的能量转化中，影响发电效率的核心是锅炉的燃烧效率，即燃料燃烧加热水产生高温高压蒸汽。数据分析：查看变量间相关性以及找出关键变量。数据特征工程对数据精进：异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型)：决策树、随机森林，lightgbm等。模型验证：评估指标以及交叉验证等。特征优化：用lgb对特征进行优化。模型融合：进行基于stacking方式模型融合。 [机器学习实战 —— 工业蒸汽量预测（总）](https://blog.csdn.net/m0_53054984/article/details/138189384)

评级：0

浏览量：51

资源大小：373KB

上传时间：2024-04-25

所需积分： 4
基于Flask的数据集.zip

下载完对应的数据集之后需解压对应的zip包本项目下面有四个.ipynb的文件，下面分别阐述各个文件所对应的功能：（有py版本可后台留言）数据采集：分别从前程无忧网站和猎聘网上以关键词数据挖掘爬取相关数据。其中，前程无忧上爬取了270页，有超过1万多条数据；而猎聘网上只爬取了400多条数据，主要为岗位要求文本数据，最后将爬取到的数据全部储存到csv文件中。数据清洗：对爬取到的数据进行清洗，包括去重去缺失值、变量重编码、特征字段创造、文本分词等。数据库存储：将清洗后的数据全部储存到MySQL中，其中对文本数据使用jieba.analyse下的extract_tags来获取文本中的关键词和权重大小，方便绘制词云。基于Flask的前后端交互：使用Python一个小型轻量的Flask框架来进行Web可视化系统的搭建，在static中有css和js文件，js中大多为百度开源的ECharts，再通过自定义controller.js来使用ajax调用flask已设定好的路由，将数据异步刷新到templates下的main.html中。

评级：0

浏览量：24

资源大小：1.66MB

上传时间：2024-04-15

所需积分： 4
泰坦尼克号生存预测数据集.zip

[泰坦尼克号乘客生存情况预测分析1](https://blog.csdn.net/m0_53054984/article/details/137784712) [泰坦尼克号乘客生存情况预测分析2](https://blog.csdn.net/m0_53054984/article/details/137786387) [泰坦尼克号乘客生存情况预测分析3](https://blog.csdn.net/m0_53054984/article/details/137787102) 泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日，在她的处女航中，泰坦尼克号在与冰山相撞后沉没，在船上的 2224 名乘客和机组人员中，共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会，从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素，但有些人比其他人更容易存活下来，究竟有哪些因素影响着最终乘客的生存与否呢? 在该数据集中，共包括三个文件，分别代表训练集、测试集以及测试集的答案

评级：0

浏览量：77

资源大小：34KB

上传时间：2024-04-15

所需积分： 2
百货商场用户画像描述与价值分析数据集.zip

[ 百货商场用户画像描绘与价值分析](https://blog.csdn.net/m0_53054984/article/details/137758694) [ 百货商场用户画像描绘与价值分析附录](https://blog.csdn.net/m0_53054984/article/details/137758627) 数据集分为两部分，.xlsx结尾的是会员信息表，.csv结尾的是销售流水表。其中，会员信息表共有将近19万条记录，销售流水表共有接近189万条记录。两个表包含了如会员卡号，消费产生时间，性别，出生时间，商品编码，销售数量，商品售价，消费金额，商品名称，此次消费的会员积分，收银机号，单据号，柜组编码，柜组名称，等级时间等 15 个特征。

评级：0

浏览量：60

资源大小：45.69MB

上传时间：2024-04-14

所需积分： 1