• 电商平台用户行为分析与可视化数据集.zip

    电商平台用户行为分析与可视化数据集

    0
    35
    257KB
    2024-06-09
    3
  • 基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究数据集.zip

    文章:基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究:https://blog.csdn.net/m0_53054984/article/details/139297863 蓝莓在全球范围内备受欢迎,其独特的风味和丰富的营养价值令消费者为之倾倒。蓝莓生长对适宜气候和土壤的依赖,因此主要分布于北美、欧洲、澳洲等地区。 野生蓝莓养殖目前正处于蓬勃发展的阶段,吸引了越来越多的投资者和农户投身其中。全球对健康食品的需求不断增加,野生蓝莓以其天然的营养价值和丰富的抗氧化物质而备受瞩目。然而,养殖野生蓝莓也面临一系列挑战,包括气候不稳定、疾病威胁和市场价格波动。因此,成功的野生蓝莓养殖需要不断的创新和可持续的农业实践,以满足日益增长的全球市场需求。

    0
    35
    574KB
    2024-06-02
    0
  • high_diamond_ranked_10min.csv

    机器学习算法(七)数据集 high_diamond_ranked_10min

    0
    18
    1.38MB
    2024-05-24
    2
  • penguins_raw.csv

    机器学习算法(五)数据集 penguins_raw

    0
    9
    52KB
    2024-05-24
    2
  • 基于数据挖掘与机器学习揭秘脱发主因之-脱发数据集

    文章:[基于数据挖掘与机器学习揭秘脱发主因](https://blog.csdn.net/m0_53054984/article/details/138665006) 随着年龄增长,脱发成为许多人关注的健康问题之一。头发的丰盈与否不仅影响着外貌,更与个体的健康状态息息相关。本数据集汇集了各种可能导致脱发的因素,包括遗传因素、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等。通过数据探索分析,深入挖掘这些因素与脱发之间的潜在关联,从而为个体健康管理、医疗干预以及相关产业的发展提供有益参考。 本数据集汇集了各种可能导致脱发的因素,包括遗传因素、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等。 通过数据探索分析,可以深入挖掘这些因素与脱发之间的潜在关联,再通过可视化和统计检验探究脱发的影响因素,最后建立逻辑回归模型和随机森林模型,并且得出影响模型的重要特征。

    0
    66
    85KB
    2024-05-12
    1
  • 多维因素与学生辍学风险预测数据集

    数据集收录了一个高等教育机构提供的各种本科学位就读的学生的全面情况。 包括:人口统计学数据、社会经济因素和学术数据,以及学生入学时的相关信息,如申请方式、婚姻状况、所选课程等。通过评估课程单位的学分/注册/评估/批准以及他们各自的成绩,可以预测估计每个学期末学生的整体表现。 文章:https://blog.csdn.net/m0_53054984/article/details/138424068 附录:https://blog.csdn.net/m0_53054984/article/details/138503378

    0
    25
    429KB
    2024-05-06
    2
  • 工业蒸汽量预测数据集.zip

    燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。 数据分析:查看变量间相关性以及找出关键变量。 数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。 模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。 模型验证:评估指标以及交叉验证等。 特征优化:用lgb对特征进行优化。 模型融合:进行基于stacking方式模型融合。 [机器学习实战 —— 工业蒸汽量预测(总)](https://blog.csdn.net/m0_53054984/article/details/138189384)

    0
    51
    373KB
    2024-04-25
    4
  • 基于Flask的数据集.zip

    下载完对应的数据集之后需解压对应的zip包 本项目下面有四个.ipynb的文件,下面分别阐述各个文件所对应的功能:(有py版本 可后台留言) 数据采集:分别从前程无忧网站和猎聘网上以关键词数据挖掘爬取相关数据。其中,前程无忧上爬取了270页,有超过1万多条数据;而猎聘网上只爬取了400多条数据,主要为岗位要求文本数据,最后将爬取到的数据全部储存到csv文件中。 数据清洗:对爬取到的数据进行清洗,包括去重去缺失值、变量重编码、特征字段创造、文本分词等。 数据库存储:将清洗后的数据全部储存到MySQL中,其中对文本数据使用jieba.analyse下的extract_tags来获取文本中的关键词和权重大小,方便绘制词云。 基于Flask的前后端交互:使用Python一个小型轻量的Flask框架来进行Web可视化系统的搭建,在static中有css和js文件,js中大多为百度开源的ECharts,再通过自定义controller.js来使用ajax调用flask已设定好的路由,将数据异步刷新到templates下的main.html中。

    0
    24
    1.66MB
    2024-04-15
    4
  • 泰坦尼克号生存预测数据集.zip

    [泰坦尼克号乘客生存情况预测分析1](https://blog.csdn.net/m0_53054984/article/details/137784712) [泰坦尼克号乘客生存情况预测分析2](https://blog.csdn.net/m0_53054984/article/details/137786387) [泰坦尼克号乘客生存情况预测分析3](https://blog.csdn.net/m0_53054984/article/details/137787102) 泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在船上的 2224 名乘客和机组人员中,共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会,从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素,但有些人比其他人更容易存活下来,究竟有哪些因素影响着最终乘客的生存与否呢? 在该数据集中,共包括三个文件,分别代表训练集、测试集以及测试集的答案

    0
    77
    34KB
    2024-04-15
    2
  • 百货商场用户画像描述与价值分析数据集.zip

    [ 百货商场用户画像描绘与价值分析](https://blog.csdn.net/m0_53054984/article/details/137758694) [ 百货商场用户画像描绘与价值分析附录](https://blog.csdn.net/m0_53054984/article/details/137758627) 数据集分为两部分,.xlsx结尾的是会员信息表,.csv结尾的是销售流水表。其中,会员信息表共有将近19万条记录,销售流水表共有接近189万条记录。 两个表包含了如会员卡号,消费产生时间,性别,出生时间,商品编码,销售数量,商品售价,消费金额,商品名称,此次消费的会员积分,收银机号,单据号,柜组编码,柜组名称,等级时间等 15 个特征。

    0
    60
    45.69MB
    2024-04-14
    1
  • 持之以恒

    授予累计8个月发布8篇原创IT博文的用户
  • 创作纪念日

    成为 IT 技术领域创作者三周年纪念勋章
  • 授人以渔

    1个回答被采纳
  • 话题达人

    10≤参与话题个数<14
  • 1024日创作纪念日

    成为 IT 技术领域创作者1024日纪念勋章
  • 笔耕不辍

    累计2年每年原创文章数量>=20篇
  • 勤写标兵

    授予累计10周发布3篇原创IT博文的用户
  • 创作能手

    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户
  • 知无不言

    回答1个问题,每日最多计数5次
  • 习惯养成

    连续回答技能树练习题 1 天,每天答对至少 1 题
  • 1024勋章

    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 签到新秀

    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新秀勋章

    用户首次发布原创文章,审核通过后即可获得
关注 私信
上传资源赚积分or赚钱