- html大小:2MBJekyll 是一个简单的、博客感知的静态站点生成器,非常适合个人、项目或组织站点。可以将其视为基于文件的 CMS,但没有任何复杂性。 Jekyll 获取您的内容,呈现 Markdown 和 Liquid 模板,并生成一个完整的静态网站,可供 Apache、Nginx 或其他 Web 服务器提供服务。 Jekyll 是 GitHub Pages 背后的引擎,您可以使用它直接从 GitHub 存储库托管站点。 Jekyll 会按照你的指示去做——不多也不少。它不会试图通过做出大胆的假设来智取用户,也不会给他们带来不必要的复杂性和配置负担。简而言之,Jekyll 不会妨碍您,让您专注于真正重要的事情:您的内容。 请参阅:https://jekyllrb.com/philosophy 入门 安装宝石 了解其用法和配置 看看一些现有的网站 分叉并贡献您自己的修改 有疑问吗?查看我们的官方论坛社区 Jekyll Talk 和 Libera IRC 上的 #jekyll 频道Jekyll 是一个简单的、博客感知的静态站点生成器,非常适合个人、项目或组织站点。可以将其视为基于文件的 CMS,但没有任何复杂性。 Jekyll 获取您的内容,呈现 Markdown 和 Liquid 模板,并生成一个完整的静态网站,可供 Apache、Nginx 或其他 Web 服务器提供服务。 Jekyll 是 GitHub Pages 背后的引擎,您可以使用它直接从 GitHub 存储库托管站点。 Jekyll 会按照你的指示去做——不多也不少。它不会试图通过做出大胆的假设来智取用户,也不会给他们带来不必要的复杂性和配置负担。简而言之,Jekyll 不会妨碍您,让您专注于真正重要的事情:您的内容。 请参阅:https://jekyllrb.com/philosophy 入门 安装宝石 了解其用法和配置 看看一些现有的网站 分叉并贡献您自己的修改 有疑问吗?查看我们的官方论坛社区 Jekyll Talk 和 Libera IRC 上的 #jekyll 频道0 0浏览免费
- 数据预处理 (data preprocessing).pdf0 1浏览会员免费
- 机器学习大小:141KB机器学习与数据分析+python读取excel数据+北京市空气质量数据+通过多元线性回归模型对 PM2.5 进行预测。基于空气质量监测数据(北京市空气质量数据xlsx),讨论如何对PM2.5的浓度进行预测。由于 PM2.5 为数值型变量,其预测属于回归预测问题。首先,建立一元线性回归模型,通过分析 CO 对 PM2.5 的数量影响,对 PM2.5进行预测;然后,将SO,的影响考虑进来,通过多元线性回归模型对 PM2.5 进行预测。机器学习与数据分析+python读取excel数据+北京市空气质量数据+通过多元线性回归模型对 PM2.5 进行预测。基于空气质量监测数据(北京市空气质量数据xlsx),讨论如何对PM2.5的浓度进行预测。由于 PM2.5 为数值型变量,其预测属于回归预测问题。首先,建立一元线性回归模型,通过分析 CO 对 PM2.5 的数量影响,对 PM2.5进行预测;然后,将SO,的影响考虑进来,通过多元线性回归模型对 PM2.5 进行预测。0 11浏览会员免费
- Hnase课程-概念资料0 3浏览会员免费
- 复杂数据预处理-kettle0 7浏览会员免费
- 商业资料大小:159MB关于数据集 描述 这个合成数据集“欺诈性电子商务交易”旨在模拟来自电子商务平台的交易数据,重点是欺诈检测。它包含交易数据中常见的各种功能,以及专门设计用于支持欺诈检测算法的开发和测试的附加属性。 变量详情 交易ID:每笔交易的唯一标识符。 客户 ID:每个客户的唯一标识符。 交易金额:交易中交换的总金额。 交易日期:交易发生的日期和时间。 付款方式:用于完成交易的方式(例如信用卡、PayPal 等)。 产品类别:交易涉及的产品类别。 数量:交易涉及的产品数量。 客户年龄:进行交易的客户的年龄。 客户位置:客户的地理位置。 使用的设备:用于进行交易的设备类型(例如移动设备、桌面设备)。 IP 地址:用于交易的设备的 IP 地址。 送货地址:产品的发货地址。 帐单地址:与付款方式关联的地址。 Is Fraudulent:交易是否欺诈的二进制指标(1 表示欺诈,0 表示合法)。 账户期限天数:交易时客户账户的期限(以天为单位)。 交易时间:交易发生的时间。 目的 该数据集旨在用于开发和测试电子商务交易中欺诈检测的机器学习模型。它还可用于探索性数据分析、特征工程和基准欺诈检测算法。关于数据集 描述 这个合成数据集“欺诈性电子商务交易”旨在模拟来自电子商务平台的交易数据,重点是欺诈检测。它包含交易数据中常见的各种功能,以及专门设计用于支持欺诈检测算法的开发和测试的附加属性。 变量详情 交易ID:每笔交易的唯一标识符。 客户 ID:每个客户的唯一标识符。 交易金额:交易中交换的总金额。 交易日期:交易发生的日期和时间。 付款方式:用于完成交易的方式(例如信用卡、PayPal 等)。 产品类别:交易涉及的产品类别。 数量:交易涉及的产品数量。 客户年龄:进行交易的客户的年龄。 客户位置:客户的地理位置。 使用的设备:用于进行交易的设备类型(例如移动设备、桌面设备)。 IP 地址:用于交易的设备的 IP 地址。 送货地址:产品的发货地址。 帐单地址:与付款方式关联的地址。 Is Fraudulent:交易是否欺诈的二进制指标(1 表示欺诈,0 表示合法)。 账户期限天数:交易时客户账户的期限(以天为单位)。 交易时间:交易发生的时间。 目的 该数据集旨在用于开发和测试电子商务交易中欺诈检测的机器学习模型。它还可用于探索性数据分析、特征工程和基准欺诈检测算法。0 24浏览会员免费
- 入行之后,我才发现数据分析其实可以分为两种:一种类似产品经理、一种偏向数据挖掘,类似产品经理向更加注重业务,对业务能力要求比较高;数据挖掘向更加注重技术,对算法代码能力要求比较高。 本资源讲解主要内容大纲如下: 数据分析师如何分类? 数据分析师的具体工作职责和工作内容有哪些? 如何在业余时间成为数据分析师? 数据分析实战与运用 如何用EXCEL做数据分析? 如何用TABLEAU做数据可视化?0 0浏览免费
- 包含: Python环境搭建 Python基础 Python库介绍(NumPy、Pandas) 数据处理与分析 实例分析0 5浏览免费
- CSV大小:59KB【Python可视化实战】共享单车可视化【Python可视化实战】共享单车可视化0 10浏览会员免费
- postgresql大小:755KB【kettle012】kettle访问FTP服务器文件并处理数据至PostgreSQL【kettle012】kettle访问FTP服务器文件并处理数据至PostgreSQL0 10浏览会员免费
- CSV大小:2KB基于岭回归的多项式预测模型基于岭回归的多项式预测模型0 13浏览会员免费
- 线性回归大小:89KBZBH.csvZBH.csv0 6浏览会员免费
- 风电机组传动链CMS振动数据大小:834KB风电机组传动链各个部件CMS振动数据,以及分析资料,振动故障,诊断效果,可以私信我有问题的话风电机组传动链各个部件CMS振动数据,以及分析资料,振动故障,诊断效果,可以私信我有问题的话0 8浏览会员免费
- python大小:2KB本资源是一套面向中级Python用户的数据分析与数据挖掘实战教程,包括详尽的资料和视频教学。课程内容从Python编程基础出发,深入到数据分析的核心概念,如数据清洗、探索性数据分析、统计建模、机器学习算法等。通过实际案例的分析与处理,学习者将掌握如何使用Python进行有效的数据挖掘和分析。 适用人群: 已具备基础Python编程能力的技术人员 能学到什么: Python在数据分析中的应用,包括Pandas、NumPy、Matplotlib等库的使用。 数据预处理的技巧,如数据清洗、转换和特征工程。 探索性数据分析的方法,包括数据可视化和统计分析。 阅读建议: 学习前应具备一定的Python编程基础和对数据分析的基本理解。 按照教程的顺序逐步学习,确保理解每个概念和工具的用途。 积极参与实践,通过解决实际问题来加深对知识点的掌握。 对于复杂的数据分析技术,建议多次观看视频教程,加强理解。 结合官方文档和社区资源,解决学习过程中遇到的问题。 通过本资源的学习,你将能够提升使用Python进行数据分析和挖掘的能力,为处理更复杂的数据科学问题打下坚实的基础。本资源是一套面向中级Python用户的数据分析与数据挖掘实战教程,包括详尽的资料和视频教学。课程内容从Python编程基础出发,深入到数据分析的核心概念,如数据清洗、探索性数据分析、统计建模、机器学习算法等。通过实际案例的分析与处理,学习者将掌握如何使用Python进行有效的数据挖掘和分析。 适用人群: 已具备基础Python编程能力的技术人员 能学到什么: Python在数据分析中的应用,包括Pandas、NumPy、Matplotlib等库的使用。 数据预处理的技巧,如数据清洗、转换和特征工程。 探索性数据分析的方法,包括数据可视化和统计分析。 阅读建议: 学习前应具备一定的Python编程基础和对数据分析的基本理解。 按照教程的顺序逐步学习,确保理解每个概念和工具的用途。 积极参与实践,通过解决实际问题来加深对知识点的掌握。 对于复杂的数据分析技术,建议多次观看视频教程,加强理解。 结合官方文档和社区资源,解决学习过程中遇到的问题。 通过本资源的学习,你将能够提升使用Python进行数据分析和挖掘的能力,为处理更复杂的数据科学问题打下坚实的基础。0 4浏览会员免费
- r语言大小:12MBR语言数据分析案例 【作品名称】:使用R语言对疫情大数据进行自然语言处理和分析建模 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。R语言数据分析案例 【作品名称】:使用R语言对疫情大数据进行自然语言处理和分析建模 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。0 13浏览免费
- 数据分析是使用技术和工具从原始数据中提取有用的信息和洞见的过程。【数据分析】(如excel、powerBI、python、R语言或其他数据分析工具)面试题.pdf0 32浏览会员免费
- 数据挖掘大小:2KB数据挖掘 数据挖掘学习分享(资料和就业推荐) 数据挖掘学习分享(资料和就业推荐) 数据挖掘学习分享(资料和就业推荐)数据挖掘 数据挖掘学习分享(资料和就业推荐) 数据挖掘学习分享(资料和就业推荐) 数据挖掘学习分享(资料和就业推荐)0 7浏览会员免费
- 数据分析大小:1MB1.7可视化进阶:复杂图表案例实操与美化1.7可视化进阶:复杂图表案例实操与美化0 10浏览会员免费
- 数据分析大小:4MB【数据分析】说明:建模分析股票市场数据,利用R语言进行数据分析,包括画图 文件列表: 4建模分析股票市场数据\.RData(2448278,2017-11-27) 4建模分析股票市场数据\.Rhistory(19776,2017-11-27) 4建模分析股票市场数据\AAN.csv(463709,2017-11-27) 4建模分析股票市场数据\codes.R(5493,2017-11-27) 4建模分析股票市场数据\finviz.csv(2776275,2014-08-02) 4建模分析股票市场数据\MAIN.csv(105464,2017-11-27) 4建模分析股票市场数据\NRCIB.csv(252867,2017-11-27) 4建模分析股票市场数据\OMI.csv(482704,2017-11-27) 4建模分析股票市场数据\stock_price_0.png(59114,2017-11-27) 4建模分析股票市场数据\stock_price_1.png(71885,2017-11-27) 4建模分析股票市场数据\stock_price_2.png(66500,2017-11【数据分析】说明:建模分析股票市场数据,利用R语言进行数据分析,包括画图 文件列表: 4建模分析股票市场数据\.RData(2448278,2017-11-27) 4建模分析股票市场数据\.Rhistory(19776,2017-11-27) 4建模分析股票市场数据\AAN.csv(463709,2017-11-27) 4建模分析股票市场数据\codes.R(5493,2017-11-27) 4建模分析股票市场数据\finviz.csv(2776275,2014-08-02) 4建模分析股票市场数据\MAIN.csv(105464,2017-11-27) 4建模分析股票市场数据\NRCIB.csv(252867,2017-11-27) 4建模分析股票市场数据\OMI.csv(482704,2017-11-27) 4建模分析股票市场数据\stock_price_0.png(59114,2017-11-27) 4建模分析股票市场数据\stock_price_1.png(71885,2017-11-27) 4建模分析股票市场数据\stock_price_2.png(66500,2017-110 17浏览会员免费
- Phthon大小:113MB用Python实现基于人脸识别的门禁管理系统(附源码+各功能截图+分类打包)用Python实现基于人脸识别的门禁管理系统(附源码+各功能截图+分类打包)0 143浏览会员免费
- 数据分析大小:796KB课件课件0 9浏览会员免费
- 数据分析大小:446KB1.6 可视化入门:各类基础图表全实操1.6 可视化入门:各类基础图表全实操0 12浏览会员免费
- MATLAB,全称为Matrix Laboratory,是一款功能强大的数值计算和数据可视化软件,广泛应用于工程计算、科学研究、数据处理、算法开发和图形生成等领域。对于想要学习和掌握MATLAB的用户,丰富的学习资源是提升技能的关键。以下是一系列关于MATLAB学习的精选资源,旨在帮助不同背景的学习者高效掌握这一强大工具。 ### 官方资源 - **MATLAB官方文档**:MathWorks官网提供了详尽的官方文档,覆盖了从基础语法到高级功能的所有内容。新手可以从“Getting Started”开始,逐步深入到更专业的主题。官方文档还包括了丰富的实例代码,便于学习和模仿。 - **MATLAB Academy与Onramp**:MathWorks提供的在线学习平台MATLAB Academy包含了许多免费和付费课程,适合不同水平的学习者。特别是“MATLAB Onramp”课程,是一个互动式的入门教程,帮助初学者快速掌握MATLAB基础。 ### 在线课程与MOOCs - **Coursera, edX, Udemy**:这些知名的在线教育平台上有许多关于MATLAB的课0 8浏览会员免费
- 深度学习是人工智能领域的一个重要分支,它依赖于大数据和强大的计算能力,通过模拟人脑神经网络的运作方式,实现了对数据的深层次理解和处理。以下是关于深度学习的资源描述: 深度学习资源主要包括深度学习框架、教程、数据集、应用案例和社区支持等。深度学习框架是深度学习的核心,它提供了构建和训练神经网络所需的各种工具和函数,如TensorFlow、PyTorch、Keras等。这些框架都具有高度的灵活性和可扩展性,可以满足不同应用场景的需求。 在教程方面,有许多优秀的深度学习教材、在线课程和博客文章等,它们从基础概念到高级应用都进行了详尽的讲解,为初学者和进阶者提供了宝贵的学习资源。此外,深度学习还需要大量的数据集进行训练和测试,因此,各种公开的数据集资源也是深度学习的重要支撑。 深度学习在各个领域中都有广泛的应用,如计算机视觉、自然语言处理、语音识别、推荐系统等。通过学习深度学习的相关知识,可以掌握如何构建和训练神经网络,从而将这些技术应用到实际问题中,提高系统的性能和智能化水平。 最后,深度学习社区是一个充满活力和创造力的地方,这里有众多的深度学习爱好者和专家,他们分享自己的经验和见解0 14浏览会员免费
- 随机森林大小:106KB电影票房预测一直是电影产业中的一个重要问题,对于制片方、发行方和影院等利益相关者而言,准确地预测电影票房可以帮助他们做出更明智的决策。在电影产业中,投资决策、市场营销策略、排片安排等方面的决策都受到电影票房预测的影响。因此,构建一种准确可靠的电影票房预测模型对于电影产业的发展具有重要意义。 本研究旨在利用随机森林算法构建一种高效的电影票房预测模型,通过综合考虑各种影响因素,提高预测准确性,为电影产业相关方提供科学的决策依据。通过该研究,可以更好地理解影响电影票房的关键因素,为电影从业者提供更全面的市场分析和预测服务。 数据集来源于kaggle,该数据集包含1995年至2018年上映的电影类型统计数据,原始数据集共有300条,9个变量电影票房预测一直是电影产业中的一个重要问题,对于制片方、发行方和影院等利益相关者而言,准确地预测电影票房可以帮助他们做出更明智的决策。在电影产业中,投资决策、市场营销策略、排片安排等方面的决策都受到电影票房预测的影响。因此,构建一种准确可靠的电影票房预测模型对于电影产业的发展具有重要意义。 本研究旨在利用随机森林算法构建一种高效的电影票房预测模型,通过综合考虑各种影响因素,提高预测准确性,为电影产业相关方提供科学的决策依据。通过该研究,可以更好地理解影响电影票房的关键因素,为电影从业者提供更全面的市场分析和预测服务。 数据集来源于kaggle,该数据集包含1995年至2018年上映的电影类型统计数据,原始数据集共有300条,9个变量0 147浏览会员免费
- 深度学习大小:367MB近年来,深度学习在计算机视觉领域取得了巨大的成功,尤其是在图像分类任务上。图像分类是计算机视觉领域的基本问题之一,而猫狗分类作为图像分类中的经典问题,吸引了广泛的研究兴趣。 猫狗分类问题具有很高的实际应用价值。在现实世界中,人们经常需要对动物进行分类,如在宠物识别、动物行为分析和动物保护等领域。传统的图像分类方法通常需要手工设计特征提取器和分类器,这在处理复杂的图像数据时面临着挑战。 猫狗分类问题的研究可以帮助我们深入理解深度学习在图像分类任务中的应用,并且可以为其他图像分类问题的研究提供经验和指导。此外,研究人员还可以通过比较不同深度学习模型的性能和对比传统方法的效果,评估深度学习在猫狗分类问题上的优势和局限性。 此外,随着深度学习模型的不断发展和算力的提升,研究人员可以尝试更复杂的模型架构、数据增强技术和迁移学习方法,以进一步提高猫狗分类任务的准确性和鲁棒性。 因此,基于深度学习的猫狗分类实验具有重要的研究价值,可以推动深度学习在图像分类领域的发展,同时为实际应用场景提供更好的解决方案。近年来,深度学习在计算机视觉领域取得了巨大的成功,尤其是在图像分类任务上。图像分类是计算机视觉领域的基本问题之一,而猫狗分类作为图像分类中的经典问题,吸引了广泛的研究兴趣。 猫狗分类问题具有很高的实际应用价值。在现实世界中,人们经常需要对动物进行分类,如在宠物识别、动物行为分析和动物保护等领域。传统的图像分类方法通常需要手工设计特征提取器和分类器,这在处理复杂的图像数据时面临着挑战。 猫狗分类问题的研究可以帮助我们深入理解深度学习在图像分类任务中的应用,并且可以为其他图像分类问题的研究提供经验和指导。此外,研究人员还可以通过比较不同深度学习模型的性能和对比传统方法的效果,评估深度学习在猫狗分类问题上的优势和局限性。 此外,随着深度学习模型的不断发展和算力的提升,研究人员可以尝试更复杂的模型架构、数据增强技术和迁移学习方法,以进一步提高猫狗分类任务的准确性和鲁棒性。 因此,基于深度学习的猫狗分类实验具有重要的研究价值,可以推动深度学习在图像分类领域的发展,同时为实际应用场景提供更好的解决方案。0 76浏览会员免费
- 决策树大小:790KB随着移动互联网的迅速发展,社会化网络的全面渗透,每个人都有可能在这个时代成为信息的制造者和传播者,这也导致了媒体从传统的主流媒体走向了普遍性。 每一次通讯技术与终端的发展都会使新媒介媒介与形式发生质变,并为广告产业的各个发展阶段打开了生态圈。5 G的逐步实施将会对万物互联的建设起到巨大的促进作用,新媒介的分散性也会越来越明显,新媒体产业必然会迎来一次新的洗牌。 广告投放策略的重中之重就是广告媒介和广告内容,在选择广告媒介上,需要结合媒体规格、点位、播放频次和广告投放费用,以便广告主轻松选择广告媒介。其次在广告内容设计上,需要吸引消费者产生消费的前提是引起兴趣与关注,引导消费者了解产品、认同产品,这便与广告的详细内容、整体创意有关,在投放机制正确的前提下,广告内容将在最后引起消费,从而达到广告投放目的。投放广告是品牌曝光的有效手段,但想要消费者从广告中认识到认知最后认同,广告投放策略就会变得非常重要。本次实验,我们使用Python大数据分析方法研究广告投放收益分析。随着移动互联网的迅速发展,社会化网络的全面渗透,每个人都有可能在这个时代成为信息的制造者和传播者,这也导致了媒体从传统的主流媒体走向了普遍性。 每一次通讯技术与终端的发展都会使新媒介媒介与形式发生质变,并为广告产业的各个发展阶段打开了生态圈。5 G的逐步实施将会对万物互联的建设起到巨大的促进作用,新媒介的分散性也会越来越明显,新媒体产业必然会迎来一次新的洗牌。 广告投放策略的重中之重就是广告媒介和广告内容,在选择广告媒介上,需要结合媒体规格、点位、播放频次和广告投放费用,以便广告主轻松选择广告媒介。其次在广告内容设计上,需要吸引消费者产生消费的前提是引起兴趣与关注,引导消费者了解产品、认同产品,这便与广告的详细内容、整体创意有关,在投放机制正确的前提下,广告内容将在最后引起消费,从而达到广告投放目的。投放广告是品牌曝光的有效手段,但想要消费者从广告中认识到认知最后认同,广告投放策略就会变得非常重要。本次实验,我们使用Python大数据分析方法研究广告投放收益分析。0 47浏览会员免费
- 数据分析大小:5MB本次实验通过综合运用数据可视化分析、词云图分析、情感分析以及LDA主题分析等多种方法,对旅游景点进行了全面而深入的研究。通过这一系列分析,我们得出了以下结论,并据此对旅游市场的发展趋势和潜在机会进行了展望。 首先,通过数据可视化分析,我们了解到不同景点的评分、评论数以及热度分布情况。 其次,词云图分析为我们揭示了游客在评论中提及的关键词和热点话题。 在情感分析方面,我们发现大部分游客对于所游览的景点持有积极正面的情感态度。 最后,LDA主题分析帮助我们提取了游客评论中的潜在主题。这些主题涵盖了旅游体验、景点特色、历史文化等多个方面,为我们深入了解游客需求和兴趣提供了有力支持。通过对比不同主题的出现频率和分布情况,我们可以发现游客对于不同景点的关注点和偏好有所不同,这为我们制定个性化的旅游推广策略提供了依据。本次实验通过综合运用数据可视化分析、词云图分析、情感分析以及LDA主题分析等多种方法,对旅游景点进行了全面而深入的研究。通过这一系列分析,我们得出了以下结论,并据此对旅游市场的发展趋势和潜在机会进行了展望。 首先,通过数据可视化分析,我们了解到不同景点的评分、评论数以及热度分布情况。 其次,词云图分析为我们揭示了游客在评论中提及的关键词和热点话题。 在情感分析方面,我们发现大部分游客对于所游览的景点持有积极正面的情感态度。 最后,LDA主题分析帮助我们提取了游客评论中的潜在主题。这些主题涵盖了旅游体验、景点特色、历史文化等多个方面,为我们深入了解游客需求和兴趣提供了有力支持。通过对比不同主题的出现频率和分布情况,我们可以发现游客对于不同景点的关注点和偏好有所不同,这为我们制定个性化的旅游推广策略提供了依据。0 76浏览会员免费
- 随机森林大小:1MB肥胖是一个全球性的公共健康问题,它可以在成人、青少年和儿童中出现。同时,注意到儿童肥胖是成年人肥胖的一个危险因素这一令人震惊的事实,从生命的早期阶段就预防和控制肥胖至关重要,也必须考虑到儿童体重的增加必须是渐进的。由于城市化、经济和技术发展带来的生活方式不断变化,儿童受到影响,导致肥胖儿童人数增加,因此,很多研究集中在对儿童肥胖问题的上。 本文使用UCI中一项关于人们饮食习惯和身体状况调查的数据集,分别通过决策树以及随机森林算法对数据进行处理,拟在寻找肥胖的成因。算法通过对14种影响因子进行多标签分类获取各影响因子与肥胖程度之间的权值,最终获取肥胖评估模型。人们可以通过评估模型就自己目前的生活习惯和身体状况来对未来的肥胖程度进行评估,并根据评估结果寻求解决肥胖问题的合理方式。肥胖是一个全球性的公共健康问题,它可以在成人、青少年和儿童中出现。同时,注意到儿童肥胖是成年人肥胖的一个危险因素这一令人震惊的事实,从生命的早期阶段就预防和控制肥胖至关重要,也必须考虑到儿童体重的增加必须是渐进的。由于城市化、经济和技术发展带来的生活方式不断变化,儿童受到影响,导致肥胖儿童人数增加,因此,很多研究集中在对儿童肥胖问题的上。 本文使用UCI中一项关于人们饮食习惯和身体状况调查的数据集,分别通过决策树以及随机森林算法对数据进行处理,拟在寻找肥胖的成因。算法通过对14种影响因子进行多标签分类获取各影响因子与肥胖程度之间的权值,最终获取肥胖评估模型。人们可以通过评估模型就自己目前的生活习惯和身体状况来对未来的肥胖程度进行评估,并根据评估结果寻求解决肥胖问题的合理方式。0 104浏览会员免费
- 数据集大小:49MB关于数据集 该数据集包含从该地区的普吉特海湾、湖泊和溪流收集的水质样本。 样品 ID:每个采集样品的唯一标识符。 抓取 ID:与样本关联的特定抓取实例的标识符。 配置文件 ID:与样本关联的配置文件的标识符。 样品编号:分配给每个样品的序列号。 收集日期时间:收集样本的日期和时间。 深度(米):收集样本的深度,以米为单位。 地点类型:样本采集地点的类型(例如河流、湖泊、水井)。 区域:收集样本的地理区域或区域。 定位器:指示样本精确位置的定位器信息。 地点:收集样本的特定地点或位置。 参数:样品中测量或分析的参数(例如,pH、溶解氧)。 值:样品中测量的参数值。 单位:参数值的测量单位。 QualityId:指示数据质量的标识符。 实验室限定符:由实验室指定的限定符,表明样品的任何特殊条件或特征。 MDL(方法检测限):参数的方法检测限。 RDL(报告检测限):报告参数的检测限。 文本值:参数值的文本表示。 样本信息:与样本相关的附加信息。 管理员注释:数据管理员提供的注释或评论。 重复次数:样本的重复次数。 重复项:指示重复样本的标识符。 方法:用于分析或测量的方法。关于数据集 该数据集包含从该地区的普吉特海湾、湖泊和溪流收集的水质样本。 样品 ID:每个采集样品的唯一标识符。 抓取 ID:与样本关联的特定抓取实例的标识符。 配置文件 ID:与样本关联的配置文件的标识符。 样品编号:分配给每个样品的序列号。 收集日期时间:收集样本的日期和时间。 深度(米):收集样本的深度,以米为单位。 地点类型:样本采集地点的类型(例如河流、湖泊、水井)。 区域:收集样本的地理区域或区域。 定位器:指示样本精确位置的定位器信息。 地点:收集样本的特定地点或位置。 参数:样品中测量或分析的参数(例如,pH、溶解氧)。 值:样品中测量的参数值。 单位:参数值的测量单位。 QualityId:指示数据质量的标识符。 实验室限定符:由实验室指定的限定符,表明样品的任何特殊条件或特征。 MDL(方法检测限):参数的方法检测限。 RDL(报告检测限):报告参数的检测限。 文本值:参数值的文本表示。 样本信息:与样本相关的附加信息。 管理员注释:数据管理员提供的注释或评论。 重复次数:样本的重复次数。 重复项:指示重复样本的标识符。 方法:用于分析或测量的方法。0 24浏览会员免费
- 数据集大小:5MB关于数据集 该数据集包括所有拥有 TLC 许可且信誉良好且能够驾驶的出租车辆。 TLC 授权的可用出租车辆。此列表准确至“上次更新日期”和“上次更新时间”字段中显示的日期和时间。 对于数据科学家来说,该数据集是分析出租汽车行业构成、了解服务分布(例如轮椅无障碍车辆的流行程度)以及根据许可证到期和续签评估市场动态的丰富资源。此外,它还可用于: 空间分析,根据基址了解不同区域出租车辆的分布情况。 时间分析通过比较不同日期的数据集来跟踪 FHV 行业随时间的变化。 监管合规性监控,例如确保车辆获得适当许可并满足轮椅无障碍等特定服务标准。关于数据集 该数据集包括所有拥有 TLC 许可且信誉良好且能够驾驶的出租车辆。 TLC 授权的可用出租车辆。此列表准确至“上次更新日期”和“上次更新时间”字段中显示的日期和时间。 对于数据科学家来说,该数据集是分析出租汽车行业构成、了解服务分布(例如轮椅无障碍车辆的流行程度)以及根据许可证到期和续签评估市场动态的丰富资源。此外,它还可用于: 空间分析,根据基址了解不同区域出租车辆的分布情况。 时间分析通过比较不同日期的数据集来跟踪 FHV 行业随时间的变化。 监管合规性监控,例如确保车辆获得适当许可并满足轮椅无障碍等特定服务标准。0 28浏览会员免费
- 数据集大小:6MB关于数据集 该数据集显示了目前通过华盛顿州许可部 (DOL) 注册的电池电动汽车 (BEV) 和插电式混合动力电动汽车 (PHEV)。 电池电动汽车 (BEV) 是一种全电动汽车,使用一个或多个电池来存储电能,为电机提供动力,并通过将车辆插入电源进行充电。插电式混合动力汽车 (PHEV) 是一种使用一个或多个电池为电动机提供动力的车辆;使用另一种燃料,例如汽油或柴油,为内燃机或其他推进源提供动力;并通过将车辆插入电源来充电。 清洁替代燃料汽车 (CAFV) 资格基于 RCW 82.08.809 和 RCW 82.12.809 中概述的燃料要求和纯电动续航里程要求,才有资格获得替代燃料汽车零售和华盛顿州使用税豁免。这些车辆的销售或租赁必须在 2019 年 8 月 1 日或之后进行,并满足购买价格要求,才有资格获得替代燃料汽车零售和华盛顿州使用税豁免。 某个县的每月车辆数量可能与本报告和之前的报告相比有所变化。实施流程是为了在注册时更准确地分配县。 更新日期:2024 年 3 月 12 日关于数据集 该数据集显示了目前通过华盛顿州许可部 (DOL) 注册的电池电动汽车 (BEV) 和插电式混合动力电动汽车 (PHEV)。 电池电动汽车 (BEV) 是一种全电动汽车,使用一个或多个电池来存储电能,为电机提供动力,并通过将车辆插入电源进行充电。插电式混合动力汽车 (PHEV) 是一种使用一个或多个电池为电动机提供动力的车辆;使用另一种燃料,例如汽油或柴油,为内燃机或其他推进源提供动力;并通过将车辆插入电源来充电。 清洁替代燃料汽车 (CAFV) 资格基于 RCW 82.08.809 和 RCW 82.12.809 中概述的燃料要求和纯电动续航里程要求,才有资格获得替代燃料汽车零售和华盛顿州使用税豁免。这些车辆的销售或租赁必须在 2019 年 8 月 1 日或之后进行,并满足购买价格要求,才有资格获得替代燃料汽车零售和华盛顿州使用税豁免。 某个县的每月车辆数量可能与本报告和之前的报告相比有所变化。实施流程是为了在注册时更准确地分配县。 更新日期:2024 年 3 月 12 日0 37浏览会员免费
- python大小:62MBPython 图机器学习算法库graphkit-learn-master.zipPython 图机器学习算法库graphkit-learn-master.zip0 16浏览会员免费
- 软件/插件大小:6MB豆瓣爬取影评并转换成词云的代码豆瓣爬取影评并转换成词云的代码0 11浏览会员免费
- 田间规划图大小:39KB一个可自动生成行田间种植规划图的excel VBA小工具一个可自动生成行田间种植规划图的excel VBA小工具0 10浏览免费
- 聚类数据集大小:9MB聚类数据集整理(合成、UCI和其他真实数据集).zip聚类数据集整理(合成、UCI和其他真实数据集).zip0 8浏览会员免费
- 数据集大小:520KB手写数字和字母数据集binaryalphadigs.mat手写数字和字母数据集binaryalphadigs.mat0 27浏览会员免费
- 身份证前6位大小:19KB1.全国省市区身份证前6位编码对照表 2.省市区分列 3.仅供参考1.全国省市区身份证前6位编码对照表 2.省市区分列 3.仅供参考0 13浏览会员免费
- 数据挖掘大小:49KB数据挖掘实验一-3数据资源3数据挖掘实验一-3数据资源30 10浏览会员免费
- 一.选择题 1. 将原始数据进行集成、变换、维度规约、数值规约是数据预处理的任务 A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、数据流挖掘 2. 以下属于关联分析的是 A. CPU性能分析 B. 购物篮分析 C. 自动判断鸢尾花类别 D. 股票趋势建模 3. 下面哪个不属于数据的属性类型 A. 标称 B. 序数 C. 区间 D. 相异 4. 在图集合中发现一组公共子结构,这样的任务称为 频繁子图挖掘 5. 以下关于决策树的说法哪项是错误的: A. 冗余属性不会对决策树的准确率造成不利的影响 B. 子树可能在决策树中重复多次 C. 决策树算法对于噪声的干扰非常敏感(错误的) D. 寻找最佳决策树是NP完全问题 6. 决策树中不包含以下哪种节点 A. 根结点(root node) B. 内部结点(internal node) C. 外部结点(external node) D. 叶结点(leaf node) 7. 关于K均值和DBSCAN的比较,以下说法不正确的是 A. K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对0 31浏览会员免费
- 数据挖掘大小:6KB数据挖掘实验一-1数据表资源2数据挖掘实验一-1数据表资源20 7浏览会员免费
- 数据挖掘大小:6KB数据挖掘实验一-1数据表资源1数据挖掘实验一-1数据表资源10 7浏览会员免费
- 大数据的主要应用类型0 1浏览会员免费
- 数据挖掘大小:332KBpanda练习文件2panda练习文件20 7浏览会员免费
- r语言0 11浏览会员免费
- 数据挖掘大小:152MBpanda练习文件环境panda练习文件环境0 7浏览会员免费
- 数据挖掘大小:23KBpanda练习文件panda练习文件0 19浏览会员免费
- 数据集大小:3MB武汉租房数据集,包含租房的各类信息武汉租房数据集,包含租房的各类信息0 36浏览会员免费
- pandas大小:108KB数据可视化(六):Pandas爬取NBA球队排名、爬取历年中国人口数据、爬取中国大学排名、爬取sina股票数据、绘制精美函数图像数据可视化(六):Pandas爬取NBA球队排名、爬取历年中国人口数据、爬取中国大学排名、爬取sina股票数据、绘制精美函数图像0 34浏览会员免费
- 数据集大小:14KB【数据可视化】说明:按照给定的数据集,采用Python可视化软件,独立完成一个数据可视化案例 【数据可视化】说明:按照给定的数据集,采用Python可视化软件,独立完成一个数据可视化案例【数据可视化】说明:按照给定的数据集,采用Python可视化软件,独立完成一个数据可视化案例 【数据可视化】说明:按照给定的数据集,采用Python可视化软件,独立完成一个数据可视化案例0 21浏览会员免费
- 数据集对于深度学习模型的重要性不言而喻,然而根据性质、类型、领域的不同,数据集往往散落在不同的资源平台里,急需人们做出整理。 fast.ai 近期将这些重要的数据集汇总到了一篇文章里,AI 科技评论把文章编译如下 少了数据,我们的机器学习和深度学习模型什么也干不了。这么说吧,那些创建了数据集、让我们可以训练模型的人,都是我们的英雄,虽然这些人常常并没有得到足够的感谢。让人庆幸的是,那批最有价值的数据集后来成了[学术基准线]一被研究人员广泛引用,尤其在算法变化的对比上;不少名字则成为圈内外都耳熟能详的名称,如 MNIST、CIFAR 10 以及Imagenet 等 身为 fast.ai 的一员,我们自觉欠这些数据集的创建者一句真挚的感谢,所以我们决定,通过与 AWS 合作,把些最重要的数据集集中整理在一处,数据集自身采用标准格式,存储服务器也是快速的、可靠的(请参阅下方的完整列表与链接)。如果您在研究中使用了这些数据集,我们希望您记得引用原始论文( 我们已经在表单中提供引用链接 );如果您将它们用作商业或教育项目的一部分,请考虑添加致谢文及数据集原链接 我们之所以经常在教学中引用这些数据0 12浏览会员免费
- ArcGIS大小:1KB通过ArcGIS得到任意一个区域的掩膜,由此可以提取任意一个区域的数据。通过ArcGIS得到任意一个区域的掩膜,由此可以提取任意一个区域的数据。0 9浏览免费
- linkin元数据管理datahub手册说明书0 14浏览会员免费
- 大数据大小:1MB大数据平台前端开发(Front end development of big data platform,) 说明:大数据平台前端开发, (Front end development of big data platform,) 文件列表: .DS_Store (10244, 2023-09-16) .browserslistrc (30, 2023-09-16) .editorconfig (713, 2023-09-16) .env.development (40, 2023-09-16) .env.production (208, 2023-09-16) .env.staging (113, 2023-09-16) .eslintignore (56, 2023-09-16) .eslintrc.js (1538, 2023-09-16) LICENSE (1066, 2023-09-16) babel.config.js (468, 2023-09-16) demo/ (0, 2023-09-16) demo/dashboard.png (573068, 2023-09-16)大数据平台前端开发(Front end development of big data platform,) 说明:大数据平台前端开发, (Front end development of big data platform,) 文件列表: .DS_Store (10244, 2023-09-16) .browserslistrc (30, 2023-09-16) .editorconfig (713, 2023-09-16) .env.development (40, 2023-09-16) .env.production (208, 2023-09-16) .env.staging (113, 2023-09-16) .eslintignore (56, 2023-09-16) .eslintrc.js (1538, 2023-09-16) LICENSE (1066, 2023-09-16) babel.config.js (468, 2023-09-16) demo/ (0, 2023-09-16) demo/dashboard.png (573068, 2023-09-16)0 4浏览会员免费
- 大数据开发是一个涵盖广泛且不断发展的领域,涉及处理和分析大规模数据集的技术和方法。通过1. 学习编程语言和工具;2. 掌握数据处理和分析技术;3. 实践项目和案例等几个方面对大数据开发有初步了解。其在电子商务数据分析、智慧城市管理、金融风险管理、医疗健康管理等多个行业领域均有宽广的应用前景。0 13浏览免费
- python大小:4KB这段Python代码是一个微博评论爬虫,它主要用于抓取微博的一级评论和二级评论,并将抓取的数据保存到CSV文件中。下面是代码的详细描述: 导入模块:代码首先导入了所需的模块,包括json、csv、re(正则表达式)、requests(发送HTTP请求)、time(暂停执行)、pandas(数据处理)、os(操作系统功能)和datetime(日期时间处理)。 获取网页源码:get_html 函数通过HTTP请求获取给定URL的网页源码,并设置了User-Agent和Referer头,以模拟浏览器访问。它还包含了一个时间延迟,以避免因频繁请求而被服务器限制访问。 清理HTML标签:get_string 函数用于从HTML内容中提取纯文本,移除所有HTML标签。 保存评论数据:save_text_data 函数将评论数据保存到CSV文件中。它首先创建一个包含评论数据的字典,然后将其转换为pandas的DataFrame。如果CSV文件已存在,则在追加数据时不添加表头;如果文件不存在,则添加表头。数据以UTF-8编码格式保存。 时间转换:trans_time 函数用于将微博评论的时间这段Python代码是一个微博评论爬虫,它主要用于抓取微博的一级评论和二级评论,并将抓取的数据保存到CSV文件中。下面是代码的详细描述: 导入模块:代码首先导入了所需的模块,包括json、csv、re(正则表达式)、requests(发送HTTP请求)、time(暂停执行)、pandas(数据处理)、os(操作系统功能)和datetime(日期时间处理)。 获取网页源码:get_html 函数通过HTTP请求获取给定URL的网页源码,并设置了User-Agent和Referer头,以模拟浏览器访问。它还包含了一个时间延迟,以避免因频繁请求而被服务器限制访问。 清理HTML标签:get_string 函数用于从HTML内容中提取纯文本,移除所有HTML标签。 保存评论数据:save_text_data 函数将评论数据保存到CSV文件中。它首先创建一个包含评论数据的字典,然后将其转换为pandas的DataFrame。如果CSV文件已存在,则在追加数据时不添加表头;如果文件不存在,则添加表头。数据以UTF-8编码格式保存。 时间转换:trans_time 函数用于将微博评论的时间0 59浏览免费
- 具体的内容在这里0 24浏览会员免费
- 大数据大小:203MB大数据分析思维是一种结构化的分析方法,它涉及到从不同角度理解和解析数据,以便更好地支持决策过程。这种思维方式通常包括以下几个核心方面: 结构化分析:将复杂问题分解成小部分,逐步解决。 公式化方法:使用数学和统计模型来理解数据关系。 业务化理解:将数据分析与实际业务需求相结合,确保分析结果具有实际应用价值。 数据分析思维的目标是通过对数据的深入分析,发现潜在的模式、趋势和关联,从而提供有力的业务洞察。这种思维方式对于数据科学家、分析师和业务决策者来说都是非常重要的。它不仅帮助他们更好地理解数据,还能够指导他们如何利用数据来优化业务流程和策略。在大数据时代,掌握数据分析思维是成功的关键。大数据分析思维是一种结构化的分析方法,它涉及到从不同角度理解和解析数据,以便更好地支持决策过程。这种思维方式通常包括以下几个核心方面: 结构化分析:将复杂问题分解成小部分,逐步解决。 公式化方法:使用数学和统计模型来理解数据关系。 业务化理解:将数据分析与实际业务需求相结合,确保分析结果具有实际应用价值。 数据分析思维的目标是通过对数据的深入分析,发现潜在的模式、趋势和关联,从而提供有力的业务洞察。这种思维方式对于数据科学家、分析师和业务决策者来说都是非常重要的。它不仅帮助他们更好地理解数据,还能够指导他们如何利用数据来优化业务流程和策略。在大数据时代,掌握数据分析思维是成功的关键。0 13浏览会员免费
- 自动化大小:133KBRPA(Robotic Process Automation)是一种自动化技术,通过使用软件机器人(bot)模拟和自动化人类在计算机系统中执行的规则性任务和业务流程。以下是RPA的一些关键知识点: 1. **自动化流程:** RPA旨在自动执行重复性、规则性的业务流程和任务,如数据录入、文件处理、报告生成等。这些流程通常是按照预定义的规则和步骤执行的。 2. **软件机器人:** RPA使用软件机器人来执行自动化任务。这些机器人可以模拟人类用户在计算机系统中的操作,例如点击、键盘输入、数据处理等。每个机器人都可以执行多个任务,并且可以在24/7的基础上运行。 3. **RPA工具:** RPA工具是用于开发、部署和管理自动化流程的软件平台。常见的RPA工具包括UiPath、Automation Anywhere、Blue Prism等,它们提供了图形化界面和脚本语言来配置和管理自动化流程。 4. **流程设计和开发:** RPA流程的设计和开发是将业务流程转化为自动化流程的关键步骤。这涉及到分析业务流程、识别可自动化的环节、设计自动化逻辑、开发自动化流程等。 5. **监控和RPA(Robotic Process Automation)是一种自动化技术,通过使用软件机器人(bot)模拟和自动化人类在计算机系统中执行的规则性任务和业务流程。以下是RPA的一些关键知识点: 1. **自动化流程:** RPA旨在自动执行重复性、规则性的业务流程和任务,如数据录入、文件处理、报告生成等。这些流程通常是按照预定义的规则和步骤执行的。 2. **软件机器人:** RPA使用软件机器人来执行自动化任务。这些机器人可以模拟人类用户在计算机系统中的操作,例如点击、键盘输入、数据处理等。每个机器人都可以执行多个任务,并且可以在24/7的基础上运行。 3. **RPA工具:** RPA工具是用于开发、部署和管理自动化流程的软件平台。常见的RPA工具包括UiPath、Automation Anywhere、Blue Prism等,它们提供了图形化界面和脚本语言来配置和管理自动化流程。 4. **流程设计和开发:** RPA流程的设计和开发是将业务流程转化为自动化流程的关键步骤。这涉及到分析业务流程、识别可自动化的环节、设计自动化逻辑、开发自动化流程等。 5. **监控和0 14浏览会员免费
- 人工智能大小:217KB大模型Sora:开启人工智能视频生成新时代 一、Sora简介大模型Sora:开启人工智能视频生成新时代 一、Sora简介0 48浏览会员免费