- 数据挖掘大学生期末复习题0 11浏览会员免费
- 数据挖掘大学生期末测试题0 9浏览会员免费
- 数据分析理论基础-入门理论0 6浏览会员免费
- 数据预处理 (data preprocessing).pdf0 12浏览会员免费
- 数据分析是使用技术和工具从原始数据中提取有用的信息和洞见的过程。【数据分析】(如excel、powerBI、python、R语言或其他数据分析工具)面试题.pdf0 93浏览会员免费
- r语言0 17浏览会员免费
- 数据集对于深度学习模型的重要性不言而喻,然而根据性质、类型、领域的不同,数据集往往散落在不同的资源平台里,急需人们做出整理。 fast.ai 近期将这些重要的数据集汇总到了一篇文章里,AI 科技评论把文章编译如下 少了数据,我们的机器学习和深度学习模型什么也干不了。这么说吧,那些创建了数据集、让我们可以训练模型的人,都是我们的英雄,虽然这些人常常并没有得到足够的感谢。让人庆幸的是,那批最有价值的数据集后来成了[学术基准线]一被研究人员广泛引用,尤其在算法变化的对比上;不少名字则成为圈内外都耳熟能详的名称,如 MNIST、CIFAR 10 以及Imagenet 等 身为 fast.ai 的一员,我们自觉欠这些数据集的创建者一句真挚的感谢,所以我们决定,通过与 AWS 合作,把些最重要的数据集集中整理在一处,数据集自身采用标准格式,存储服务器也是快速的、可靠的(请参阅下方的完整列表与链接)。如果您在研究中使用了这些数据集,我们希望您记得引用原始论文( 我们已经在表单中提供引用链接 );如果您将它们用作商业或教育项目的一部分,请考虑添加致谢文及数据集原链接 我们之所以经常在教学中引用这些数据0 18浏览会员免费
- linkin元数据管理datahub手册说明书0 24浏览会员免费
- 大数据开发是一个涵盖广泛且不断发展的领域,涉及处理和分析大规模数据集的技术和方法。通过1. 学习编程语言和工具;2. 掌握数据处理和分析技术;3. 实践项目和案例等几个方面对大数据开发有初步了解。其在电子商务数据分析、智慧城市管理、金融风险管理、医疗健康管理等多个行业领域均有宽广的应用前景。0 21浏览免费
- 2024 年数据可视化学习路线图0 47浏览免费
- second edition 2017, Oxford University Press0 37浏览会员免费
- 数据智能平台和医药行业案例分享0 6浏览会员免费
- 美国大学生数学建模竞赛(Mathematical Contest in Modeling,简称MCM,以及Interdisciplinary Contest in Modeling,简称ICM)是一项国际性的大学生竞赛,旨在通过团队合作解决实际问题来提升学生的数学建模能力、团队协作能力和论文写作能力。本教程将详细介绍美赛的准备、参赛过程和策略,帮助新手快速入门0 20浏览会员免费
- Doris使用规范(最佳实践)0 79浏览会员免费
- 【精品】NLP自然语言处理学习路线(知识体系).0 39浏览会员免费
- 全面整理!机器学习常用的回归预测模型0 73浏览会员免费
- BDG2数据集论文,BDG2数据集论文,BDG2数据集论文0 17浏览会员免费
- Fortran语言入门教程&代码示例.pdfFortran语言入门教程&代码示例.pdfFortran语言入门教程&代码示例.pdf0 189浏览会员免费
- 数据治理是企业数字化转型中的关键一环,为了让业务用户在数据分析和应用中能够更方便的获取高质量数据,企业必须首先开展数据治理工作,本建设指南梳理总结了一套数据治理和建设的方法论。0 24浏览会员免费
- 主要参考的是曾伟老师的ppt,里面也同样标注的重点,及格不是问题0 26浏览会员免费
- 2024数据与分析百大预测0 19浏览会员免费
- IDL编程的经典教材,请笑纳!0 13浏览会员免费
- 实验报告(完整、提交作业版0 50浏览会员免费
- 大数据治理数字化运营平台建设方案0 15浏览会员免费
- qupath操作流程学习0 194浏览会员免费
- 爬虫-requests模块的使用讲解。 get、post两种请求方式以及代理0 44浏览会员免费
- Xpath、BeautifulSoup、JsonPath三种解析方式的用法以及示例。0 43浏览会员免费
- knn算法实现鸢尾花分类0 21浏览会员免费
- 层次聚类了解一下,感觉比LDA更靠谱0 24浏览会员免费
- discover 详细使用步骤以及一些经典案例0 31浏览会员免费
- 使用python,利用K-means算法对数据集进行聚类建模分析,实现步骤包括数据读入、数据理解、数据准备、模型训练、模型评价、模型调参与预测等。0 178浏览会员免费
- 使用python,利用逻辑回归对病例数据进行分类建模分析,最后实现病例自动诊断,具体实现步骤包括数据读入、数据理解、数据准备、模型训练、模型评价、模型调参模型预测等。0 122浏览会员免费
- 使用python,利用支持向量机(SVM)算法对病例数据进行分类建模分析,最后实现病例自动诊断分析,步骤包括数据读入、数据理解、数据准备、模型训练、模型应用及评价等。0 176浏览会员免费
- 使用python,利用朴素贝叶斯算法对病例数据进行分类建模分析,最后完成病例自动诊断分析,步骤包括数据读入、数据理解、数据准备、模型训练、模型评价、模型调参、模型预测等。0 126浏览会员免费
- 使用python,利用KNN算法对病例数据进行分类分析,从而实现自动诊断病例分析,步骤包括数据读入、数据理解、数据准备、模型训练、模型评价、模型调参、模型改进和模型预测等。0 275浏览会员免费
- 使用python,利用泊松回归对航班数据集进行回归建模分析,步骤包括数据读入、数据理解、数据准备、模型训练、模型评价等。0 178浏览会员免费
- 使用python,分别用统计学方法和机器学习方法对数据集“Advertising.csv”的数据进行多元回归建模分析,步骤包括数据读入、数据理解、数据准备、模型构建、模型预测、模型评价等。0 121浏览会员免费
- 使用python,利用简单线性回归模型和多项式回归模型对女性身高与体重的数据进行建模分析与改进,步骤包括数据读入、数据理解、数据准备、模型训练、模型评价、模型调参、模型预测等。0 245浏览会员免费
- 使用数据集“Online Retail.xlsx",使用python,利用关联规则分析Apriori进行购物车分析,包括数据读入、数据理解、数据预处理、生成频繁项集、计算关联度、可视化等步骤。0 307浏览会员免费
- 城市化的快速发展导致城市空间日益拥挤,交通运输和工商业生产规模扩大,进而引发了日益严重的城市街道环境噪声问题。随着城市建设的立体化发展,传统的噪声分析模型可能难以满足新的需求。为此,本文提出了一种关于城市街道环境噪声监测与评价模型(SCG),利用SVAR(结构向量自回归模型)与CNN(卷积神经网络)以及GIS(地理信息系统)融合成城市街道噪声二维模型。该模型以交通干线两侧高层建筑的噪声垂直特性监测数据集为基础,主要考虑交通噪声与车流量、距离等之间的非线和模糊的关系。本文通过构建SCG模型,选取噪声预测因子,建立城市街道噪声二维模型,通过监测数据对模型进行了验证,结果显示,R2为0.864,均方误差MSE为0.094,可解释方差分EVS为0.865,应用SCG模型的拟合率较高。该模型能够较好地解决城市街道环境噪声的评估和监测问题,为城市环境和规划部门提供有力的支持,帮助它们更好地管理和控制城市噪声污染。0 40浏览会员免费
- 利用易康进行图像分割并进行分类时,特征介绍,包括对象平均值( mean)、亮度( Brightness),对于邻域的平均差分( Mean Diff. to Neighbors),与父层对象( to Super Object),如对于上层对象的平均平均差分( Mean Diff. to Object)等,包含每个特征的详细描述,公式等。0 104浏览会员免费
- 数据挖掘导论(完整版)习题答案 本书对数据挖掘进行了全面介绍,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章:前面一章讲述基本概念、代表性算法和评估技术,而后面一章较深入地讨论高级概念和算法。目的是在使读者透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量例子、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时也可作为从事数据挖掘研究和应用开发工作的技术人员的参考书。 Pang-Ning Tan 现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。此前,他曾是明尼苏达大学美国陆军高性能计算研究中心副研究员(2002-2003)。 Michael Steinbach 明尼苏达大学计算机与工程系研究员,在读博士。 Vipin Kumar 明尼苏达大学计算机科学与工程系主任,曾任美国陆军高性能计算研究中心主任。他拥有马里兰大学博士学位,是数据挖掘和高性能计算方面的国际权威,IEEE会士。0 73浏览会员免费
- 简单手写思路,搭配文章一起。手写太累了只写了一点点,里面也用了最基础的算法,大家可以自行替换高阶算法。0 1080浏览会员免费
- (私信博主可免下载领取) 数据一直伴随着人类的发展而变迁。在古代,数据呈现出规则化汇聚的特征。例如,我国古代的黄册(全国户口名册)、天文观测记录均以特定规则进行登记造册,它们对人类社会和物理世界的性质、状态与相互关系进行记录和计算,都是宝贵的古代数据遗产。但在信息时代来临之前,人们对于数据的记录、处理、分析等工作大量依靠着纸笔等较为原始的工具手段,过程复杂且效率低下,对于数据进行利 用的范围和形式难以普及推广。在信息化时代来临之后,软件系统普及成为各行各业标配的生产工具。数据的存储、计算、分析等工作,开始可以通过相应的软件工具实现,对于数据的高效利用有了可行的技术基础。随着便捷化的信息技术不断强化企业处理数据的效率,如何更加高效的利用数据服务于自身业务成为众多企业最关心的问题。数据中台概念的诞生正是为了服务于这一目标。 数据中台的概念最初由阿里巴巴集团提出。2015 年,阿里巴巴对组织架构升级调整,建设整合阿里产品技术和数据能力的中台,形成“大中台,小前台”的组织和业务体制。这一举措旨在通过整合复用组织内部的各项基础设施和数据能力,使业务产品的更新迭代速度加快、成本降低,推动企业5 81浏览会员免费
- 第一章数仓概述 第二章简介OLTP和OLAP 第三章关系建模和维度建模 第四章简析阿里、美团、网易、恒丰银行、马蜂窝5家数仓分层架构 第五章数据仓库分层 第六章元数据管理系统解析 第七章hive的Metastore机制 第八章基于hadoop架构数仓管理工具hive 第九章hadoop集群Yarn容量调度器 第十章从0到1简单搭建数仓ODS层(埋点日志+业务数据) 第十一章从0到1简单搭建加载数仓DIM层以及拉链表处理 第十二章从0到1简单搭建加载数仓DWD层(用户行为日志数据解析) 第十三章从0到1简单搭建加载数仓DWD层(业务数据解析) 第十四章从0到1简单搭建加载数仓DWS层 第十五章从0到1简单搭建加载数仓DWT层 第十六章从0到1简单搭建加载数仓ADS层 第十七章 数仓建模以及分层总结(ODS、DIM、DWD、DWS、DWT、ADS层)0 639浏览会员免费
- 分类分析案例part11-树形图0 21浏览会员免费
- Windows下PyTorch深度学习环境配置(GPU)0 864浏览会员免费
- "这是一份详细的数据挖掘教程,名为《数据挖掘:概念与技术》第二版。这份教程提供了数据挖掘的基本概念、关键技术和最佳实践,适合初学者和专业人士阅读。无论是希望了解数据挖掘基础,还是希望深化对该领域的理解,这份教程都是一份宝贵的资源。0 407浏览免费
- 1简介 社会科学统计软件 Solutions Statistical Package for the Social Science 统计产品与服务解决⽅案 Statistical Product and Service Solutions 与SAS和BMDP,并称国际最有影响⼒的三⼤软件。 1968年 美国斯坦福三位研究⽣开发,⼴泛应⽤于经济 统计 数 体育 ⽣物⼼理 物疏管理 医疗卫⽣ 农林商业等多个领域 特点 1.spss的命令语句、子命令及各种选项绝⼤部分包含在多种菜单及对话框中 ⽤户不需要花费⼤量时间记忆,繁杂的命全过程及选项等 2.⽤户可以通过编程实现更复杂的统计分析任务 ③具有第四代语⾔的特点,即⾯向对象现代编程语⾔ ④具有完善的与其他软件的数据接⼝ 如Excel Asc码 DBF⽂件等 ⑤统计分析⽅法丰富 单变量描述到多变量分析 ⑥具有强⼤的图形功能0 59浏览会员免费
- 第1章 spss概述 1 简介 Spss的中⽂翻译为社会科学统计软件包 与SAS BMDP并称为国际上最有影响的三⼤软件。由于SPSS操作简单 很快在社会科学⾃然科学中发挥了巨⼤作⽤,⼴泛应⽤于经济学、数学 、统计学、物流管理、⽣物学、⼼理学、医疗卫⽣、体育、农业、林业、商业等多个领域特点 。 spss的命令、语句、⼦命令及各种选项绝⼤部分都包含在各种菜单和对话框中,⽤户不需要花⼤量时间记忆繁杂的命令、过程选项等。在spss中,⼤多数操作可以通过菜单和对话框来完成,操作简便易于学习和使⽤。0 47浏览会员免费
- 教育机构管理制度.pdf0 10浏览免费
- 数据可视化提纲0 196浏览会员免费
- 数据湖治理中心DGC是具有数据全生命周期管理、智能数据管理能力的一站式治理运 营平台,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据 底座,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统,消除数据孤 岛,统一数据标准,加快数据变现,实现数字化转型。0 125浏览免费
- 煤炭属于大宗商品,是我国最安全、可靠的重要能源之一,煤炭价格的变化往往反映了能源市场的变 化,不仅影响煤炭市场的供需平衡,也影响煤炭产业结构调整的幅度。科学有效的预测煤炭价格的变话 规律,可以使煤炭行业更加兴旺,也能为国家能源市场的宏观调控提供科学依据。 本文基于对秦皇岛煤炭历史价格等数据的分析,利用多元线性回归和灰色关联分析找出了影响煤炭价格 变化的主要因素。同时,采用时间序列算法ARMA和LSTM神经网络预测未来煤炭价格,之后结合包括 疫情爆发等突发情况对模型进行优化以得到最佳预测结果,最终得出研究结论并为煤炭市场提供了合理 建议。 对于问题一,我们先基于指数加权移动平均构造了名为价格基数的新特征,接着通过多元线性回归模型 的建模分析初步得出影响煤炭价格的主要因素,随后通过灰色关联分析对主要因素做灰色关联分析,求 得灰色关联系数并根据对煤炭价格的影响程度,最终得出结论:价格基数是最影响秦皇岛煤炭价格的主 要因素,其次是新能源(如天然气)对于煤炭市场的竞争关系,再其次是国内消耗和需求量,在进口量 和出口量造成的影响中进口量造成的影响更大。 对于问题二,通过可视化分析观察到煤炭价格变化0 176浏览会员免费
- 国产 ETL工具BeeDI 产品 , 适用于 数据库管理员即DBA / 开发人员 /IT部门 。完全替代可Informatica & DS 项目。不但拥有ETL工具基本必备功能,还有适用于本土化的独特功能即bee内置脚本解释器: 集成bee脚本(公司自研)开发环境支持,支持脚本编辑、运行、断点调试、变量值查看等功能。内置集成脚本,支持用户对任务的无限扩展。故可以支持实现相当复杂的数据清洗及标准化.BeeDI 提供集成脚本开发环境(IDE),采用类似C 语言的语法,充分满足用户定制各种复杂ETL 任务的需要。 涵盖产品功能:数据转换、数据联邦、数据同步、大数据集成、数据加密、Kafka消息流、Web交互、文件同步、工作流调度、作业调度、远程调度、集群调度、日志监控、数据安全、数据比对、数据追溯、统计分析、性能检测...... 全面支持国产操作系统、国产数据库......国产化替代项目 已成功上线运行中......5 152浏览会员免费
- engineering-of-big-data-processing.pdf0 21浏览会员免费
- Kafka在美团数据平台的实践0 32浏览会员免费
- 基于MATLAB的齿轮箱轴故障预诊与健康管理系统开发0 23浏览免费
- 基于MATLAB的Nd-CNGG激光器的热效应研究0 36浏览免费
- 基于Hysys和Matlab的天然气脱酸处理工艺优化0 41浏览免费