4.0 8228浏览
5.0 1411浏览
3.0 3085浏览
- 知识图谱大小:83MB第一讲 知识图谱概览;第二讲 知识表示和知识建模;第三讲 知识抽取与挖掘I
5.0 2808浏览
- ZIP大小:36MB该算法大全包括各种模型和算法的详细介绍,对数学建模等实际问题的解决提供了有效的帮助。
0.0 4691浏览
- k-means大小:61KB我的数据是115*64维的,需要进行聚类操作,于是自己动手进行了实验,运用的是matlab语言,最后选取部分进行可视化展示,效果还不错。(代码注释完整)
4.0 1w+浏览
- 行政区划数据大小:53MB全国五级行政区划数据(省市区县乡镇村),共计74万多条,有需要的请下载,记得关注、点赞哦!
2.0 7907浏览
- matlab大小:1KBmatlab软件随机森林法回归模型代码,可直接matlab打开运行!精简版,包括数据导入、模型建立、误差计算、保存模型,绘制对比图的多个功能!
1.0 1w+浏览
- SEIR大小:1KB只有代码,只需要代码来这边只有代码,
5.0 2868浏览
4.0 4890浏览
- 数据结构大小:7MB用mindmaster打开文件, 本文的思维导图根据王道的数据结构书本整理而来并标记出重点内容,包括了知识点和部分课后习题
5.0 1w+浏览
- pandas大小:3MB十二、 导入和保存数据 CSV 参考:写入 CSV 文件。 1、 写入 csv 文件: In [141]: df.to_csv('foo.csv') 2、 从 csv 文件中读取: 十分钟搞定 Pandas 40
0.0 599浏览
- pandas大小:3MB4.2 按星期统计骑手 这很易于实现! Dataframe 有一个类似于 SQL groupby 的 .groupby() 方法,如果你熟悉的 话。 我现在不打算解释更多 - 如果你想知道更多,请见文档。 在这种情况下, berri_bikes.groupby('weekday') .aggregate(sum)`意味着“按 星期对行分组,然后将星期相同的所有值相加”。 weekday_c
0.0 325浏览
- pandas大小:3MB6.3 将温度和降雪绘制在一起 第六章 91
0.0 459浏览
- pandas大小:3MB# 在 Pandas 0.12 中需要展示大量的列 # 在 Pandas 0.13 中不需要 pd.set_option('display.width', 5000) pd.set_option('display.max_columns', 60) 杂乱数据的主要问题之一是:你怎么知道它是否杂乱呢? 我们将在这里使用 NYC 311 服务请求数据集,因为它很大,有点不方便。 requests
0.0 634浏览
- pandas大小:3MB7.4 短横线处发生了什么 rows_with_dashes = requests['Incident Zip'].str.contains('-').fi llna(False) len(requests[rows_with_dashes]) 第七章 101
0.0 478浏览
- RapidMiner大小:6MB第14章 推荐系统 14.1 推荐系统应用场景 亚马逊商城、淘宝、京东等等电商网站的(您可能感兴趣的图书、音像、服装、电子设 备…)物品投放 QQ(您可能认识的)联系人推荐 新闻站点相关题材内容资讯展示 我们每天都面临着大量事件的抉择,在没有有效辅助决策信息之前,从其他用户反馈信 息中了解某事物的特性,可以加快我们抉择的过程。如:我们到没有去过的外地旅游之前, 选择哪家餐馆就
0.0 94浏览
- RapidMiner大小:6MB14.4 基于协同过滤的推荐系统 典型的推荐应用 —公司积累了大量的用户(user)对物品(item)的打分记录。 —根据当前用户的消费喜好,找到与其喜好相似的其他客户,分析他们有哪些物品(item) 对当前用户而言尚未消费使用,将这些物品推荐给当前用户。 —前提:当前访问用户的消费喜好和其他某些用户的消费喜好相似,且这种喜好在 近一段 时间以及未来一段时间内保持稳定。 —这样的推
0.0 87浏览
- RapidMiner大小:6MB图 14.2 基于用户推荐模型流程 刚才我们做的是基于用户的推荐,接下来我们做基于物品的推荐,只要将“User k-NN” 替换为“Item k-NN”操作符即可,点击运行,两种模型推荐的结果会有些差别,我们如何 对推荐的效果进行评估呢? 第四步:模型性能评估 这里我们需要调用推荐插件自有的“Performance(Item Recommendation)”插件,跟以往 的性
0.0 67浏览
- RapidMiner大小:6MB图 14.3 基于物品的推荐模型性能评测 在 k-NN 模型中,k 值得选择不同,决定模型效果的不同,可以根据数据的情况进行微调。 模型训练好后,可以用“Write Model”和“Read Model”对模型进行读写,勾选 Online updates 对模型进行动态更新,对大数据分次更新。 14.5 基于内容(content)的推荐系统 协同过滤系统使用现有用户的使用习惯信息,
0.0 61浏览
- RapidMiner大小:6MB图 14.4 基于物品属性的模型推荐
0.0 68浏览
- RapidMiner大小:6MB第15章 模型评估与优化 15.1 模型评估与优化解决的问题 如何评估判断某个挖掘算法对挖掘分析预测结果的准确性影响? 对某一个业务数据集进行预测时,如何在多个可选的挖掘模型之间选择最佳模型?为什 么选择模型 A,而不是模型 B?凭经验?还是。。。各个模型的特性指标能否横向可视化 对比? 系统能否从多个可选模型中自动为我们推荐一个最好的模型算法? 某个预测模型的最佳挖掘算
0.0 85浏览
- RapidMiner大小:6MB(3) 均方误差 均方误差(MeanSquaredError , MSE)定义如下: n i ii n i i YY n E n MSE 1 2 1 2 )ˆ( 11 (15-5) 式中,MSE表示均方差,其他符号同前。 本方法用于还原平方失真程度。 均方误差是预测误差平方之和的平均数,它避免了正负误差不能相加的问题。由于对误 差 E
0.0 233浏览
- RapidMiner大小:6MB图 15.2 设置三种不同分类模型
0.0 73浏览
- RapidMiner大小:6MB Kappa≥0.75 说明已经取得相当满意的一致程度 Kappa<0.4 说明一致程度不够 (7) 识别准确度 识别准确度(Accuracy)定义如下: 100% TP FN Accuracy TP TN FP FN (15-8) 式中各项说明如下: TP(True Positives):正确的肯定表示正确肯定的分类数
0.0 65浏览
- RapidMiner大小:6MB图 15.3 模型输出曲线 15.3 分类模型的准确率评估方式 RAPIDMINER 中包含很多分类算法,如: – 决策树分类 • ID3 • C4.5 – 贝叶斯分类 – 神经网络分类 – 支持向量机分类 – 其他分类 各个算法有着不同的性能和运算精度,通过对同一数据源应用不同的分类算法进行性能 测试,可比较各个算法的性能差异,进而选择最优的某个算法来
0.0 124浏览
- RapidMiner大小:6MB(1)简单验证 – 原理:将数据集整体划分为两个独立的数据集,通常训练级(2/3),测试集(1/3)。 – 变形的划分:随机子选样 图 15.4 简单验证 操作流程: 加载“Iris”数据集,调用“Split Data”操作符,将数据切分成 80%和 20%,将 80%部 分作为训练数据传给“Decision Tree”决策树模型,另外 20%作为测试数据传给“Apply Mod
0.0 57浏览
- RapidMiner大小:6MB图 15.7 交叉验证操作符 图 15.8 交叉验证操作符子流程 15.4 Bagging&Boosting 介绍 15.4.1Bagging 的基本思想 – 给定一个弱学习算法和一个训练集
0.0 98浏览
- RapidMiner大小:6MB15.5 参数优化 在此之前,当我们选定模型进行训练时,都采用的是默认的参数配置,当我们需要对参 数设置的时候,往往也因为取值范围过大,而不知道该如何选择,RapidMiner 给我们了一 些工具,可以产生一些帮助。如图 15.12 图 15.12 参数优化及应用模型流程 在图中,我们调用“Optimize Parameters(Grid)”网格性能优化操作符,在参数设置“Edit
0.0 90浏览
- RapidMiner大小:6MB15.13 模型微调参数设置 15.14 对参数设置进行记录 图 15.15 设置记录参数的设置
0.0 100浏览
- RapidMiner大小:6MB第16章 时间序列 16.1 时序模式 就餐饮企业而言,经常会碰到这样的问题: 由于餐饮行业是生产和销售同时进行的,因此销售预测对于餐饮企业十分必要。如何基于菜品 历史销售数据,做好餐饮销售预测?以便减少菜品脱销现象和避免因备料不足而造成的生产延误, 从而减少菜品生产等待时间,提供给客户更优质的服务,同时可以减少安全库存量,做到生产准时 制,降低物流成本。 餐饮销售预测可以看作是基于时间
0.0 74浏览
- RapidMiner大小:6MB(1) 平稳时间序列的定义 对于随机变量 X ,可以计算其均值(数学期望) 、方差 2 ;对于两个随机变量量 X 和Y , 可以计算 ,X Y 的协方差 cov( , ) [( )( )]X YX Y E X Y 和相关系数 cov( , ) ( , ) X Y X Y X Y ,它 们度量了两个不同事件之间的相互影响程度。 对于时间序列{ , }tX t T
0.0 103浏览
- RapidMiner大小:6MB图 16.9 训练数据信息
0.0 85浏览
- RapidMiner大小:6MB(1) 检验序列的平稳性 图 16-3 时序图显示该序列具有明显的单调递增趋势,可以判断为是非平稳序列;图 16-4 的自 相关图显示自相关系数长期大于零,说明序列间具有很强的长期相关性;表 16-7 单位根检验统计 量对应的 p 值显著大于 0.05,最终将该序列判断为非平稳序列(非平稳序列一定不是白噪声序列)。 时间 销 量 / 元 0 5 10 15 20 25 30 35 3 0
0.0 110浏览
- RapidMiner大小:6MB图 16.13 添加指数平滑处理 图 16.14 叠加指数平滑曲线后的效果图 第三步:趋势线 添加“Fit Trend”趋势线操作符,该操作符的执行需要添加子流程,在子流程中我们设置为神经网 络操作符,如图 16.15,运行结果如图 16.16
0.0 58浏览
- RapidMiner大小:6MB图 16.12 移动平均操作流程图 第二步:指数平滑 将“Exponential Smoothing”指数平滑操作符连接到处理页面,如图 16.13,执行后如图 16.14 ,我
0.0 67浏览
- RapidMiner大小:6MB图 16.17 窗口设置参数 图 16.18 滑动验证操作子流程
0.0 59浏览
- RapidMiner大小:6MB图 16.15 添加神经网络子流程 图 16.16 趋势图曲线对大盘走势的预测 第四步:模型预测 调用“Windowing”操作符,设置时间窗大小及步长,如图 16.17 然后添加“Sliding Window Validation”滑动窗口验证操作符,该操作符需要设置子流程,我们 把“SVM”支持向量机模型放入训练栏,应用模型和时间序列自己的性能操作符放入测试栏,如 图 16.18,最后
0.0 62浏览
- RapidMiner大小:6MB图 16.19 预测操作流程 图 16.20 模型预测视图
0.0 59浏览
- RapidMiner大小:6MB第17章 宏、循环和数据集处理 经过前面几章的学习,我们已经知道了数据挖掘的基本流程,在真实的数据挖掘工作中, 算法模型的建立所许付出的时间只占一小部分,数据的清洗、转换、加工部分往往占据很大 一部分,在这一章中,我们将在学习前面数据处理的基础上,详细介绍数据集处理的高级部 分。 17.1 宏 在 RapidMiner 中,宏的定义有几种方式: 第一种:Context 标签 在标
0.0 128浏览
- RapidMiner大小:6MB图 17.2 解析宏操作流程 从数据集中解出宏操作流程: 在解出宏操作符的定义中,我们给宏命名为 records,宏类型设置为 number_of_examples, 宏的输出值为 Irs 数据的总记录数,如果设置为 data_value 类型,它会询问我们要提取哪个 属性名称下的第几行的属性值。 以上我们介绍了宏定义的几种方式,在数据整理的过程中我们会经常用到宏,接下来我 们介绍其他几种
0.0 98浏览
- RapidMiner大小:6MB图 17.3 循环操作主流程 图 17.4 循环内部操作子流程 “Loop Files”循环文件,该操作符可以遍历目录中每一个子文件的名称。操作流程如图 17.5, 17.6. 图 17.5 循环文件操作主流程
0.0 53浏览
资源

点击登录
VIP尊享特权




立即开通
Airpods Pro带回家
最新资源
优质知识分享者