下载 >  开发技术 >  硬件开发 > 数据挖掘资料汇编.pdf

数据挖掘资料汇编.pdf

面\数据挖掘资料汇编.pdf面\数据挖掘资料汇编.pdf面\数据挖掘资料汇编.pdf面\数据挖掘资料汇编.pdf
2009-06-11 上传大小:356KB
想读
分享
收藏 举报
数据挖掘资料汇编

数据挖掘资料汇编 数据挖掘资料汇编 数据挖掘资料汇编 数据挖掘资料汇编 数据挖掘资料汇编

立即下载
ACM-ICPC培训资料汇编

ACM-ICPC培训资料汇编

立即下载
全国农产品成本收益资料汇编2017

全国农产品成本收益资料汇编最新数据2017.最新最新最!!!

立即下载
新中国农业60年统计资料完整版.pdf

《新中国农业60年统计资料》是一部全面反映新中国成立以来农村经济及农业生产发展历程的综合性统计资料工具书,收录了1949-2008年全国农业统计资料及1978-2008年各省(自治区、直辖市)主要农业统计资料。 综合篇、专业篇的农作物生产情况和畜牧业生产情况及地区篇的农村基本情况、农业生产条件、种植业生产和畜牧业生产情况数据均与国家统计局出版的《改革开放三十年统计资料汇编》数据核对一致(特殊标明的除外),相应指标统计口径及统计数据调整情况均与该书标注一致;各篇渔业、农机、农垦、乡企及农村能源数据来自农业部行业主管司局;国际比较篇数据主要来自于《国际统计年鉴》及联合国粮农组织等统计机构。

立即下载
第一届数学奥林匹克国家集训队资料选编(1986年).pdf

喜欢编程的,也喜欢数学,数学好,acm上的题就有可能以巧取胜。

立即下载
主板维修内部资料汇总

主板维修内部资料 内容很全面地包括了主板维修要注意的相关问题与及实际操作中要注意的细节。

立即下载
数据深度挖掘

数据挖掘资料汇编,需要的拿去是开发初级阶段必备的 书。

立即下载
新中国60年统计资料汇编

新中国60年统计资料 各个省份 城市的教育 医疗 人口 第一二三产业的统计数据

立即下载
1949-1987&1992;-2015历年林业统计年鉴

1949-1987&1992;-2015历年林业统计年鉴 1949-1987&1992;-2015历年林业统计年鉴

立即下载
数据挖掘 概念与技术 第三版中文版 pdf

数据挖掘 概念与技术 第三版中文版 pdf 出版者的话 中文版序 译者序 译者简介 第3版序 第2版序 前言 致谢 作者简介 第1章 引论 1.1 为什么进行数据挖掘 1.1.1 迈向信息时代 1.1.2 数据挖掘是信息技术的进化 1.2 什么是数据挖掘 1.3 可以挖掘什么类型的数据 1.3.1 数据库数据 1.3.2 数据仓库 1.3.3 事务数据 1.3.4 其他类型的数据 1.4 可以挖掘什么类型的模式 1.4.1 类/概念描述:特征化与区分 1.4.2 挖掘频繁模式、关联和相关性 1.4.3 用于预测分析的分类与回归 1.4.4 聚类分析 1.4.5 离群点分析 1.4.6 所有模式都是有趣的吗 1.5 使用什么技术 1.5.1 统计学 1.5.2 机器学习 1.5.3 数据库系统与数据仓库 1.5.4 信息检索 1.6 面向什么类型的应用 1.6.1 商务智能 1.6.2 Web搜索引擎 1.7 数据挖掘的主要问题 1.7.1 挖掘方法 1.7.2 用户界面 1.7.3 有效性和可伸缩性 1.7.4 数据库类型的多样性 1.7.5 数据挖掘与社会 1.8 小结 1.9 习题 1.10 文献注释 第2章 认识数据 2.1 数据对象与属性类型 2.1.1 什么是属性 2.1.2 标称属性 2.1.3 二元属性 2.1.4 序数属性 2.1.5 数值属性 2.1.6 离散属性与连续属性 2.2 数据的基本统计描述 2.2.1 中心趋势度量:均值、中位数和众数 2.2.2 度量数据散布:极差、四分位数、方差、标准差和四分位数极差 2.2.3 数据的基本统计描述的图形显示 2.3 数据可视化 2.3.1 基于像素的可视化技术 2.3.2 几何投影可视化技术 2.3.3 基于图符的可视化技术 2.3.4 层次可视化技术 2.3.5 可视化复杂对象和关系 2.4 度量数据的相似性和相异性 2.4.1 数据矩阵与相异性矩阵 2.4.2 标称属性的邻近性度量 2.4.3 二元属性的邻近性度量 2.4.4 数值属性的相异性:闵可夫斯基距离 2.4.5 序数属性的邻近性度量 2.4.6 混合类型属性的相异性 2.4.7 余弦相似性 2.5 小结 2.6 习题 2.7 文献注释 第3章 数据预处理 3.1 数据预处理:概述 3.1.1 数据质量:为什么要对数据预处理 3.1.2 数据预处理的主要任务 3.2 数据清理 3.2.1 缺失值 3.2.2 噪声数据 3.2.3 数据清理作为一个过程 3.3 数据集成 3.3.1 实体识别问题 3.3.2 冗余和相关分析 3.3.3 元组重复 3.3.4 数据值冲突的检测与处理 3.4 数据归约 3.4.1 数据归约策略概述 3.4.2 小波变换 3.4.3 主成分分析 3.4.4 属性子集选择 3.4.5 回归和对数线性模型:参数化数据归约 3.4.6 直方图 3.4.7 聚类 3.4.8 抽样 3.4.9 数据立方体聚集 3.5 数据变换与数据离散化 3.5.1 数据变换策略概述 3.5.2 通过规范化变换数据 3.5.3 通过分箱离散化 3.5.4 通过直方图分析离散化 3.5.5 通过聚类、决策树和相关分析离散化 3.5.6 标称数据的概念分层产生 3.6 小结 3.7 习题 3.8 文献注释 第4章 数据仓库与联机分析处理 4.1 数据仓库:基本概念 4.1.1 什么是数据仓库 4.1.2 操作数据库系统与数据仓库的区别 4.1.3 为什么需要分离的数据仓库 4.1.4 数据仓库:一种多层体系结构 4.1.5 数据仓库模型:企业仓库、数据集市和虚拟仓库 4.1.6 数据提取、变换和装入 4.1.7 元数据库 4.2 数据仓库建模:数据立方体与OLAP 4.2.1 数据立方体:一种多维数据模型 4.2.2 星形、雪花形和事实星座:多维数据模型的模式 4.2.3 维:概念分层的作用 4.2.4 度量的分类和计算 4.2.5 典型的OLAP操作 4.2.6 查询多维数据库的星网查询模型 4.3 数据仓库的设计与使用 4.3.1 数据仓库的设计的商务分析框架 4.3.2 数据仓库的设计过程 4.3.3 数据仓库用于信息处理 4.3.4 从联机分析处理到多维数据挖掘 4.4 数据仓库的实现 4.4.1 数据立方体的有效计算:概述 4.4.2 索引OLAP数据:位图索引和连接索引 4.4.3 OLAP查询的有效处理 4.4.4 OLAP服务器结构:ROLAP、MOLAP、HOLAP的比较 4.5 数据泛化:面向属性的归纳 4.5.1 数据特征的面向属性的归纳 4.5.2 面向属性归纳的有效实现 4.5.3 类比较的面向属性归纳 4.6 小结 4.7 习题 4.8 文献注释 第5章 数据立方体技术 5.1 数据立方体计算:基本概念 5.1.1 立方体物化:完全立方体、冰山立方体、闭立方体和立方体外壳 5.1.2 数据立方体计算的一般策略 5.2 数据立方体计算方法 5.2.1 完全立方体计算的多路数组聚集 5.2.2 BUC:从顶点方体向下计算冰山立方体 5.2.3 Star-Cubing:使用动态星树结构计算冰山立方体 5.2.4 为快速高维OLAP预计算壳片段 5.3 使用探索立方体技术处理高级查询 5.3.1 抽样立方体:样本数据上基于OLAP的挖掘 5.3.2 排序立方体:top-k查询的有效计算 5.4 数据立方体空间的多维数据分析 5.4.1 预测立方体:立方体空间的预测挖掘 5.4.2 多特征立方体:多粒度上的复杂聚集 5.4.3 基于异常的、发现驱动的立方体空间探查 5.5 小结 5.6 习题 5.7 文献注释 第6章 挖掘频繁模式、关联和相关性:基本概念和方法 6.1 基本概念 6.1.1 购物篮分析:一个诱发例子 6.1.2 频繁项集、闭项集和关联规则 6.2 频繁项集挖掘方法 6.2.1 Apriori算法:通过限制候选产生发现频繁项集 6.2.2 由频繁项集产生关联规则 6.2.3 提高Apriori算法的效率 6.2.4 挖掘频繁项集的模式增长方法 6.2.5 使用垂直数据格式挖掘频繁项集 6.2.6 挖掘闭模式和极大模式 6.3 哪些模式是有趣的:模式评估方法 6.3.1 强规则不一定是有趣的 6.3.2 从关联分析到相关分析 6.3.3 模式评估度量比较 6.4 小结 6.5 习题 6.6 文献注释 第7章 高级模式挖掘 7.1 模式挖掘:一个路线图 7.2 多层、多维空间中的模式挖掘 7.2.1 挖掘多层关联规则 7.2.2 挖掘多维关联规则 7.2.3 挖掘量化关联规则 7.2.4 挖掘稀有模式和负模式 7.3 基于约束的频繁模式挖掘 7.3.1 关联规则的元规则制导挖掘 7.3.2 基于约束的模式产生:模式空间剪枝和数据空间剪枝 7.4 挖掘高维数据和巨型模式 7.5 挖掘压缩或近似模式 7.5.1 通过模式聚类挖掘压缩模式 7.5.2 提取感知冗余的top-k模式 7.6 模式探索与应用 7.6.1 频繁模式的语义注解 7.6.2 模式挖掘的应用 7.7 小结 7.8 习题 7.9 文献注释 第8章 分类:基本概念 8.1 基本概念 8.1.1 什么是分类 8.1.2 分类的一般方法 8.2 决策树归纳 8.2.1 决策树归纳 8.2.2 属性选择度量 8.2.3 树剪枝 8.2.4 可伸缩性与决策树归纳 8.2.5 决策树归纳的可视化挖掘 8.3 贝叶斯分类方法 8.3.1 贝叶斯定理 8.3.2 朴素贝叶斯分类 8.4 基于规则的分类 8.4.1 使用IF-THEN规则分类 8.4.2 由决策树提取规则 8.4.3 使用顺序覆盖算法的规则归纳 8.5 模型评估与选择 8.5.1 评估分类器性能的度量 8.5.2 保持方法和随机二次抽样 8.5.3 交叉验证 8.5.4 自助法 8.5.5 使用统计显著性检验选择模型 8.5.6 基于成本效益和ROC曲线比较分类器 8.6 提高分类准确率的技术 8.6.1 组合分类方法简介 8.6.2 装袋 8.6.3 提升和AdaBoost 8.6.4 随机森林 8.6.5 提高类不平衡数据的分类准确率 8.7 小结 8.8 习题 8.9 文献注释 第9章 分类:高级方法 9.1 贝叶斯信念网络 9.1.1 概念和机制 9.1.2 训练贝叶斯信念网络 9.2 用后向传播分类 9.2.1 多层前馈神经网络 9.2.2 定义网络拓扑 9.2.3 后向传播 9.2.4 黑盒内部:后向传播和可解释性 9.3 支持向量机 9.3.1 数据线性可分的情况 9.3.2 数据非线性可分的情况 9.4 使用频繁模式分类 9.4.1 关联分类 9.4.2 基于有区别力的频繁模式分类 9.5 惰性学习法(或从近邻学习) 9.5.1 k-最近邻分类 9.5.2 基于案例的推理 9.6 其他分类方法 9.6.1 遗传算法 9.6.2 粗糙集方法 9.6.3 模糊集方法 9.7 关于分类的其他问题 9.7.1 多类分类 9.7.2 半监督分类 9.7.3 主动学习 9.7.4 迁移学习 9.8 小结 9.9 习题 9.10 文献注释 第10章 聚类分析:基本概念和方法 10.1 聚类分析 10.1.1 什么是聚类分析 10.1.2 对聚类分析的要求 10.1.3 基本聚类方法概述 10.2 划分方法 10.2.1 k-均值:一种基于形心的技术 10.2.2 k-中心点:一种基于代表对象的技术 10.3 层次方法 10.3.1 凝聚的与分裂的层次聚类 10.3.2 算法方法的距离度量 10.3.3 BIRCH:使用聚类特征树的多阶段聚类 10.3.4 Chameleon:使用动态建模的多阶段层次聚类 10.3.5 概率层次聚类 10.4 基于密度的方法 10.4.1 DBSCAN:一种基于高密度连通区域的基于密度的聚类 10.4.2 OPTICS:通过点排序识别聚类结构 10.4.3 DENCLUE:基于密度分布函数的聚类 10.5 基于网格的方法 10.5.1 STING:统计信息网格 10.5.2 CLIQUE:一种类似于Apriori的子空间聚类方法 10.6 聚类评估 10.6.1 估计聚类趋势 10.6.2 确定簇数 10.6.3 测定聚类质量 10.7 小结 10.8 习题 10.9 文献注释 第11章 高级聚类分析 11.1 基于概率模型的聚类 11.1.1 模糊簇 11.1.2 基于概率模型的聚类 11.1.3 期望最大化算法 11.2 聚类高维数据 11.2.1 聚类高维数据:问题、挑战和主要方法 11.2.2 子空间聚类方法 11.2.3 双聚类 11.2.4 维归约方法和谱聚类 11.3 聚类图和网络数据 11.3.1 应用与挑战 11.3.2 相似性度量 11.3.3 图聚类方法 11.4 具有约束的聚类 11.4.1 约束的分类 11.4.2 具有约束的聚类方法 11.5 小结 11.6 习题 11.7 文献注释 第12章 离群点检测 12.1 离群点和离群点分析 12.1.1 什么是离群点 12.1.2 离群点的类型 12.1.3 离群点检测的挑战 12.2 离群点检测方法 12.2.1 监督、半监督和无监督方法 12.2.2 统计方法、基于邻近性的方法和基于聚类的方法 12.3 统计学方法 12.3.1 参数方法 12.3.2 非参数方法 12.4 基于邻近性的方法 12.4.1 基于距离的离群点检测和嵌套循环方法 12.4.2 基于网格的方法 12.4.3 基于密度的离群点检测 12.5 基于聚类的方法 12.6 基于分类的方法 12.7 挖掘情境离群点和集体离群点 12.7.1 把情境离群点检测转换成传统的离群点检测 12.7.2 关于情境对正常行为建模 12.7.3 挖掘集体离群点 12.8 高维数据中的离群点检测 12.8.1 扩充的传统离群点检测 12.8.2 发现子空间中的离群点 12.8.3 高维离群点建模 12.9 小结 12.10 习题 12.11 文献注释 第13章 数据挖掘的发展趋势和研究前沿 13.1 挖掘复杂的数据类型 13.1.1 挖掘序列数据:时间序列、符号序列和生物学序列 13.1.2 挖掘图和网络 13.1.3 挖掘其他类型的数据 13.2 数据挖掘的其他方法 13.2.1 统计学数据挖掘 13.2.2 关于数据挖掘基础的观点 13.2.3 可视和听觉数据挖掘 13.3 数据挖掘应用 13.3.1 金融数据分析的数据挖掘 13.3.2 零售和电信业的数据挖掘 13.3.3 科学与工程数据挖掘 13.3.4 入侵检测和预防数据挖掘 13.3.5 数据挖掘与推荐系统 13.4 数据挖掘与社会 13.4.1 普适的和无形的数据挖掘 13.4.2 数据挖掘的隐私、安全和社会影响 13.5 数据挖掘的发展趋势 13.6 小结 13.7 习题 13.8 文献注释 参考文献 索引

立即下载
Python与数据挖掘中文高清完整版PDF

本书主要分为两大部分,基础篇和建模应用篇。基础篇介绍了有关Python开发环境的搭建、Python基础入门、函数、面向对象编程、实用模块和图表绘制等基础知识。建模应用篇主要介绍了目前在数据挖掘中的常用的建模方法在Python中的实现函数,并对输出结果进行了解释,有助于读者快速掌握应用Python进行分析挖掘建模的方法。本书配套提供了书中使用的示例代码及所用的数据,读者可通过上机实验,快速掌握书中所介绍的Python的使用方法。 《Python与数据挖掘》是一本适合教学和零基础自学的Python与数据挖掘的教程,即便你完全没有Python编程基础和数据挖掘基础,根据《Python与数据挖掘》中的理论知识和上机实践,也能迅速掌握如何使用Python进行数据挖掘。《Python与数据挖掘》已经被多所高校预定为教材,为了便于教学,书中还提供了大量的上机实验和教学资源。

立即下载
数据挖掘十大算法 pdf下载 完整版

数据挖掘十大算法 作者: (美)吴信东(Xindong Wu) / (美),库玛尔 ,(Vipin Kumar) 译者: 李文波 / 吴素研 出版社: 清华大学出版社 副标题: 数据挖掘十大算法 原作名: The Top the Algorithms in Data Mining 出版年: 2013-5 页数: 154 丛书: 世界著名计算机教材精选 ISBN: 9787302310617 《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。

立即下载
HP存储技术资料汇编

存储技术资料汇编 存储技术资料汇编 存储技术资料汇编 存储技术资料汇编 存储技术资料汇编

立即下载
数据仓库与数据挖掘实践 pdf

作者:李春葆,李石君,李筱驰 编著 出版时间:2014年 本书系统地介绍了数据仓库和数据挖掘技术,全本由两部分组成,第1章到第3章介绍数据仓库的基本概念和相关技术,第4章到第11章介绍数据挖掘的基本概念和各种算法,包括数据仓库构建、OLAP技术、分类方法、聚类方法、关联分析、序列模式挖掘方法、回归和时序分析、粗糙集理论、文本挖掘、Web挖掘和空间数据挖掘方法等。本书既注重原理,又注重实践,配有大量图表、示例和练习题,内容丰富,概念讲解清楚,表达严谨,逻辑性强,语言精练,可读性好。本书既便于教师课堂讲授,又便于自学者阅读。适合作为高等院校高年级学生和研究生“数据仓库和数据挖掘”或“数据挖掘算法”课程的教材。

立即下载
数据挖掘:概念与技术(中文第三版).pdf

数据挖掘:概念与技术(中文第三版).pdf 个人收集电子书,仅用学习使用,不可用于商业用途,如有版权问题,请联系删除!

立即下载
数据挖掘十大算法_高清pdf

详细介绍了10种在实际中用途最广、影响最大的数据挖掘算法:1C4.5;2K-Means;3SVM:SupportVectorMachines;4Apriori;5EM;6PageRank;7AdaBoost;8kNN:k-NearestNeighbors;9NaiveBayes;10CART:ClassificationandRegressionTrees。

立即下载
数据挖掘概念与技术 第三版.pdf

《数据挖掘(概念与技术)》全面而深入地叙述了数据库技术的发展和数据挖掘应用的重要性,数据仓库和OLAP(联机分析处理)技术,数据预处理技术(包括数据清理、数据集成和转换、数据归纳的方法),数据挖掘技术(包括分类、预测、关联和聚类等基础概念和技术),先进的数据库系统中的数据挖掘方法,数据挖掘的应用和一些具有挑战性的研究问题。作者注重实效,将以上内容辅以实例,对每类问题均提供代表性算法,并给出每一技术具体的应用法则。该书由10章及两个附录组成。通过《数据挖掘(概念与技术)》的学习,读者可以对数据挖掘的整体结构、概念和技术有深入的认识和了解,并且可以熟悉数据挖掘的基本原理和发展方向

立即下载
Python数据挖掘入门与实践(完整版).pdf

本书使用简单易学且拥有丰富第三方库和良好社区氛围的Python语言,由浅入深,以真实数据作为研究对象,真刀实枪地向读者介绍Python数据挖掘的实现方法。通过本书,读者将迈入数据挖掘的殿堂,透彻理解数据挖掘基础知识,掌握解决数据挖掘实际问题的杰出实践!

立即下载
数据挖掘与机器学习.pdf

机器学习与数据挖掘 南京大学计算机软件新技术国家重点实验室

立即下载
数据挖掘导论(英文版)_陈封能(Pang-Ning Tan)

陈封能的数据挖掘导论英文原版(Introduction to Datamining),适合学习数据挖掘的各位同学!经典教材!

立即下载
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

数据挖掘资料汇编.pdf

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: