下载 >  大数据 >  算法与数据结构 > 大数据挖掘
3

大数据挖掘

作 者 :熊赟,朱扬勇,陈志渊编 出版发行 : 上海:上海科学技术出版社 , 2016.04 ISBN号 :978-7-5478-2961-5 页 数 : 300 丛书名 : 大数据技术与应用 原书定价 : 75.00 主题词 : 数据采集 中图法分类号 : TP274 内容提要: 本书系统介绍了大数据挖掘的概念、原理、技术和应用, 具体内容包括: 认识和理解大数据 ; 大数据挖掘需要的相关技术 ; 大数据计算框架 ; 大数据挖掘任务 ; 大数据应用实现。 参考文献格式 : 熊赟,朱扬勇,陈志渊编. 大数据挖掘[M]. 上海:上海科学技术出版社, 2016.04.
2018-04-16 上传大小:49MB
想读
分享
收藏 (1) 举报

评论 共1条

qq_34261236 资源一般 还那么多积分,不值
2018-10-31
回复
大数据搜索与日志挖掘及可视化方案

大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch Logstash Kibana(第2版).高凯(详细书签).pdf

立即下载
大数据搜索与日志挖掘及可视化方案(第2版) 完整PDF

对大数据的搜索与挖掘,在当今的“互联网+”时代是很有必要的。本书提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际权威的数据库产品评测机构DB-Engines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名第一的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。

立即下载
数据挖掘与机器学习.pdf

机器学习与数据挖掘 南京大学计算机软件新技术国家重点实验室

立即下载
大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch Logstash Kibana(第2版).高凯(带详细书签) PDF 下载

大数据的搜索与挖掘,在当今的“互联网+”时代是很有必要的。本书提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际权威的数据库产品评测机构DBEngines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名第一的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。 全书以模块化的方式进行组织。和第一版相比,本书力求反映ELK Stack的最新成果,内容新颖、强调实践。本书也可为高等学校相关专业(如计算机科学与技术、软件工程、物联网、信息管理与信息系统)学生的学习和科研工作提供帮助,同时对于从事大数据搜索与挖掘、日志分析、信息可视化技术的工程技术人员和希望了解网络信息检索技术的人员也具有较高的参考价值和工程应用价值。 第1章 概述 1.1 Elasticsearch的安装与简单配置 1.2 走进Elasticsearch 1.2.1 相关概念 1.2.2 Elasticsearch API的简单使用方式 1.2.3 部分插件简介 1.2.4 Elasticsearch基本架构 1.3 Elasticsearch索引及其构建 1.3.1 概述 1.3.2 借助Head工具构建索引 1.3.3 Mapping简述 1.4 信息检索及其构建 1.5 中文分词插件 1.6 实例 1.7 扩展知识与阅读 1.8 本章小结 第2章 文档索引及管理 2.1 文档索引概述 2.2 建立索引 2.3 通过映像Mapping配置索引 2.3.1 在索引中使用映像 2.3.2 管理/配置映像 2.3.3 获取映像信息 2.3.4 删除映像 2.4 管理索引文件 2.4.1 打开、关闭、检测、删除索引文件 2.4.2 清空索引缓存 2.4.3 刷新索引数据 2.4.4 优化索引数据 2.4.5 flush操作 2.5 设置中文分词器 2.6 对文档的其他操作 2.6.1 获取指定的文档信息 2.6.2 删除文档中的信息 2.6.3 数据更新 2.6.4 基于POST方式批量获取文档 2.6.5 删除部分文档 2.7 实例 2.8 扩展知识与阅读 2.9 本章小结 第3章 信息检索与结果过滤 3.1 实验数据集描述 3.2 简单检索 3.3 基本检索 3.3.1 设置不同字段的排序权重 3.3.2 指定返回的字段子集 3.3.3 term查询、terms查询、wildcard通配符查询 3.3.4 match、match_all、match_phrase查询 3.3.5 query_string查询 3.3.6 prefix、range查询 3.3.7 more_like_this、fuzzy_like_this查询 3.3.8 跨字段检索 3.4 filter概述 3.5 常用filter及其应用 3.5.1 and filter及or filter 3.5.2 bool filter 3.5.3 exists filter和missing filter 3.5.4 type filter 3.5.5 match all filter 3.5.6 not filter 3.5.7 query filter 3.6 复合查询 3.7 结果排序 3.8 实例 3.9 扩展知识与阅读 3.1 0本章小结 第4章 信息统计分析与搜索提示 4.1 facets概述 4.2 各种不同的facets统计 4.2.1 terms facets:指定字段的分布情况统计 4.2.2 range facets:在某个范围的分布情况统计 4.2.3 histogram facets 4.2.4 date_histogram facets 4.2.5 statistical facets 4.2.6 terms_stats facets 4.3 aggregations 4.3.1 概述 4.3.2 最值、求和、均值统计 4.3.3 stats aggregation及extended stats aggregation 4.3.4 terms aggregations 4.3.5 range aggregations 4.3.6 date_range aggregations 4.3.7 histogram aggregations 4.3.8 date_histogram aggregations 4.3.9 filter aggregations 4.3.10 missing aggregations 4.4 搜索提示 4.5 实例 4.6 扩展知识与阅读 4.7 本章小结 第5章 Elasticsearch部分功能的Java客户端实现 5.1 Elasticsearch节点实例化 5.1.1 通过Maven添加对Elasticsearch依赖 5.1.2 初始化Elasticsearch Client 5.2 索引数据 5.2.1 准备json数据 5.2.2 索引json数据 5.3 对索引文档的操作 5.3.1 获取索引文档 5.3.2 删除索引文档 5.3.3 更新索引文档 5.3.4 批量操作索引文件 5.3.5 简单的统计操作 5.4 信息检索 5.4.1 概述 5.4.2 multiSearch 5.4.3 Query DSL概述 5.4.4 matchQuery 5.4.5 matchAllQuery 5.4.6 multiMatchQuery 5.4.7 boolQuery 5.4.8 termQuery 5.4.9 wildcardQuery 5.4.10 queryString 5.4.11 moreLikeThis 5.4.12 filter概述 5.4.13 termFilter 5.4.14 existsFilter 5.4.15 matchAllFilter 5.4.16 queryFilter 5.4.17 rangeFilter 5.4.18 typeFilter 5.4.19 过滤器间的组合:boolFilter、notFilter、orFilter、andFilter 5.5 统计分析 5.5.1 facets 5.5.2 aggregations 5.6 对检索结果的进一步处理 5.6.1 控制每页的显示数量及显示排序依据 5.6.2 基于Scroll方法的检索结果及其分页 5.6.3 高亮显示检索词 5.7 实例 5.7.1 连接Elasticsearch 5.7.2 信息采集与索引构建 5.7.3 搜索模块的实现 5.7.4 推荐模块的实现 5.8 扩展知识与阅读 5.9 本章小结 第6章 Elasticsearch配置与集群管理 6.1 Elasticsearch部分基本配置及其说明 6.2 提高索引和查询效率的策略 6.3 监控集群状态 6.4 控制索引分片与副本分配 6.5 集群管理 6.6 扩展知识与阅读 6.7 本章小结 第7章 基于Logstash的日志处理 7.1 概述 7.2 input:处理输入的日志数据 7.2.1 处理基于file方式输入的日志信息 7.2.2 处理基于generator产生的日志信息 7.2.3 处理基于log4j的日志信息 7.2.4 处理基于redis的日志信息 7.2.5 处理基于stdin方式输入的信息 7.2.6 处理基于TCP传输的日志数据 7.2.7 处理基于UDP传输的日志数据 7.3 codecs:格式化日志数据 7.3.1 json格式 7.3.2 rubydebug格式 7.3.3 plain格式 7.4 基于filter的日志处理与转换 7.4.1 json filter 7.4.2 grok filter 7.4.3 kv filter 7.5 output:处理输出的日志数据 7.5.1 将处理后的日志输出到Elasticsearch中 7.5.2 将处理后的日志输出至文件中 7.5.3 将处理后的部分日志输出到csv格式的文件中 7.5.4 将处理后的日志输出到redis中 7.5.5 将处理后的部分日志通过UDP协议输出 7.5.6 将处理后的部分日志通过TCP协议输出 7.5.7 将收集到的日志信息传输到自定义的HTTP接口中 7.6 扩展知识与阅读 7.7 本章小结 第8章 基于Kibana的数据分析可视化 8.1 安装Kibana 8.2 Kibana概述 8.2.1 在仪表盘上添加新行 8.2.2 在行中添加新面板 8.2.3 设置Query和Filtering 8.3 常用面板类型 8.3.1 histogram 8.3.2 table 8.3.3 map和bettermap 8.3.4 terms 8.3.5 text 8.3.6 sparklines 8.3.7 trends 8.4 网站性能监控可视化应用的设计与实现 8.4.1 概述 8.4.2 Page View 8.4.3 响应/请求时间 8.4.4 流量走势与统计 8.4.5 状态码监控 8.4.6 UA行 8.5 Kibana V4简介 8.5.1 新建视图 8.5.2 建立Dashboard 8.5.3 配置 8.6 扩展知识与阅读 8.7 本章小结 第9章 网络信息检索与分析实践 9.1 信息采集 9.2 基于Python的信息检索及Web端设计 9.2.1 安装Python及Django 9.2.2 安装Elasticsearch的Python插件 9.2.3 Web页面设计 9.3 基于Logstash的日志处理 9.3.1 安装和配置Nginx 9.3.2 设计面向日志文件的模式 9.3.3 在Logstash中进行相关配置 9.4 基于Kibana的日志分析结果可视化设计与实现 9.4.1 图表1:状态码走势分析 9.4.2 图表2:查询词分析 9.4.3 图表3:分析各状态码随时间的变迁情况 9.4.4 集成上述图表 9.5 扩展知识与阅读 9.6 本章小结 参考文献 封底

立即下载
Hadoop大数据分析与挖掘实战PDF

Hadoop大数据分析与挖掘实战, 完整扫描高清版,307页。

立即下载
《NEW INTERNET 大数据挖掘》(谭磊)【电子工业出版社】

想真正了解何为数据?想知道如何对数据进行采集、分析、挖掘与应用?请阅读此书。

立即下载
Hadoop大数据分析与挖掘实战

《Hadoop大数据分析与挖掘实战》共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助TipDM-HB大数据挖掘建模平台,通过上机实验,以快速理解相关知识与理论。

立即下载
NLPIR大数据搜索与挖掘共享开发平台

多字段关联搜索:非结构化与结构化字段的关联搜索,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;

立即下载
大数据搜索与挖掘

扫描完整版 大数据搜索与挖掘 大数据搜索与挖掘 大数据搜索与挖掘

立即下载
大数据挖掘与商务智能简述

大数据挖掘与商务智能简述 大数据挖掘与商务智能简述 大数据挖掘与商务智能简述 150页成品

立即下载
实战Elasticsearch、Logstash、Kibana 分布式大数据搜索与日志挖掘及可视化解决方案_PDF电子书下载 高清 完整

自己网上花钱买的,共享出来,3分很实惠的,需要的拿走

立即下载
Hadoop大数据分析与挖掘实战_完整版PDF编著张良均

Hadoop大数据分析与挖掘实战_完整版PDF编著张良均,机械工业出版社

立即下载
大数据精准挖掘 pdf

作者: 吴昊 出版社: 化学工业出版社 出版年: 2014 页数: 174 装帧: 平装 ISBN: 9787122189929 《大数据精准挖掘》以新兴的大数据时代最实用的技术为支撑,以广阔的科技视野和扎实的专业功底,全面介绍了大数据时代的由来和背景,阐述了与大数据分析相关的理论和数学模型。特别难能可贵的是,本书从蕴含大数据技术的精准数据挖掘工具入手,结合实际的成功案例,将数据精准挖掘的全过程和详细步骤,包括结果验证等方面内容,详详细细并非常专业地展现给读者。本书理论和实践密切结合,文字流畅,深入浅出,通俗易懂。通过本书的学习,可以掌握当下大数据所涉及的主要数学分析模块的要点,并比较相互的特点。同时,能够学会实用的数据挖掘专门技术及经历数据挖掘的全过程。由于本书所介绍的技术与我国目前大数据运用的领军行业金融、保险、电信、电子商务等密切相连,故本书有很强的实用性,能达到学以致用、边学边用的效果。《大数据精准挖掘》适合我国IT业的科研机构、相关企业的专业技术人员的学习之用;本书还可以作为政府部门制定大数据发展战略时的参考。本书也适合全国高等院校的大学生和研究生学习使用;由于本书将理论与具体操作合二为一,故也能作为全国大专院校开设大数据实验课程的教材。

立即下载
大数据挖掘技术与应用 pdf

作者:孟海东,宋宇辰 著 出版时间:2014年 出版社:冶金工业出版社 本书针对数据的海量性、复杂性、高维性、模糊性和不完整性,对数据挖掘技术中的聚类分析和关联规则分析进行了系统的研究。设计与实现了基于密度和自适应密度可达聚类算法、基于簇特征的动态增量聚类算法、并行聚类算法、基于密度加权的模糊聚类算法、高唯复杂数据聚类算法、基于数据场的聚类算法、基于距离的量化关联规则和基于数据场的量化关联规则算法,给出了在矿产资源评价、遥感图像分类、矿业经济分析中的应用例证。全书共分11章,主要内容包括:绪论,基于密度和密度可达聚类分析,基于簇特征的动态增量聚类分析,并行聚类分析,基于密度加权的模糊聚类分析,高唯复杂数据聚类分析,基于数据场的聚类分析,基于距离的量化关联规则,基于数据场的量化关联规则,数据挖掘结果可视化和数据挖掘算法应用。

立即下载
Hadoop大数据分析与挖掘实战 完整pdf扫描版

【更多关于《Hadoop》资料,加qq群:931257845领取!】 10多位技术专家结合自己10多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hadoop架构技术进行大数据挖掘建模、数据分析和二次开发。 本书共16章,分三个部分:基础篇、实战篇、高级篇。 基础篇(第1~6章),第1章的主要内容是数据挖掘概述、大数据餐饮行业应用;第2章针对大数据理论知识进行基础讲解,简明扼要地对Hadoop安装、原理等做了介绍;第3章介绍了大数据仓库Hive的安装、原理等内容;第4章介绍了大数据数据库HBase的安装、原理等内容;第5章介绍了几种大数据挖掘建模平台,同时重点介绍了本书使用的开源TipDM-HB大数据挖掘平台;第6章对数据挖掘的建模过程,各种挖掘建模的常用算法与原理及其在大数据挖掘算法库Mahout的实现原理进行了介绍。 实战篇(第7~14章),重点对大数据挖掘技术在法律咨询、电子商务、航空、移动通信、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述大数据时代针对大数据的分析方法与过程,最后完成模型构建的顺序进行,对建模过程等关键环节进行了详细的分析。最后通过上机实践,加深对大数据挖掘技术以及分析流程的认识。 高级篇(第15~16章),介绍了基于Hadoop大数据开发的相关技术以及开发步骤,同时使用实例来展示这些步骤,使读者可以自己动手实践,亲自体会开发的乐趣;同时,还介绍了基于TipDM-HB大数据挖掘平台的二次开发实例,借助TipDM-HB大数据挖掘平台二次开发工具,可以更加快捷、高效地完成相关大数据应用的二次开发,降低开发难度,使读者更方便地体会到大数据分析与挖掘的强大魅力。 目录 第1章 数据挖掘基础2 第2章 Hadoop基础16 第3章 Hadoop生态系统:Hive34 第4章 Hadoop生态系统:HBase46 第5章 大数据挖掘建模平台62 第6章 挖掘建模69 第7章 法律咨询数据分析与服务推荐112 第8章 电商产品评论数据情感分析146 第9章 航空公司客户价值分析170 第10章 基站定位数据商圈分析184 第11章 互联网电影智能推荐196 第12章 家电故障备件储备预测分析204 第13章 市供水混凝投药量控制分析218 第14章 基于图像处理的车辆压双黄线检测240 第15章 基于Mahout的大数据挖掘开发254 第16章 基于TipDM-HB的数据挖掘二次开发272

立即下载
大数据中挖什么 计算机学会通讯

大数据挖掘旨在从大数据中挖掘出未知且有用的知识。只有通过挖掘,大数据的价值才得以体现, 挖掘对大数据的利用有着举足轻重的意义。

立即下载
基于用户画像的大数据挖掘实践-.pdf

基于用户画像的大数据挖掘实践-.pdf 个人收集电子书,仅用学习使用,不可用于商业用途,如有版权问题,请联系删除!

立即下载
大数据分析挖掘技术在电商的应用

大数据分析挖掘技术在电商的应用,大数据分析挖掘技术在电商的应用

立即下载
大数据学习的原始数据,可以用这些数据进行数据清洗挖掘

里面放的是百度云连接,大概有几个G的用户数据,是大数据学习的很重要的数据原,可以用来练习

立即下载
基于用户画像的大数据挖掘实践

2014中华架构师大会材料 大数据,用户画像,机器学习,数据挖掘

立即下载
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

大数据挖掘

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: