大数据架构详解:从数据获取到深度学习
作者:朱洁、罗华霖
出版社:电子工业出版社
ISBN:9787121300004
VIP会员免费
(仅需0.8元/天)
¥ 27.6
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch Logstash Kibana(第2版).高凯(详细书签).pdf 评分:
大数据的搜索与挖掘,在当今的“互联网+”时代是很有必要的。本书提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理、全文检索、日志挖掘、可视化等问题。构建在全文检索开源软件Lucene之上的Elasticsearch,不仅能对海量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据国际权威的数据库产品评测机构DBEngines的统计,在2016年1月,Elasticsearch已超过Solr等,成为排名第一的搜索引擎类应用;Logstash能有效处理来源于各种数据源的日志信息;Kibana能得出可视化分析结果。了解基于ELK Stack的大数据搜索与日志挖掘及可视化方案,掌握Elasticsearch、Logstash、Kibana的基本使用方法和技巧,很有必要。 全书以模块化的方式进行组织。和第一版相比,本书力求反映ELK Stack的最新成果,内容新颖、强调实践。本书也可为高等学校相关专业(如计算机科学与技术、软件工程、物联网、信息管理与信息系统)学生的学习和科研工作提供帮助,同时对于从事大数据搜索与挖掘、日志分析、信息可视化技术的工程技术人员和希望了解网络信息检索技术的 人员也具有较高的参考价值和工程应用价值。 第1章 概述 1.1 Elasticsearch的安装与简单配置 1.2 走进Elasticsearch 1.2.1 相关概念 1.2.2 Elasticsearch API的简单使用方式 1.2.3 部分插件简介 1.2.4 Elasticsearch基本架构 1.3 Elasticsearch索引及其构建 1.3.1 概述 1.3.2 借助Head工具构建索引 1.3.3 Mapping简述 1.4 信息检索及其构建 1.5 中文分词插件 1.6 实例 1.7 扩展知识与阅读 1.8 本章小结 第2章 文档索引及管理 2.1 文档索引概述 2.2 建立索引 2.3 通过映像Mapping配置索引 2.3.1 在索引中使用映像 2.3.2 管理/配置映像 2.3.3 获取映像信息 2.3.4 删除映像 2.4 管理索引文件 2.4.1 打开、关闭、检测、删除索引文件 2.4.2 清空索引缓存 2.4.3 刷新索引数据 2.4.4 优化索引数据 2.4.5 flush操作 2.5 设置中文分词器 2.6 对文档的其他操作 2.6.1 获取指定的文档信息 2.6.2 删除文档中的信息 2.6.3 数据更新 2.6.4 基于POST方式批量获取文档 2.6.5 删除部分文档 2.7 实例 2.8 扩展知识与阅读 2.9 本章小结 第3章 信息检索与结果过滤 3.1 实验数据集描述 3.2 简单检索 3.3 基本检索 3.3.1 设置不同字段的排序权重 3.3.2 指定返回的字段子集 3.3.3 term查询、terms查询、wildcard通配符查询 3.3.4 match、match_all、match_phrase查询 3.3.5 query_string查询 3.3.6 prefix、range查询 3.3.7 more_like_this、fuzzy_like_this查询 3.3.8 跨字段检索 3.4 filter概述 3.5 常用filter及其应用 3.5.1 and filter及or filter 3.5.2 bool filter 3.5.3 exists filter和missing filter 3.5.4 type filter 3.5.5 match all filter 3.5.6 not filter 3.5.7 query filter 3.6 复合查询 3.7 结果排序 3.8 实例 3.9 扩展知识与阅读 3.1 0本章小结 第4章 信息统计分析与搜索提示 4.1 facets概述 4.2 各种不同的facets统计 4.2.1 terms facets:指定字段的分布情况统计 4.2.2 range facets:在某个范围的分布情况统计 4.2.3 histogram facets 4.2.4 date_histogram facets 4.2.5 statistical facets 4.2.6 terms_stats facets 4.3 aggregations 4.3.1 概述 4.3.2 最值、求和、均值统计 4.3.3 stats aggregation及extended stats aggregation 4.3.4 terms aggregations 4.3.5 range aggregations 4.3.6 date_range aggregations 4.3.7 histogram aggregations 4.3.8 date_histogram aggregations 4.3.9 filter aggregations 4.3.10 missing aggregations 4.4 搜索提示 4.5 实例 4.6 扩展知识与阅读 4.7 本章小结 第5章 Elasticsearch部分功能的Java客户端实现 5.1 Elasticsearch节点实例化 5.1.1 通过Maven添加对Elasticsearch依赖 5.1.2 初始化Elasticsearch Client 5.2 索引数据 5.2.1 准备json数据 5.2.2 索引json数据 5.3 对索引文档的操作 5.3.1 获取索引文档 5.3.2 删除索引文档 5.3.3 更新索引文档 5.3.4 批量操作索引文件 5.3.5 简单的统计操作 5.4 信息检索 5.4.1 概述 5.4.2 multiSearch 5.4.3 Query DSL概述 5.4.4 matchQuery 5.4.5 matchAllQuery 5.4.6 multiMatchQuery 5.4.7 boolQuery 5.4.8 termQuery 5.4.9 wildcardQuery 5.4.10 queryString 5.4.11 moreLikeThis 5.4.12 filter概述 5.4.13 termFilter 5.4.14 existsFilter 5.4.15 matchAllFilter 5.4.16 queryFilter 5.4.17 rangeFilter 5.4.18 typeFilter 5.4.19 过滤器间的组合:boolFilter、notFilter、orFilter、andFilter 5.5 统计分析 5.5.1 facets 5.5.2 aggregations 5.6 对检索结果的进一步处理 5.6.1 控制每页的显示数量及显示排序依据 5.6.2 基于Scroll方法的检索结果及其分页 5.6.3 高亮显示检索词 5.7 实例 5.7.1 连接Elasticsearch 5.7.2 信息采集与索引构建 5.7.3 搜索模块的实现 5.7.4 推荐模块的实现 5.8 扩展知识与阅读 5.9 本章小结 第6章 Elasticsearch配置与集群管理 6.1 Elasticsearch部分基本配置及其说明 6.2 提高索引和查询效率的策略 6.3 监控集群状态 6.4 控制索引分片与副本分配 6.5 集群管理 6.6 扩展知识与阅读 6.7 本章小结 第7章 基于Logstash的日志处理 7.1 概述 7.2 input:处理输入的日志数据 7.2.1 处理基于file方式输入的日志信息 7.2.2 处理基于generator产生的日志信息 7.2.3 处理基于log4j的日志信息 7.2.4 处理基于redis的日志信息 7.2.5 处理基于stdin方式输入的信息 7.2.6 处理基于TCP传输的日志数据 7.2.7 处理基于UDP传输的日志数据 7.3 codecs:格式化日志数据 7.3.1 json格式 7.3.2 rubydebug格式 7.3.3 plain格式 7.4 基于filter的日志处理与转换 7.4.1 json filter 7.4.2 grok filter 7.4.3 kv filter 7.5 output:处理输出的日志数据 7.5.1 将处理后的日志输出到Elasticsearch中 7.5.2 将处理后的日志输出至文件中 7.5.3 将处理后的部分日志输出到csv格式的文件中 7.5.4 将处理后的日志输出到redis中 7.5.5 将处理后的部分日志通过UDP协议输出 7.5.6 将处理后的部分日志通过TCP协议输出 7.5.7 将收集到的日志信息传输到自定义的HTTP接口中 7.6 扩展知识与阅读 7.7 本章小结 第8章 基于Kibana的数据分析可视化 8.1 安装Kibana 8.2 Kibana概述 8.2.1 在仪表盘上添加新行 8.2.2 在行中添加新面板 8.2.3 设置Query和Filtering 8.3 常用面板类型 8.3.1 histogram 8.3.2 table 8.3.3 map和bettermap 8.3.4 terms 8.3.5 text 8.3.6 sparklines 8.3.7 trends 8.4 网站性能监控可视化应用的设计与实现 8.4.1 概述 8.4.2 Page View 8.4.3 响应/请求时间 8.4.4 流量走势与统计 8.4.5 状态码监控 8.4.6 UA行 8.5 Kibana V4简介 8.5.1 新建视图 8.5.2 建立Dashboard 8.5.3 配置 8.6 扩展知识与阅读 8.7 本章小结 第9章 网络信息检索与分析实践 9.1 信息采集 9.2 基于Python的信息检索及Web端设计 9.2.1 安装Python及Django 9.2.2 安装Elasticsearch的Python插件 9.2.3 Web页面设计 9.3 基于Logstash的日志处理 9.3.1 安装和配置Nginx 9.3.2 设计面向日志文件的模式 9.3.3 在Logstash中进行相关配置 9.4 基于Kibana的日志分析结果可视化设计与实现 9.4.1 图表1:状态码走势分析 9.4.2 图表2:查询词分析 9.4.3 图表3:分析各状态码随时间的变迁情况 9.4.4 集成上述图表 9.5 扩展知识与阅读 9.6 本章小结 参考文献 封底
上传时间:2018-04 大小:37.58MB
- 7.34MB
Kibana7权威指南.pdf
2019-06-25Kibana是一个开源的分析和可视化平台,旨在与ElasticSearch完美结合。您可以使用Kibana来搜索、查看以及与存储在ElasticSearch中的数据交互。您可以轻松地执行高级数据分析,并使用各种图表、表格和地图可视化数据。 Kibana使理解大量数据变得容易。它简单、基于浏览器的界面使您能够快速创建和分享动态仪表盘(dashboard),这些仪表盘实时地以图标的形式显示ElasticSearch中数据的分布情况,也可以实时地对大数据集进行分析和产出BI报表。
- 12.70MB
ElasticSearch实战 in Action.zip
2019-07-01ElasticSearch实战 in Action(原著原版)压缩包,ElasticSearch文档,ES全文检索从入门到精通,高清PDF,是学习es和精通es必备手册,能快速达到精通ElasticSearch,一册在手,ElasticSearch无忧,开发、学习、调优都可使用。
- 192KB
kibana安装.pdf
2019-11-29CentOS下安装Kibana 1、下载Kibana 在官网https://www.elastic.co/cn/downloads/past-releases#kibana下载Kibana的压缩包,建议 与Elasticsearch版本一致,这里我下载的是6.6.0版本。 2、安装Kibana 将下载好的kibana-6.6.0-linux-x86_64.tar.gz上传至服务器的某个文件夹下,这里我在opt文件 夹下创建了kibanaFolder文件夹用于存放kibana-6.6.0-linux-x86_64.tar.gz。 tar -zxvf kibana-6.6.0-linux-x86_64.tar.gz 压缩包的解压 解压后文件如下 修改Kibana配置文件 3、启动Kibana 4、开机自启动配置 [root@node4 ~]# cd /opt/kibanaFolder/ [root@node4 kibanaFolder]# ll total 176480 drwxr-xr-x 13 root root 4096 Sep 25 09:14 kibana-6
- 37.81MB
大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch Logstash Kibana(第2版)
2018-02-17大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch Logstash Kibana(第2版).高凯 详细书签 很详细的PDF 值得收藏与下载
- 852KB
elasticsearch实战
2014-04-23本书是关于elasticsearch的精典书籍,是初学者必看的一本书。里面讲述了es的各个关键技术。
- 36.22MB
大数据搜索与日志挖掘及可视化方案 ELK Stack Elasticsearch Logstash Kibana 第2版
2019-04-24大数据搜索与日志挖掘及可视化方案 ELK Stack Elasticsearch Logstash Kibana 第2版
- 37.57MB
大数据搜索与日志挖掘及可视化方案--ELK+Stack+Elasticsearch+Logstash+Kibana.pdf
2018-02-13大数据搜索与日志挖掘及可视化方案--ELK+Stack+Elasticsearch+Logstash+Kibana大数据搜索与日志挖掘及可视化方案--ELK+Stack+Elasticsearch+Logstash+Kibana
- 420.5MB
Elasticsearch搜集的资料
2018-12-29下卷》.pdf、Elasticsearch 权威指南(中文版).pdf、Elasticsearch集成Hadoop最佳实践.pdf、Elasticsearch技术解析与实战.pdf、Lucene实战(第2版).pdf、大数据搜索与日志挖掘及可视化方案——ELK Stack:Elastic...
- 55.33MB
实战ELK-分布式大数据搜索与日志挖掘及可视化解决方案
2018-05-04实战Elasticsearch、Logstash、Kibana 分布式大数据搜索与日志挖掘及可视化解决方案
- 184.13MB
Elastic Search实战
2018-04-25Elastic Search技术与实战Elastic Search技术与实战Elastic Search技术与实战
- 55.27MB
实战Elasticsearch、Logstash、Kibana++分布式大数据搜索与日志挖掘及可视化解决方案.pdf
2018-08-02实战Elasticsearch、Logstash、Kibana++分布式大数据搜索与日志挖掘及可视化解决方案.pdf
- 1.29MB
ElasticSearch、Logstash、Kibana
2017-08-11ELK是ElasticSearch、Logstash、Kibana的简称。ELK在最近两年迅速崛起,成为机器数据分析,或者说实时日志处理领域,开源界的第一选择
- 11.12MB
kibana中文版(kibana中文指南)
2016-02-17kibana中文版(kibana中文指南)
- 1.38MB
Logash+Elasticsearch+Kibana 日志系统全套安装部署.pdf
2018-01-25Logash+Elasticsearch+Kibana 日志系统安装部署教程。。
- 71B
elk 6视频教程elastic stack实战Elasticsearch Logstash Kibana
2019-04-24elk 6视频教程elastic stack实战Elasticsearch Logstash Kibana
- 11KB
kubernetes-elk-cluster, 在Kubernetes的顶部,ELK ( Elasticsearch Logstash Kibana ) 集群.zip
2019-09-18kubernetes-elk-cluster, 在Kubernetes的顶部,ELK ( Elasticsearch Logstash Kibana ) 集群 kubernetes-elk-clusterELK ( 英镑 Elasticsearch Logstash 英镑 Kibana ),使easy轻松。在这里你可以找到:连接Elastic...
- 760.58MB
elasticsearch+logstash+kibana+filebeat.7z (ELK 7.9.0)
2021-04-25本压缩包内包含:Elasticsearch+Logstash+Kibana+Filebeat(ELK全部7.9.0版本)
- 180.32MB
ELK( ElasticSearch、Logstash和Kiabana)
2018-07-20开源实时日志分析ELK平台能够完美的解决日志收集和日志检索、分析的问题,ELK就是指ElasticSearch、Logstash和Kiabana三个开源工具。 因为ELK是可以跨平台部署,因此非常适用于多平台部署的应用。 二 环境准备 1...
- 2.85MB
ELK学习笔记.docx elasticsearch logstash kibana 环境搭建开发
2018-02-03ELK学习笔记.docx elasticsearch logstash kibana 环境搭建开发
- 8KB
vagrant-elk-box, 安装 elasticsearch,logstash和kibana的Vagrant框.zip
2019-09-18vagrant-elk-box, 安装 elasticsearch,logstash和kibana的Vagrant框 这里vagrant安装 elasticsearch 1.7,logstash 1.5.4和 kibana 4.1.1先决条件VirtualBox和 Vagrant 其他提供商,如VMWare可能工作,没有测试 !...
- 152KB
Spring Cloud集成ELK完成日志收集实战(elasticsearch、logstash、kibana)
2021-01-07对于日志来说,最常见的需求就是收集、存储、查询、展示,开源社区正好有相对应的开源项目:logstash(收集)、elasticsearch(存储+搜索)、kibana(展示),我们将这三个组合起来的技术称之为ELK,所以说ELK指的是...
- 449.8MB
架构师日志平台ELKStack实践视频.zip
2022-02-122.es集群.flv 3-logstash快速入门.flv 4-logstash收集系统日志-file.flv 5-logstash收集java日志-codec.flv 6-kibana介绍.flv 7-logstash收集nginx访问日志-json.flv 8-logstash收集syslog日志.flv 9-logstash收集...
- 5.0MB
Practical.ELK.Stack.1484226259.pdf
2017-02-06Practical ELK Stack: Build Actionable Insights and Business Metrics Using the Combined Power of Elasticsearch, Logstash, and Kibana Use the ELK (Elasticsearch, Logstash, and Kibana) stack to build ...
- 421.19MB
elasticsearch,logstash,kibana版本6.4.3.zip
2021-07-29elasticsearch-6.4.3 elasticsearch-analysis-ik-6.4.3 kibana-6.4.3-windows-x86_64 ...本文介绍的是elastic stack开源的ELK组件,主要包括elasticsearch(简称es),logstash,kibana三个核心组件。
- 404.64MB
Logstash日志数据采集与ELK可视化分析实战
2022-02-21基于Logstash的日志数据采集和ELK可视化海量日志分析平台实战(全套视频+课件+代码+讲义+工具),具体内容包括: 01 Logstash的架构及运行流程 02 Logstash的数据采集案例(一) 03 Logstash的数据采集案例(二) 04...
- 12.47MB
elk实战指南,权威指南 elk-stack-guide-cn.pdf
2018-01-12elk 权威指南 elasticsearch logstash kibana elk实战指南,权威指南 elk-stack-guide-cn.pdf
- 2KB
xthreg2命令安装包
2022-04-09门槛回归 门限回归 stata 门槛面板 门槛回归(Threshold Regression)是一种非线性回归方法,它假设因变量在自变量上存在一个或多个阈值,当自变量超过或达到这个阈值时,因变量的变化发生了显著的跃迁。因此,门槛回归可以用来分析因变量对于自变量的非线性响应,特别是当因变量的响应在某个阈值点发生了显著变化时。 门限回归(Tobit Regression)是一种特殊的门槛回归方法,它被广泛用于处理截尾数据或半截尾数据。在门限回归中,因变量的值只有在一个阈值以上才能被观测到,而在这个阈值以下,因变量的值被截断或缺失。因此,门限回归通常用于分析存在截尾数据或半截尾数据的情况下,自变量对于因变量的影响。 Stata是一种常用的统计软件,可以进行门槛回归和门限回归分析。使用Stata进行门槛回归和门限回归分析需要使用特定的命令,如"threshold"和"censored"命令。 门槛面板(Threshold Panel)模型则是一种将门槛回归和面板数据模型相结合的方法。在门槛面板模型中,因变量的非线性响应在面板数据中是存在的,而这种响应是通过将截距项或斜率项或两者都设置为门
- 62.16MB
超强股票分析工具,财星系列
2024-04-25超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析超强股票分析工具,财星系列,股票行情走势,股票涨跌分析
- 3.40MB
Python金融量化的高级库:TA-Lib-0.4.24(包含python3.7、3.8、3.9、3.10的32位和64位版本)
2023-08-02TA-Lib(Technical Analysis Library, 即技术分析库)是Python金融量化的高级库,涵盖了150多种股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等。但很多人安装指标计算ta-lib库就总报错,就可以在这里找到包下载后安装。 文件举例:TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 命名解释:包名-版本号-cp37代表适用于python3.7版本-win代表windows平台-amd64表示64位版本(与python版本要一致) 假定文件下载到d盘根目录,使用如下命令进行安装: pip install d:\TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 原文链接:https://blog.csdn.net/popboy29/article/details/126140862 建议使用360压缩进行解压。