Hadoop大数据实战权威指南(第2版)
电子书推荐
-
大数据之路:阿里巴巴大数据实践 评分:
在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。 《大数据之路:阿里巴巴大数据实践》就是在此背景下完成的。《大数据之路:阿里巴巴大数据实践》中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。 《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信《大数据之路:阿里巴巴大数据实践》中的实践和思考对同行会有很大的启发和借鉴意义。
上传时间:2018-04 大小:85.6MB
- 11.9MB
阿里巴巴大数据实践之路.pdf
2021-10-06阿里巴巴大数据实践之路.pdf
- 85.89MB
阿里大数据之路:阿里巴巴大数据实践-339页.zip
2021-09-29阿里大数据之路:阿里巴巴大数据实践-339页
- 2.4MB
阿里巴巴大数据实践之路
2015-11-12云栖大会, 阿里巴巴大数据实践, 介绍了阿里巴巴数据存储,打通,运营过程
- 97.61MB
阿里巴巴大数据实践
2019-04-12大数据《《大数据之路:阿里巴巴大数据实践》》,高清
- 104.86MB
阿里巴巴 大数据之路
2019-04-29阿里巴巴,作为距离大数据最近的公司之一,近几年对大数据却鲜有高谈阔论。实际上,阿里巴巴一开始就自然生长在数据的黑洞中,并且被越来越多、越来越密集的数据风暴裹挟。从需求→设计→迭代→升华为理论,在无数次的迭代进化中,阿里巴巴对大数据的理解才逐渐成形,慢慢能够在将数据黑洞为我所用的抗争中扳回一局。《大数据之路:阿里巴巴大数据实践》就是在这个过程中,由阿里巴巴数据技术及产品部沉淀下来的大数据知识与实践,值得每一位与大数据相关的人阅读。
- 97.61MB
阿里巴巴大数据
2018-03-02如何建立高效的数据模型和体系,使数据易用,避免重复设计和数据不一致,保证数据的规范性,
- 203KB
阿里巴巴大数据实践之数据建模
2021-02-25随着DT时代互联网、智能设备及其他信息技术的发展,数据爆发式增长,如何将这些数据进行有序、有结构地分类组织和存储是我们面临的一个挑战。如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措。数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。Linux的创始人Torvalds有一段关于“什么才是优秀程序员”的话:“烂程序员关心的是代码,好程序员关心的是数据结构和它们之间的关系”,
- 3.77MB
阿里巴巴大数据实践之路.ppt
2022-05-26阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt
- 7.73MB
阿里巴巴大数据实践之路-9.pdf
2022-06-26阿里巴巴大数据实践之路-9.pdf
- 11.10MB
阿里巴巴大数据实践之路-陈鹏宇.pdf
2021-07-02阿里巴巴大数据实践之路-陈鹏宇.pdf
- 16.69MB
阿里巴巴的大数据实战总结大数据实战.zip
2020-08-16阿里巴巴的大数据实战总结,maxcompute,hadoop等。深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册
- 10.61MB
阿里巴巴数据中台实践PPT
2019-10-16阿里巴巴数据中台实践PPT以及对应的解读文章 读透《阿里巴巴数据中台实践》,其到底有什么高明之处? - 阿里云栖社区 - SegmentFault 思否 https://segmentfault.com/a/1190000020342503
- 86.12MB
大数据之路阿里巴巴笔记
2023-05-10大数据之路阿里巴巴笔记
- 538KB
阿里巴巴大数据竞赛
2016-01-05AliDMCompetition 阿里巴巴大数据竞赛(http://102.alibaba.com/competition/addDiscovery/index.htm ) 数据说明 提供的原始文件有大约4M左右,涉及1千多天猫用户,几千个天猫品牌,总共10万多条的行为记录。 用户4种行为类型(Type)对应代码分别为: 点击:0 购买:1 收藏:2 购物车:3 提交格式 参赛者将预测的用户存入文本文件中,格式如下: user_id \t brand_id , brand_id , brand_id \n 上传的结果文件名字不限(20字以内),文件必须为txt格式。 预测结果 真实购买记录一共有3526条 TODO 注意调整正负样本比例 在LR的基础上做RawLR。按照天猫内部的思路来。 在LR的基础上做MRLR,样本提取要更加合理。 在UserCF和ItemCF上加上时间因子的影响。 利用UserCF做好的用户聚类、ItemCF做好的品牌聚类来做细化的LR,或者在聚类 上做LFM 在ItemCF的思路上挖掘频繁项集/购买模式,如购买品牌A和商品后往往会购买 品牌B的商品 LFM 数据集特征 某一商品在购买前的一段时间内会出现大量点击次数,购买完成后的一段时间内也会出现大量点击次数 用户在本月有过行为的商品极少出现在下个月的购买列表里 根据观察推断:用户浏览商品的行为可分为两类: 无目的浏览,可能会在浏览过程中对某些中意的商品进行购买,数据表现为有大量点击次数<=2的行为记录,但很少有购买行为 有目的的查找商品,可能是事先有需求的情况,数据表现为一段时间内点击商品数很少, 但点击过的商品大多数都进行了购买 参考论文 See https://www.google.com.hk/search?q=data+mining+time+series&ie=utf-8&oe=utf-8&aq=t for more. Chapter 1 MINING TIME SERIES DATA - ResearchGate 模型列表 LR(model=LinearSVC(C=10, loss='l1'), alpha=0.7, degree=1) | TOTAL VISITED BOUGHT FAVO CART NEW | Pred # 1438 1436 626 71 12 | % 100% 99.861% 43.533% 4.937% 0.834% | Real # 1311 250 89 10 1 | % 100% 19.069% 6.789% 0.763% 0.076% Hit # 76 Precision 5.285118% Recall 5.797101% F1 Score 5.529283% LR(model=LogisticRegression(penalty='l1'), alpha=0.7, degree=1) | TOTAL VISITED BOUGHT FAVO CART NEW | Pred # 1472 1470 615 68 14 | % 100% 99.864% 41.780% 4.620% 0.951% | Real # 1311 250 89 10 1 | % 100% 19.069% 6.789% 0.763% 0.076% Hit # 74 Precision 5.027174% Recall 5.644546% F1 Score 5.318002% 这个模型在数据变成2次后,Precision ~ 16%,同时F1 ~ 3% LR(model=Perceptron(penalty='l1'), alpha=0.7, degree=1) | TOTAL VISITED BOUGHT FAVO CART NEW | Pred # 3145 3140 1023 130 26 | % 100% 99.841% 32.528% 4.134% 0.827% | Real # 1311 250 89 10 1 | % 100% 19.069% 6.789% 0.763% 0.076% Hit # 113 Precis
- 20.8MB
阿里巴巴大数据及.pdf
2020-01-17阿里背后的大数据技术与人工智能分分别在淘宝、优酷、高德方面应用取得成果,技术如何改变社区数据发展和生活,从新定义现代技术发展与科技进步对生活的影响。
- 560KB
阿里巴巴的大数据梦.pdf
2021-09-30阿里巴巴的大数据梦.pdf
- 315KB
阿里巴巴大数据之路——数据技术篇.pdf
2022-12-24阿⾥巴巴⼤数据之路 阿⾥巴巴⼤数据之路——数据技术篇 数据技术篇 ⼀、整体架构 ⼀、整体架构 从下⾄上依次分为数据采集层、数据计算层、数据服务层、数据应⽤层 数据采集层:以DataX为代表的数据同步⼯具和同步中...
- 15.89MB
Java 面经手册·小傅哥.pdf
2021-01-26这是一本以面试题为入口讲解 Java 核心内容的技术书籍,书中内容极力的向你证实代码是对数学逻辑的具体实现。当你仔细阅读书籍时,会发现Java中有大量的数学知识,包括:扰动函数、负载因子、拉链寻址、开放寻址、斐波那契(Fibonacci)散列法还有黄金分割点的使用等等。 适合人群 1. 具备一定编程基础,工作1-3年的研发人员 2. 想阅读 Java 核心源码,但总感觉看不懂的 3. 看了太多理论,但没有实践验证的 4. 求职面试,总被面试题搞的死去活来的
- 1.35MB
解压后拖入浏览器扩展程序使用.zip
2021-11-27解压后拖入浏览器扩展程序使用
- 275.26MB
103套PPT模板.zip
2020-12-05读本科常用的100套PPT模板,里面的模板能应用于答辩、汇报、经验分享,风格各异,可以根据自己的喜欢进行挑选
- 13.71MB
Beyond Compare 免安装直接使用
2022-02-23比较工具,用于比较任何文本文件,包括.c文件、.cpp文件、.h文件等,或者比较文件夹;Beyond Compare.zip 解压之后直接可以使用
- 3.39MB
notepad++.exe官网下载
2021-03-10官网进不去着实很烦,找的软件下载网站都是改过了的,上传供收藏使用。
- 3.79MB
Mars4_5.zip
2021-03-21MIPS Assembler and Runtime Simulator(MIPS汇编程序和运行时模拟器)
- 148KB
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
2020-09-03本模板为美化QT界面系列中的一个,整体风格为桃子风格(效果预览链接:https://blog.csdn.net/hwc3737/article/details/108377607),搭配美化大部分常用控件,可直接使用。同时自带部分有用系统功能(最小化托盘运行),可在其基础上进行二次开发。需要基于QT Creator进行使用。
- 150.54MB
Postman9.12.2安装包
2022-02-13Postman_win64-9.12.2安装包;是exe文件,直接下载安装即可。给自己也留个底,有需要的大家可以下载吧,做API测试相当有用
- 22KB
keygen_2032.rar
2021-03-19KEIL 2032 KEIL 2032 KEIL 2032
- 2.71MB
python爬虫数据可视化分析大作业.zip
2020-06-12python爬虫,并将数据进行可视化分析,数据可视化包含饼图、柱状图、漏斗图、词云、另附源代码和报告书。
- 3.27MB
WinRAR 6.01 简体中文版_x64(无广告).exe
2021-04-22WinRAR 6.01 简体中文版_x64(无广告) 双击即可安装
- 175.93MB
智能门锁 指纹锁 密码锁 蓝牙锁 门禁锁.rar
2020-07-26CSDN博客链接:https://blog.csdn.net/mbs520/article/details/106987758 可通过指纹模块增删查改家庭成员的指纹信息,增删查改是否成功的相关信息显示在OLED屏幕上 2、在指纹匹配过程中,如果采集的指纹与指纹模块库相匹配,OLED显示匹配成功,并转动步进电机一圈 3、可通过按键设定智能门锁密码,密码可设置为两个(密码六位),如果匹配两个中的一个成功,即可开锁,也可通过按键修改密码,所有的操作过程显示于OLED中 4、实现RFID与手机解锁(蓝牙解锁) 5、扩展:虚位密码解锁(虚位密码:自己百度)