Hadoop大数据实战权威指南(第2版)
电子书推荐
-
大数据之路:阿里巴巴大数据实践 评分:
大数据之路:阿里巴巴大数据实践,是阿里巴巴内部数据人员的内部实践之作,值得看看。
上传时间:2018-03 大小:85.6MB
- 2.4MB
阿里巴巴大数据实践之路
2015-11-12云栖大会, 阿里巴巴大数据实践, 介绍了阿里巴巴数据存储,打通,运营过程
- 97.61MB
阿里巴巴大数据实践
2019-04-12大数据《《大数据之路:阿里巴巴大数据实践》》,高清
- 104.86MB
阿里巴巴 大数据之路
2019-04-29阿里巴巴,作为距离大数据最近的公司之一,近几年对大数据却鲜有高谈阔论。实际上,阿里巴巴一开始就自然生长在数据的黑洞中,并且被越来越多、越来越密集的数据风暴裹挟。从需求→设计→迭代→升华为理论,在无数次的迭代进化中,阿里巴巴对大数据的理解才逐渐成形,慢慢能够在将数据黑洞为我所用的抗争中扳回一局。《大数据之路:阿里巴巴大数据实践》就是在这个过程中,由阿里巴巴数据技术及产品部沉淀下来的大数据知识与实践,值得每一位与大数据相关的人阅读。
- 97.61MB
阿里巴巴大数据
2018-03-02如何建立高效的数据模型和体系,使数据易用,避免重复设计和数据不一致,保证数据的规范性,
- 203KB
阿里巴巴大数据实践之数据建模
2021-02-25随着DT时代互联网、智能设备及其他信息技术的发展,数据爆发式增长,如何将这些数据进行有序、有结构地分类组织和存储是我们面临的一个挑战。如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措。数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。Linux的创始人Torvalds有一段关于“什么才是优秀程序员”的话:“烂程序员关心的是代码,好程序员关心的是数据结构和它们之间的关系”,
- 85.89MB
阿里大数据之路:阿里巴巴大数据实践-339页.zip
2021-09-29阿里大数据之路:阿里巴巴大数据实践-339页
- 3.77MB
阿里巴巴大数据实践之路.ppt
2022-05-26阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt阿里巴巴大数据实践之路.ppt
- 11.9MB
阿里巴巴大数据实践之路.pdf
2021-10-06阿里巴巴大数据实践之路.pdf
- 7.73MB
阿里巴巴大数据实践之路-9.pdf
2022-06-26阿里巴巴大数据实践之路-9.pdf
- 11.10MB
阿里巴巴大数据实践之路-陈鹏宇.pdf
2021-07-02阿里巴巴大数据实践之路-陈鹏宇.pdf
- 10.61MB
阿里巴巴数据中台实践PPT
2019-10-16阿里巴巴数据中台实践PPT以及对应的解读文章 读透《阿里巴巴数据中台实践》,其到底有什么高明之处? - 阿里云栖社区 - SegmentFault 思否 https://segmentfault.com/a/1190000020342503
- 86.12MB
大数据之路阿里巴巴笔记
2023-05-10大数据之路阿里巴巴笔记
- 538KB
阿里巴巴大数据竞赛
2016-01-05AliDMCompetition 阿里巴巴大数据竞赛(http://102.alibaba.com/competition/addDiscovery/index.htm ) 数据说明 提供的原始文件有大约4M左右,涉及1千多天猫用户,几千个天猫品牌,总共10万多条的行为记录。 用户4种行为类型(Type)对应代码分别为: 点击:0 购买:1 收藏:2 购物车:3 提交格式 参赛者将预测的用户存入文本文件中,格式如下: user_id \t brand_id , brand_id , brand_id \n 上传的结果文件名字不限(20字以内),文件必须为txt格式。 预测结果 真实购买记录一共有3526条 TODO 注意调整正负样本比例 在LR的基础上做RawLR。按照天猫内部的思路来。 在LR的基础上做MRLR,样本提取要更加合理。 在UserCF和ItemCF上加上时间因子的影响。 利用UserCF做好的用户聚类、ItemCF做好的品牌聚类来做细化的LR,或者在聚类 上做LFM 在ItemCF的思路上挖掘频繁项集/购买模式,如购买品牌A和商品后往往会购买 品牌B的商品 LFM 数据集特征 某一商品在购买前的一段时间内会出现大量点击次数,购买完成后的一段时间内也会出现大量点击次数 用户在本月有过行为的商品极少出现在下个月的购买列表里 根据观察推断:用户浏览商品的行为可分为两类: 无目的浏览,可能会在浏览过程中对某些中意的商品进行购买,数据表现为有大量点击次数<=2的行为记录,但很少有购买行为 有目的的查找商品,可能是事先有需求的情况,数据表现为一段时间内点击商品数很少, 但点击过的商品大多数都进行了购买 参考论文 See https://www.google.com.hk/search?q=data+mining+time+series&ie=utf-8&oe=utf-8&aq=t for more. Chapter 1 MINING TIME SERIES DATA - ResearchGate 模型列表 LR(model=LinearSVC(C=10, loss='l1'), alpha=0.7, degree=1) | TOTAL VISITED BOUGHT FAVO CART NEW | Pred # 1438 1436 626 71 12 | % 100% 99.861% 43.533% 4.937% 0.834% | Real # 1311 250 89 10 1 | % 100% 19.069% 6.789% 0.763% 0.076% Hit # 76 Precision 5.285118% Recall 5.797101% F1 Score 5.529283% LR(model=LogisticRegression(penalty='l1'), alpha=0.7, degree=1) | TOTAL VISITED BOUGHT FAVO CART NEW | Pred # 1472 1470 615 68 14 | % 100% 99.864% 41.780% 4.620% 0.951% | Real # 1311 250 89 10 1 | % 100% 19.069% 6.789% 0.763% 0.076% Hit # 74 Precision 5.027174% Recall 5.644546% F1 Score 5.318002% 这个模型在数据变成2次后,Precision ~ 16%,同时F1 ~ 3% LR(model=Perceptron(penalty='l1'), alpha=0.7, degree=1) | TOTAL VISITED BOUGHT FAVO CART NEW | Pred # 3145 3140 1023 130 26 | % 100% 99.841% 32.528% 4.134% 0.827% | Real # 1311 250 89 10 1 | % 100% 19.069% 6.789% 0.763% 0.076% Hit # 113 Precis
- 20.8MB
阿里巴巴大数据及.pdf
2020-01-17阿里背后的大数据技术与人工智能分分别在淘宝、优酷、高德方面应用取得成果,技术如何改变社区数据发展和生活,从新定义现代技术发展与科技进步对生活的影响。
- 560KB
阿里巴巴的大数据梦.pdf
2021-09-30阿里巴巴的大数据梦.pdf
- 16.69MB
阿里巴巴的大数据实战总结大数据实战.zip
2020-08-16阿里巴巴的大数据实战总结,maxcompute,hadoop等。深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册
- 315KB
阿里巴巴大数据之路——数据技术篇.pdf
2022-12-24阿⾥巴巴⼤数据之路 阿⾥巴巴⼤数据之路——数据技术篇 数据技术篇 ⼀、整体架构 ⼀、整体架构 从下⾄上依次分为数据采集层、数据计算层、数据服务层、数据应⽤层 数据采集层:以DataX为代表的数据同步⼯具和同步中...
- 770B
VM虚拟机去虚拟化 玩游戏多开 过检测 tp vmp cf dnf
2023-05-10VM虚拟机去虚拟化 玩游戏多开 过检测 tp vmp cf dnf win10 win7精简优化虚拟机,可以完美运行腾讯网易各种游戏,高帧不卡,过鲁大师,tp vmpse 等检测,不收费 复制文件夹 x64文件夹 到VM主程序目录文件夹覆盖X64 , 首次开机,进去用信息修改工具修改机器码重启再使用 可以完美运行腾讯 网易各种游戏,显卡性能无限制,过腾讯网易检测,需要的可以拿去用用
- 67.14MB
VMware-VMRC-12.0.4-21740317
2023-11-14VMware Remote Console 12.0.4 for Windows File size: 67.15 MB File type: zip Name: VMware-VMRC-12.0.4-21740317.zip Release Date: 2023-05-18 Build Number: 21740317 VMware Remote Console 12.0.4 for Windows MD5SUM: 0ce39a65ce0fc9a4f605f43c10f14e2a SHA1SUM: 12b9bdb18da2bdfaf7e33d501422efc087b25302 SHA256SUM: 14ddd2185feb1fa0c443b8b02e6a2eca7987f653fc038da761684dd1b1d2d8a7
- 237KB
ipmitool-1.8.11-2.x86-64.vib
2023-07-09Vcenter,ESXI主机查看IPMI专用,不用重启服务器,安装好工具直接查看物理主机的IPMI地址,安装教程https://blog.csdn.net/q59280080/article/details/131619443
- 0B
CentOS 7.9 最小化安装 kubernetes(k8s)1.25.3(免费下载)
2022-11-23语雀文档:https://www.yuque.com/xuxiaowei-com-cn/gitlab-k8s
- 4.75MB
openssh-9.3p1的rpm安装包
2023-05-30openssh-9.3p1的rpm安装包
- 950KB
华为_数据中台系统架构.pptx
2020-06-20数据中台是企业级数据治理、应用能力复用平台。数据中台是一个“数据加工厂”,将原始的、未集成的、各自独立的数据资源(原材料)加工成预处理过的、集成(打通)的、标准化的、标签化的数据资产(半成品);结合应用场景需求,采用适当的数据模型和算法,快速加工成数据服务(成品),用以支撑和驱动业务。
- 4.81MB
云计算工程师 Linux运维工程师 关于网络运维方面的面试题
2024-04-1101.公司需要将/opt/bjcat3目录下的所有文档打包备份,如何实现? 02.简述创建crontab计划任务的流程 03.如何添加一个没有登陆权限的新账户? 04.在RHEL系统中常见的软件包管理方式 05.vim报错题 07. 说说这些特殊符号的含义: >,>>, #, ., .., ~, *, | 08. 向new.txt写入内容”I Love studying Linux”。(不少于两种方法) 09. 让lisi账户帐户可以读取/etc/shadow文件内容,你有几种办法? 10.为什么tmp下的文档,仅文档的所有者可以删除? 11.root用户创建的目录,默认权限为什么权限为755?其原因? 12.简述搭建Yum仓库配置过程 13.账号与组相关的配置文件有哪些? 14.LDAP用户账号与普通的系统用户账号有哪些差异 15.请用一条命令创建以下目录结构 16.执行两个操作chown -R :student /test 与 chmod g+s /test,这两个操作有何不同 ? 17.请写出Linux系统关机命令、重启命令、文件夹赋权命令及执行shell脚本命令。 等等
- 6.27MB
河大中澳Vu虚拟计算资料
2024-04-22内容包括: 1. 每个week复习汇总 2. Assignment 3. 期中试题
- 619.12MB
VMware vSphere 8 Hypervisor (ESXi ISO)
2022-12-09VMware vSphere Hypervisor (ESXi ISO) image 2022-10-11 8.0.0 619.13 MB iso Boot your server with this image in order to install or upgrade to ESXi (ESXi requires 64-bit capable servers). This ESXi image includes VMware Tools. MD5SUM(¹): ecfa2f24c2f808c327a8eb83af11272e SHA1SUM(¹): 2bf5e84ecc3b0e2549b809e6115c48300d588a9b SHA256SUM(¹): 78b8ee5613019f8d92da2b74fae674707679379803cb7b01b526747a849138c1
- 619.14MB
esxi8.0合入了RTL8168(瑞昱8168)网卡驱动的ISO安装包
2023-11-30esxi8.0合入了RTL8168(瑞昱8168)网卡驱动的ISO安装包
- 351.53MB
华为SmartKit软件(曾用名OceanStor toolkit)
2022-12-28曾用名OceanStor toolkit,简称toolkit,华为SmartKit为存储、服务器、云计算三大领域的产品提供了统一的服务工具平台,同时也支持原OceanStor Toolkit的所有功能。
- 183.35MB
prometheus一键部署文档,只需要执行install命令安装prometheus+alertmanager+grafana
2024-05-20prometheus一键部署文档,只需要执行install命令安装prometheus+alertmanager+grafana
- 143B
VMware vSphere 6.7全系列
2019-01-02VMware vSphere 6.7全系列软件。