没有合适的资源？快使用搜索试试~ 我知道了~

文库首页大数据spark基于Spark的大规模机器学习在微博的应用

基于Spark的大规模机器学习在微博的应用

Spark

需积分: 10 9 下载量 63 浏览量 2018-01-15 10:42:36 上传评论收藏 1.59MB PDF 举报

温馨提示

试读

32页

分享是为了知识的传播。希望更多人学到有关技术能力，从而做更好的产品，为个性化需求提供更好的服务。

资源推荐

资源详情

资源评论

基于Spark的大规模机器学习在微博的应用

wulei3@staff.weibo.com

新浪微博

自我介绍

• 吴磊

• 现任职于新浪微博，负责计算框架设计&实现

• 曾就职于IBM、联想研究院，从事数据仓库、大数据应用

• 微博：小生活与大数据

• 微信：方块K

• 邮箱：wulei3@staff.weibo.com

新浪微博

• 微博业务场景

• 大规模机器学习

• 微博机器学习框架

议题

新浪微博

• 中国领先社交媒体平台

• 数据

• MAU：3.40亿+（2017Q1）

• DAU：1.54亿+（2017Q1）

• 同比增长：30%左右

• 用户分布：91％移动端

• 刷新数：百亿级

• 曝光数：千亿级

新浪微博

微博业务场景

用户体量大

算法模型多样化

(LR, SVM, GBDT, RF, NN, FP, FM,etc)

用户间关系纷杂

微博内容体量大

特征维度巨大

业务场景多样性

(Feed, Hot, Rec, PUSH, Anti-spam, etc)

特征类别多

业务场景复杂

近百亿级别特征维度

近万亿级别样本量

高频访问

微博内容数据多样

(文本、图片、音频、视频，等)

剩余31页未读，继续阅读

评论收藏

内容反馈

资源评论

资源反馈

评论星级较低，若资源使用遇到问题可联系上传者，3个工作日内问题未解决可申请退款~

Tianya_AN

粉丝: 0
资源: 5

上传资源快速赚钱

我的内容管理展开

我的资源快来上传第一个资源

我的收益

登录查看自己的收益

我的积分登录查看自己的积分

我的C币登录后查看C币余额

我的收藏

我的下载

下载帮助

前往需求广场，查看用户热搜

基于Spark的大规模机器学习在微博的应用

藏经阁-基于Spark的大规模机器学习在微博的应用.pdf

基于Spark的机器学习在微博的应用.pptx

基于Spark的机器学习应用框架研究与实现

基于Spark+PageRank算法构建仿微博用户好友的分布式推荐系统.zip

基于Spark的机器学习资料43、其它SparkML算法简单介绍.docx

基于Spark的机器学习平台设计与实现

基于spark的大数据论文资料

基于Spark的机器学习-智能客户系统项目实战.txt

大数据-基于Spark的机器学习-智能客户系统项目实战

基于Spark的亿级大规模机器学习方案.pptx

Spark2.x机器学习实战（算法篇：基于Kaggle竞赛数据集，六大算法模型构建）视频教程

Scala-升级版.docx

基于spark的图书推荐系统

大数据期末课设~基于spark的气象数据处理与分析

全国职业技能大赛大数据赛项十套赛题（shtd）

大数据全套教程完整版

全国2014-2018年空气质量csv数据集文件数据

spark-3.3.1-bin-3.0.0-cdh6.3.2.tgz

Spark气象监测数据分析：代码整合，包括预处理，分析，数据可视化

基于hadoop和echarts的教育大数据可视化系统

RDD编程初级实践-答案-实验报告-纠正版

python爬虫爬取股票评论，调用百度AI进行语义分析， matlab数据处理，股票涨跌和评论的关系

大数据面试大总结300页.zip

sbt-1.9.0.tgz

spark-3.1.3-bin-hadoop3.2.tgz

实验七：Spark初级编程实践

Link Prediction相似性计算方法示例.rar

最新资源