阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》

所需积分/C币:49 2019-01-24 16:33:12 16.96MB PDF
收藏 收藏 2
举报

阿里技术重磅发布《数字经济下的算法力量:阿里算法年度精选集》,精选数十篇年度算法顶级干货,合计300+页,为你呈现阿里最新的算法实践案例
目录 推荐、搜索 蚂蚁金服核心技术:百亿特征实时推荐算法揭秘……. 0综述 1、弹性改造及优势…… 1124 2、特征动态增删技术. 3、模型压缩和稳定性. 4、工程实现和效果 5、未来⊥作.… 12 uCA论文|打破传统搜索排序,阿里首次提出商品间相互影响的全局排序法 14 1、前言 14 2、全局排序方法 3、实验效果. 4、结论 SlGR阿里论文「一种端到端的模型:基于异构内容流的动态排序. 1、研究背景 2、所提出的算法 24 实验结果 27 siGR阿里论文Ⅰ可视化理解深度神经网络CTR预估模型 1、背景. 2、平台介纲… .30 3、算法实验 .31 4、泛化效果与神经元状态波动. 5、特征影响力.… 32 6、隐层的效用与其信息表征 7、隐层的效用与其表征再建模 33 8、小结 机器如何“猜你喜欢”?深度学习模型在1688的应用实践… 36 1、背景. .36 模型简介 :.·:.a:::::.:::::::.. ..a.:::.a:::::::::::: 38 3、训练数据 着, 43 4、实验结果… 44 5、调参经验 D看看看,1 着着,着看 45 6、总结… 为电商而生的知识图谱,如何感应用户需求 48 1、背景 48 2、知识体系… ..54 3、技术框架. 56 后期规划 lCA论文丨基于改进注意力循环控制门,品牌个性化排序 61 1.1引言. 61 1.2相关工作 ..64 1.3任务定义和模型适配. 65 1.品牌级排序系统…… 1.5离线实验… 72 1.6线上实验… 75 1.7小结 .76 火箭发射:点击率预估界的“神算了”是如何炼成的?… 1、摘要…… :::::::::::::::.··: 79 2、已有方法介绍 3、研究动机及创新性…… 4、方法框架 5、实验结果…14 6、总结 人群优选算法模型,如何挖掘品牌潜客? 88 1.肯景简介… 2.名词解释.… ..::::::..·.:.:::.·.· 3.项目目标. 89 4.业界方案 ∴89 5.技术方案介绍 90 6.挑战与应对… 97 7.总结与展望. a:.:::::·:. 98 凑单这个技术活,阿里工程师怎么搞? 1、背景. 2、算法. 3、总结. 着看 4、展望 5、项目总结 106 基」品类关系,虚拟类目如何建设? 108 1、前言… 2、问题背景 109 3、整体解决方案…….… I........I.I 110 4、类目合并方案 113 、类目拆分方案 ..:.:...::::::. 117 6、效果… 着, 7、总结与后续规划 …121 论文解读|数十亿商品中,长尾和新品怎么找到新主人? 122 、背景介绍 .122 2、 Base graph embedding算法框架… 3、GES和BGES算法 …1123 4、实验结果 124 5、系统部署. 126 让机器帮你做决策!强化学习在智能交互搜索的应用分亨 1、交互搜索简介. 127 2、问题定义&相关工作&建模 3、系统 133 4、结果. 35 5、总结与展望 36 如何解决移动电商平台中的“伪曝光”? 138 1、介绍 39 相关工作 140 3、问题描述和公式化表达 141 4、算法 144 5、理论分析 6、实验结果… 7、结论 161 机器视觉 CVPR阿里优秀论文:针对玚景分割两大问题提岀语境对比特征和门控多尺度融合∴….165 1、语境对比局部特征 166 2、门控多尺度融合 167 3、实验 168 如何检测视频异常事件?阿里匚程呃提岀全新检测模型…… 170 0、摘要. 170 1、引 :: 171 2、我们的方法… 172 3、实验 174 4、结论 蚂蚁实时视频通话技术和实践.… 1、引子 179 2、技术选型… 179 3、系统架构. 180 4、架构特点 182 5、关键技术和优化 182 6、未来展望 7、场景落地.… 88 8、结尾压轴 ·:::::·: 190 ACM MM论文|用于行人重识别的多层相似度感知CN网络… 0、摘要 翻着音 191 1、引言 2、我们提出的方法 ∴194 3、实验. 97 4、结果和讨论. 98 5、结论和未来工作. 99 语音、文本 针对商品标题冗长问题,阿里工程师怎么解决? 201 1、摘要… 201 2、研究背景 202 3、已有方法介绍 203 4、方法介绍 203 5、实验结果 204 6、总结 206 如何生成你的专属推荐文案?智能文案在1688平台的应用 208 应用场景 208 2、相关工作… 210 3、模型存在的问题与改进方案 .211 4、实验结果 215 5、总结与展望. 218 为了更精确的情感识别,A-LSTM出现了 .220 1、研究背景…. 2、高级长短期记忆网终 .221 3、加杖池化递归神经网络. 222 4、实验 222 5、结论. 223 命名实体识别中,众包标注能否优于专家标注? 225 1、文章目的与思想. 225 2、数据使用 226 3、文章分块解杯…… 227 基于深度前馈序列记忆网终,如何将语音合成速度提升四倍?.….-30 1、研究肯景… 230 2、深度前馈序列记忆网络. 231 3、实验 .233 4、结论 235 综合 基于快速 Geohash,如何实现海量商品与商圈的咼效匹配? 灬1236 1、摘要… 236 2、点数据 Geollash原理与算法 237 3、面数据 GeoHash编码实现 240 4、求临近 Geohash块的快速算法…. 243 5、扃效建立海量点数据与面数据的关系 245 6、延伸.… ::.··: 247 如何评估深度学习模型效果?阿里工程师这么做… 248 1、肯景 翻着音 248 2、 Deeplnsight 249 机器如何猜你所想?阿里小蜜预测平台揭秘… 258 1、背景介绍. 着着,着看 258 2、落地产品介绍. 259 3、算法技术介绍. 261 4、平台化方案介绍.… ……266 5、总结. 268 为减少用户电话排队,阿里硏发了智能客服调度系统. 0、背景. 269 1、 SIgma大图. 271 2、提前准备:排好班………. 271 3、水平扩容:预测式应急放班 272 4、负载均衡:溢出、分流. 273 5、垂直扩容:弹性+1…… 274 6、削峰填谷:预约回拨 .276 7、最优分配.…… 277 8、智能培训:大黄机器人… .278 9、统的调度中心. 280 10、调度监控大屏 …280 仿真演练 12、小结 :::.·:·::··: 如何降低疾病监测的漏诊比率?一种新的分类学习算法 283 1、摘要…. 283 2、研究背景…… 284 3、动机:从约束分类到排疗学习 284 4、τ-FPL算法总览 286 5、理论结果… 288 6、实验结果 着看着 7、总结…… ∴290 如何用无监督模型,防范信用卡欺诈?…. 291 1、国际支付中的信用卡欺许 291 2、无监督信用卡欺诈检测方案 292 3、未来和后续 296 如何提高深度学习模型的可解释性?极致的薮据透出与多维可视化实战详解… 297 、背景 297 2、 Deepinsight系统架构.… 3、基于数据透出的多维度可视化分析 300 4、小结 319 蚂蚁金服核心技术:百亿特征实时推荐算法揭秘 作者:墨眀 小叽导读:文章提出一整套创新算法与架构,通过对 Tensorflow底 层的弹性改造,解决了在线学习的弹性特征伸缩和稳定性问题,并以 Grouplasso和特征在线频次过滤等自研算法优化了模型稀疏性。在支付 宝核心推荐业务获得了 ustr的显著提升,并较大地提升了链路效率。 0.综述 在线学习( Online learning)由于能捕捉用户的动态行为,实现模型快速自 适应,进而成为提升推荐系统性能的重要工具。然而它对链路和模型的稳定 性,训练系统的性能都提出了很高的要求。但在基于原生 TensorFlow,设计 0 nline推荐算法时,我们发现三个核心问题 一些资讯推荐场景,需要大量长尾词汇作为特征,需使用 featuremap对 低频特征频次截断并连续性编码,但耗时且方法 aggressive。 使用流式数据后,无法预知特征规模,而是随训练逐渐增长。因此需预 留特征空问训练几天后重启,否则会越界 模型稀疏性不佳,休积达到数十GB,导致上传和线上加载耗时长且不稳 定 更重要的是,在线学习如火如荼,当流式特征和数据都被打通后,能按需 增删特征,实现参数弹性伸缩的新一代训练平台成为大势所趋。为了解决这些 问题,从2017年底至今,蚂蚁金服人工智能部的同学,充分考虑蚂蚁的业务场 景和链路,对 Tensorflow进行了弹性改造,解决了以上三大痛点,简化并加 速离线和在线学习任务。其核心能力如下: 弹性特征伸缩体系,支持百亿参数训练 3。 group_las优化器和频次过滤,提高模型稀疏性,明显提升线上效 果 模型体积压缩90%,完善的特征管理和模型稳定性监控 在与业务线团队的共同努力下,目前已在支付宝首页的多个推荐场景全流 量上线。其中某推荐位的个性化 online learning桶最近一周相比线上多模型 融合最优桶提升4.23%,相比随机对照提升达34.67%。某个性化资讯推荐 业务最近一周,相比DN基准uv-cur提升+0.7%,pv-ctr提升+4.78%,模型 体积压缩90%,链路效率提升50% 1、弹性改造及优势 背景:在原生 Tensorflow中,我们通过 Variable来声明变量,若变量超 过了单机承载的能力,可使用 partitioned variables来将参数分配到不同机 器上。但必须指定 shape,声明后即不可改变,通过数组索引查找。 由于推荐系统中人量使用稀疏特征,实践中一般采取 embedding lookup sparse一类的方法在一个巨大的 Dense variable中查找向 量并求和,来代替矩阵乘法。开源 Tensorflow限定了 Variable使用前必须声 明维度大小,这带来了两个问题: 1)需要预先计算特征到维度范围内的int值的映射表,这一步操作通常在 oυS上完成。因为需要扫描所冇岀现的特征并编号,计算非常缓慢; 2)在 online learning场景下,为了容纳新出现的特征,需要预留一部分 维度空间,并在线上不断修改映射表,超过预留空问则需要重新启动在线任 务 为了突破固定维度限制,实现特征的动态增加和删除,最朴素的优化想法 是在 TensorFlow底层实现模拟字典行为的 Variable,并在此基础上重新实现 Tensorllow上层API。由此我们进行了优化,在 server新增了基于 HashMap的 Hashvariab1e,其内存结构如下 特征频次过滤 样本数据流 新增特征 不支持新增特征 Embedding vector Feature Embedding Vector CRC64 TF弹性改造 非连续编码 ID3 Tensor(数组索引 不支持删除特征 Group Lasso 只能置0 删跺特征 HashMap(字典查找) Tensor Flow TensorFlow弹性计算 在声明该变量时,只需增加一句,其他训练代码皆不需改动 with tf_ ps placement Firt(vtype= hash) elf. W= tt. get variable(self. name shape=「29999e,641 #其中shap[1]代表 embeddinG维度,hep[8]值可按特征规模估计,用于指导参数分配第略 每个特征都通过hash函数映射到一个2的64次方大小的空间内。当需要 计算该特征时,PS会按需惰性创建并返回之。但其上层行为与原生TF一致。 由于去掉了 featuremap转ID的过程,我们内部形象地将其称为“去ID化”。 在此之上我们实现了 Group lasso Ftrl,频次过滤和模型压缩等一系列算法。 备注:弹性特征带来一个显著的优势:只要用足够强的L1稀疏性约束,在 单机上就能调试任意大规模的特征训练,带来很多方便。我们的 hashmap实现 是KV化的,key是特征, value是 veclor的首地址。

...展开详情
试读 127P 阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    • 签到新秀

      累计签到获取,不积跬步,无以至千里,继续坚持!
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》 49积分/C币 立即下载
    1/127
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第1页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第2页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第3页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第4页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第5页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第6页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第7页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第8页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第9页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第10页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第11页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第12页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第13页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第14页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第15页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第16页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第17页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第18页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第19页
    阿里重磅发布《数字经济下的算法力量:阿里算法年度精选集》第20页

    试读已结束,剩余107页未读...

    49积分/C币 立即下载 >