没有合适的资源?快使用搜索试试~ 我知道了~
高级java笔试题-StudySpark:学习Spark的一个小项目,以及其中各种调优的笔记
共279个文件
xml:199个
java:71个
png:3个
需积分: 12 1 下载量 33 浏览量
2021-06-03
00:39:11
上传
评论
收藏 347KB ZIP 举报
温馨提示
高级java笔试题 StudySpark spark的一个小项目以及笔记 目录 项目内容 用户访问session分析模块 用户访问session分析业务,session聚合统计、session随机抽取、top10热门分类、top10活跃用户 1、按条件筛选session 2、统计出符合条件的session中,访问时长在1s~3s、4s~6s、7s~9s、10s~30s、30s~60s、1m~3m、3m~10m、10m~30m、30m以上各个范围内的session占比;访问步长在13、46、79、1030、30~60、60以上各个范围内的session占比 3、在符合条件的session中,按照时间比例随机抽取1000个session 4、在符合条件的session中,获取点击、下单和支付数量排名前10的品类 5、对于排名前10的品类,分别获取其点击次数排名前10的session 技术点:数据的过滤与聚合、自定义Accumulator、按时间比例随机抽取算法、二次排序、分组取topN 性能调优方案:普通调优、jvm调优、shuffle调优、算子调优 troubleshooting经验 数
资源推荐
资源详情
资源评论
收起资源包目录
高级java笔试题-StudySpark:学习Spark的一个小项目,以及其中各种调优的笔记 (279个子文件)
StudySpark.iml 20KB
UserVisitSessionAnalyzeSpark.java 80KB
AdClickRealTimeStatSpark.java 30KB
AreaTop3ProductSpark.java 16KB
PageOneStepConvertRateSpark.java 10KB
MockData.java 7KB
MockData.java 7KB
JDBCHelper.java 6KB
SessionAggrStat.java 5KB
SessionAggrStatAccumulator.java 4KB
DateUtils.java 4KB
AdUserClickCountDAOImpl.java 4KB
Constants.java 4KB
CategorySortKey.java 4KB
GroupConcatDistinctUDAF.java 3KB
AdClickTrendDAOImpl.java 3KB
ValidUtils.java 3KB
AdStatDAOImpl.java 3KB
SparkUtils.java 3KB
StringUtils.java 3KB
SessionDetail.java 3KB
SessionDetailDAOImpl.java 2KB
TaskDAOImpl.java 2KB
AdProvinceTop3DAOImpl.java 2KB
Configuration.java 2KB
SessionAggrStatDAOImpl.java 2KB
Task.java 2KB
DAOFactory.java 2KB
AreaTop3Product.java 2KB
AdBlacklistDAOImpl.java 2KB
JDBCHelperTest.java 1KB
AreaTop3ProductDAOImpl.java 1KB
JDBCTest.java 1KB
SessionRandomExtract.java 1KB
ParamUtils.java 1KB
Top10Category.java 1017B
AdStat.java 930B
AdClickTrend.java 922B
SessionRandomExtractDAOImpl.java 889B
Top10Session.java 838B
Top10CategoryDAOImpl.java 785B
AdProvinceTop3.java 783B
AdUserClickCount.java 765B
Top10SessionDAOImpl.java 744B
PageSplitConvertRateDAOImpl.java 707B
FastJsonTest.java 554B
GetJsonObjectUDF.java 552B
IAdUserClickCountDAO.java 527B
Singleton.java 512B
PageSplitConvertRate.java 478B
NumberUtils.java 467B
ISessionDetailDAO.java 461B
ConcatLongStringUDF.java 406B
RandomPrefixUDF.java 397B
IAdBlacklistDAO.java 396B
ISessionRandomExtractDAO.java 318B
AdUserClickCountQueryResult.java 304B
RemoveRandomPrefixUDF.java 299B
ITaskDAO.java 291B
ISessionAggrStatDAO.java 282B
AdClickTrendQueryResult.java 266B
AdBlacklist.java 265B
AdStatQueryResult.java 260B
IPageSplitConvertRateDAO.java 254B
ConfigurationTest.java 254B
IAreaTop3ProductDAO.java 242B
IAdProvinceTop3DAO.java 238B
IAdClickTrendDAO.java 231B
IAdStatDAO.java 206B
ITop10CategoryDAO.java 198B
ITop10SessionDAO.java 194B
TaskDAOImplTest.java 143B
README.md 41KB
MANIFEST.MF 90B
sample采样倾斜key进行两次join.png 80KB
reduce join转为map join.png 70KB
随机key实现双重聚合.png 54KB
my.properties 478B
UserVisitSessionAnalyze.scala 4KB
App.scala 96B
StudySpark_jar.xml 25KB
uiDesigner.xml 9KB
pom.xml 5KB
compiler.xml 1KB
misc.xml 1KB
Maven__org_scala_lang_scala_library_2_11_8.xml 984B
Maven__org_apache_spark_spark_streaming_kafka_0_8_assembly_2_10_2_1_1.xml 732B
Maven__org_glassfish_jersey_containers_jersey_container_servlet_core_2_22_2.xml 729B
Maven__org_glassfish_jersey_containers_jersey_container_servlet_2_22_2.xml 694B
Maven__org_apache_hadoop_hadoop_mapreduce_client_jobclient_2_6_0.xml 694B
Maven__org_apache_directory_server_apacheds_kerberos_codec_2_0_0_M15.xml 692B
Maven__org_scala_lang_modules_scala_parser_combinators_2_11_1_0_1.xml 686B
Maven__com_fasterxml_jackson_module_jackson_module_scala_2_11_2_6_5.xml 682B
Maven__org_glassfish_hk2_external_aopalliance_repackaged_2_4_0_b34.xml 681B
Maven__org_apache_hadoop_hadoop_mapreduce_client_shuffle_2_6_0.xml 680B
Maven__com_fasterxml_jackson_module_jackson_module_paranamer_2_6_5.xml 675B
Maven__org_apache_hadoop_hadoop_mapreduce_client_common_2_6_0.xml 673B
Maven__org_apache_hadoop_hadoop_mapreduce_client_core_2_6_0.xml 659B
Maven__org_apache_hadoop_hadoop_mapreduce_client_app_2_6_0.xml 652B
Maven__org_apache_calcite_calcite_avatica_1_2_0_incubating.xml 649B
共 279 条
- 1
- 2
- 3
资源评论
weixin_38689338
- 粉丝: 9
- 资源: 975
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- IMG_20240424_183805.jpg
- DatabaseWatermarkingBasedonTextFormat
- -移动通信-网络课程设计与研究
- 基于Python的PCA人脸识别算法的原理及实现代码+文档详解.zip
- 甘肃移动全业务工程建设项目管理流程优化研究
- 549springboot + vue 民宿管理平台.zip (可运行源码+数据库文件+文档)
- ZArchiver.Pro_0.9.5.apk
- vmware环境配置.mp4
- 548springboot + vue 大学生社团活动平台.zip(可运行源码+数据库文件+文档)
- 微信小程序 辩论倒计时小程序源码 作业设计demo 计算机专业参考
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功