没有合适的资源?快使用搜索试试~ 我知道了~
oracle分析函数.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 157 浏览量
2023-09-06
10:51:43
上传
评论
收藏 948KB DOC 举报
温馨提示
试读
66页
比你强大的人都在努力了,你还在等什么?来,oracle分析函数
资源推荐
资源详情
资源评论
Oracle 开发专题之:分析函数(OVER) .........................................................................................................................1
Oracle 开发专题之:分析函数 2(Rank, Dense_rank, row_number) .............................................................................6
Oracle 开发专题之:分析函数 3(Top/Bottom N、First/Last、NTile) .......................................................................10
Oracle 开发专题之:窗口函数.....................................................................................................................................14
Oracle 开发专题之:报表函数.....................................................................................................................................20
Oracle 开发专题之:分析函数总结.............................................................................................................................22
Oracle 开发专题之:26 个分析函数............................................................................................................................24
PLSQL 开发笔记和小结 ...............................................................................................................................................28
分析函数简述 ................................................................................................................................................................60
Oracle 开发专题之:分析函数(OVER)
目录:
===============================================
1.Oracle 分析函数简介
2. Oracle 分析函数简单实例
3.分析函数 OVER 解析
一、Oracle 分析函数简介:
在日常的生产环境中,我们接触得比较多的是 OLTP 系统(即 Online Transaction Process),这些系统的特点是具备实时
要求,或者至少说对响应的时间多长有一定的要求;其次这些系统的业务逻辑一般比较复杂,可能需要经过多次的运算。比
如我们经常接触到的电子商城。
在这些系统之外,还有一种称之为 OLAP 的系统(即 Online Aanalyse Process),这些系统一般用于系统决策使用。通常和
数据仓库、数据分析、数据挖掘等概念联系在一起。这些系统的特点是数据量大,对实时响应的要求不高或者根本不关注这
方面的要求,以查询、统计操作为主。
我们来看看下面的几个典型例子:
①查找上一年度各个销售区域排名前 10 的员工
②按区域查找上一年度订单总额占区域订单总额 20%以上的客户
③查找上一年度销售最差的部门所在的区域
④查找上一年度销售最好和最差的产品
我们看看上面的几个例子就可以感觉到这几个查询和我们日常遇到的查询有些不同,具体有:
①需要对同样的数据进行不同级别的聚合操作
②需要在表内将多条数据和同一条数据进行多次的比较
③需要在排序完的结果集上进行额外的过滤操作
分析函数语法:
FUNCTION_NAME(<argument>,<argument>...)
OVER
(<Partition-Clause><Order-by-Clause><Windowing Clause>)
例:
sum(sal) over (partition by deptno order by ename) new_alias
sum 就是函数名
(sal)是分析函数的参数,每个函数有 0~3 个参数,参数可以是表达式,例如:sum(sal+comm)
over 是一个关键字,用于标识分析函数,否则查询分析器不能区别 sum()聚集函数和 sum()分析函数
partition by deptno 是可选的分区子句,如果不存在任何分区子句,则全部的结果集可看作一个单一的大区
order by ename 是可选的 order by 子句,有些函数需要它,有些则不需要.依靠已排序数据的那些函数,如:用于访问结果集
中前一行和后一行的 LAG 和 LEAD,必须使用,其它函数,如 AVG,则不需要.在使用了任何排序的开窗函数时,该子句是强制
性的,它指定了在计算分析函数时一组内的数据是如何排序的.
1)FUNCTION 子句
ORACLE 提供了 26 个分析函数,按功能分 5 类
分析函数分类
等级(ranking)函数:用于寻找前 N 种查询
开窗(windowing)函数:用于计算不同的累计,如 SUM,COUNT,AVG,MIN,MAX 等,作用于数据的一个窗口上
例:
sum(t.sal) over (order by t.deptno,t.ename) running_total,
sum(t.sal) over (partition by t.deptno order by t.ename) department_total
制表(reporting)函数:与开窗函数同名,作用于一个分区或一组上的所有列
例:
sum(t.sal) over () running_total2,
sum(t.sal) over (partition by t.deptno ) department_total2
制表函数与开窗函数的关键不同之处在于 OVER 语句上缺少一个 ORDER BY 子句!
LAG,LEAD 函数:这类函数允许在结果集中向前或向后检索值,为了避免数据的自连接,它们是非常用用的.
VAR_POP,VAR_SAMP,STDEV_POPE 及线性的衰减函数:计算任何未排序分区的统计值
2)PARTITION 子句
按照表达式分区(就是分组),如果省略了分区子句,则全部的结果集被看作是一个单一的组
3)ORDER BY 子句
分析函数中 ORDER BY 的存在将添加一个默认的开窗子句,这意味着计算中所使用的行的集合是当前分区中当前行和前面
所有行,没有 ORDER BY 时,默认的窗口是全部的分区 在 Order by 子句后可以添加 nulls last,如:order by comm desc
nulls last 表示排序时忽略 comm 列为空的行.
4)WINDOWING 子句
用于定义分析函数将在其上操作的行的集合
Windowing 子句给出了一个定义变化或固定的数据窗口的方法,分析函数将对这些数据进行操作
默认的窗口是一个固定的窗口,仅仅在一组的第一行开始,一直继续到当前行,要使用窗口,必须使用 ORDER BY 子句
根据 2 个标准可以建立窗口:数据值的范围(RANGES)或与当前行的行偏移量.
5)Rang 窗口
Range 5 preceding:将产生一个滑动窗口,他在组中拥有当前行以前 5 行的集合
ANGE 窗口仅对 NUMBERS 和 DATES 起作用,因为不可能从 VARCHAR2 中增加或减去 N 个单元
另外的限制是 ORDER BY 中只能有一列,因而范围实际上是一维的,不能在 N 维空间中
例:
avg(t.sal) over(order by t.hiredate asc range 100 preceding) 统计前 100 天平均工资
6)Row 窗口
利用 ROW 分区,就没有 RANGE 分区那样的限制了,数据可以是任何类型,且 ORDER BY 可以包括很多列
7)Specifying 窗口
UNBOUNDED PRECEDING:这个窗口从当前分区的每一行开始,并结束于正在处理的当前行
CURRENT ROW:该窗口从当前行开始(并结束)
Numeric Expression PRECEDING:对该窗口从当前行之前的数字表达式(Numeric Expression)的行开始,对 RANGE 来
说,从从行序值小于数字表达式的当前行的值开始.
Numeric Expression FOLLOWING:该窗口在当前行 Numeric Expression 行之后的行终止(或开始),且从行序值大于当
前行 Numeric Expression 行的范围开始(或终止)
range between 100 preceding and 100 following:当前行 100 前,当前后 100 后
注意:分析函数允许你对一个数据集进排序和筛选,这是 SQL 从来不能实现的.除了最后的 Order by 子句之外,分析函数是
在查询中执行的最后的操作集,这样的话,就不能直接在谓词中使用分析函数,即不能在上面使用 where 或 having 子句!!!
二、Oracle 分析函数简单实例:
下面我们通过一个实际的例子:按区域查找上一年度订单总额占区域订单总额 20%以上的客户,来看看分析函数的应用。
【1】测试环境:
SQL> desc orders_tmp;
Name Null? Type
----------------------- -------- ----------------
CUST_NBR NOT NULL NUMBER(5)
REGION_ID NOT NULL NUMBER(5)
SALESPERSON_ID NOT NULL NUMBER(5)
YEAR NOT NULL NUMBER(4)
MONTH NOT NULL NUMBER(2)
TOT_ORDERS NOT NULL NUMBER(7)
TOT_SALES NOT NULL NUMBER(11,2)
【2】测试数据:
SQL> select * from orders_tmp;
CUST_NBR REGION_ID SALESPERSON_ID YEAR MONTH TOT_ORDERS TOT_SALES
---------- ---------- -------------- ---------- ---------- ---------- ----------
11 7 11 2001 7 2 12204
4 5 4 2001 10 2 37802
7 6 7 2001 2 3 3750
10 6 8 2001 1 2 21691
10 6 7 2001 2 3 42624
15 7 12 2000 5 6 24
12 7 9 2000 6 2 50658
1 5 2 2000 3 2 44494
1 5 1 2000 9 2 74864
2 5 4 2000 3 2 35060
2 5 4 2000 4 4 6454
2 5 1 2000 10 4 35580
4 5 4 2000 12 2 39190
13 rows selected.
【3】测试语句:
SQL> select o.cust_nbr customer,
2 o.region_id region,
3 sum(o.tot_sales) cust_sales,
4 sum(sum(o.tot_sales)) over(partition by o.region_id) region_sales
5 from orders_tmp o
6 where o.year = 2001
7 group by o.region_id, o.cust_nbr;
CUSTOMER REGION CUST_SALES REGION_SALES
---------- ---------- ---------- ------------
4 5 37802 37802
7 6 3750 68065
10 6 64315 68065
11 7 12204 12204
三、分析函数 OVER 解析:
请注意上面的绿色高亮部分,group by 的意图很明显:将数据按区域 ID,客户进行分组,那么 Over 这一部分有什么用呢?
假如我们只需要统计每个区域每个客户的订单总额,那么我们只需要 group by o.region_id,o.cust_nbr 就够了。但我们
还想在每一行显示该客户所在区域的订单总额,这一点和前面的不同:需要在前面分组的基础上按区域累加。很显然 group
by 和 sum 是无法做到这一点的(因为聚集操作的级别不一样,前者是对一个客户,后者是对一批客户)。
这就是 over 函数的作用了!它的作用是告诉 SQL 引擎:按区域对数据进行分区,然后累积每个区域每个客户的订单总额
(sum(sum(o.tot_sales)))。
现在我们已经知道 2001 年度每个客户及其对应区域的订单总额,那么下面就是筛选那些个人订单总额占到区域订单总额
20%以上的大客户了
SQL> select *
2 from (select o.cust_nbr customer,
3 o.region_id region,
4 sum(o.tot_sales) cust_sales,
5 sum(sum(o.tot_sales)) over(partition by o.region_id) region_sales
6 from orders_tmp o
7 where o.year = 2001
8 group by o.region_id, o.cust_nbr) all_sales
9 where all_sales.cust_sales > all_sales.region_sales * 0.2;
CUSTOMER REGION CUST_SALES REGION_SALES
---------- ---------- ---------- ------------
4 5 37802 37802
10 6 64315 68065
11 7 12204 12204
SQL>
现在我们已经知道这些大客户是谁了!哦,不过这还不够,如果我们想要知道每个大客户所占的订单比例呢?看看下面的
SQL 语句,只需要一个简单的 Round 函数就搞定了。
SQL> select all_sales.*,
2 100 * round(cust_sales / region_sales, 2) || '%' Percent
3 from (select o.cust_nbr customer,
4 o.region_id region,
5 sum(o.tot_sales) cust_sales,
6 sum(sum(o.tot_sales)) over(partition by o.region_id) region_sales
7 from orders_tmp o
8 where o.year = 2001
9 group by o.region_id, o.cust_nbr) all_sales
10 where all_sales.cust_sales > all_sales.region_sales * 0.2;
CUSTOMER REGION CUST_SALES REGION_SALES PERCENT
---------- ---------- ---------- ------------ ----------------------------------------
4 5 37802 37802 100%
10 6 64315 68065 94%
11 7 12204 12204 100%
SQL>
总结:
①Over 函数指明在那些字段上做分析,其内跟 Partition by 表示对数据进行分组。注意 Partition by 可以有多个字段。
②Over 函数可以和其它聚集函数、分析函数搭配,起到不同的作用。例如这里的 SUM,还有诸如 Rank,Dense_rank
等。
剩余65页未读,继续阅读
资源评论
小小哭包
- 粉丝: 1906
- 资源: 3973
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功