博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
OVER(PARTITION BY)函数大全
阅读量:7012 次
发布时间:2019-06-28

本文共 5104 字,大约阅读时间需要 17 分钟。

hot3.png

      问题场景:  

  最近在项目中遇到了对每一个类型进行求和并且求该类型所占的比例,当时考虑求出每种类型的和,并在java中分别对每一种类型的和与总和相除求出所占比例。后来,想到这样有点麻烦,并且项目中持久层使用的是iBatis框架,所有考虑从SQL方面进行入手来简化这个问题。

  后来SQL的解决方法就为:

SELECT T.CHANNEL AS PATTERN,       COUNT(T.TRANSACTIONKEY) AS T_COUNT,       SUM(T.AMT) AS T_AMT,       ROUND(100 * SUM(T.AMT) / SUM(SUM(T.AMT)) OVER(PARTITION BY 1), 2) AS AMT_PERCENT,       ROUND(100 * COUNT(T.TRANSACTIONKEY) / SUM(COUNT(T.TRANSACTIONKEY)) OVER(PARTITION BY 1),2) AS COUNT_PERCENT  FROM XX(表名) T WHERE T.PARTY_ID = '100579050' GROUP BY T.CHANNEL

 

  看到这里自己很佩服SQL的强大,于是刨根问底,深入研究了一番Oracel的OVER(PARTITION BY)函数。

  • 简介

  开窗函数,Oracle从8.1.6开始提供分析函数,分析函数用于计算基于组的某种聚合值,它和聚合函数的不同之处是:对于每个组返回多行,而聚合函数对于每个组只返回一行。

  开窗函数指定了分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变化而变化。

  下面的测试用例数据语句如下: 

create table T2_TEMP(    NAME varchar2(10) primary key,    CLASS varchar2(10),    SROCE NUMBER )insert into T2_TEMP (NAME, CLASS, SROCE)values ('cfe', '2', 74);insert into T2_TEMP (NAME, CLASS, SROCE)values ('dss', '1', 95);insert into T2_TEMP (NAME, CLASS, SROCE)values ('ffd', '1', 95);insert into T2_TEMP (NAME, CLASS, SROCE)values ('fda', '1', 80);insert into T2_TEMP (NAME, CLASS, SROCE)values ('gds', '2', 92);insert into T2_TEMP (NAME, CLASS, SROCE)values ('gf', '3', 99);insert into T2_TEMP (NAME, CLASS, SROCE)values ('ddd', '3', 99);insert into T2_TEMP (NAME, CLASS, SROCE)values ('adf', '3', 45);insert into T2_TEMP (NAME, CLASS, SROCE)values ('asdf', '3', 55);insert into T2_TEMP (NAME, CLASS, SROCE)values ('3dd', '3', 78);

 

  1、over函数的写法:

  over(partition by class order by sroce) 按照sroce排序进行累计,order by是个默认的开窗函数,按照class分区。

  2、开窗的窗口范围:

  over(order by sroce range between 5 preceding and 5 following):窗口范围为当前行数据幅度减5加5后的范围内的。

  over(order by sroce rows between 5 preceding and 5 following):窗口范围为当前行前后各移动5行。

  3、与over()函数结合的函数的介绍

  (1)、查询每个班的第一名的成绩:如下 

SELECT * FROM (select t.name,t.class,t.sroce,rank() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t) where mm = 1;

  结果为:

dss        1        95        1ffd        1        95        1gds        2        92        1gf         3        99        1ddd        3        99        1

  注意:在求第一名成绩的时候,不能用row_number(),因为如果同班有两个并列第一,row_number()只返回一个结果。

SELECT * FROM (select t.name,t.class,t.sroce,row_number() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t) where mm = 1;

  结果为:

dss      1        95        1  gfs      2        92        1ddd      3        99        1

  可以看出,本来第一名是两个人的并列,结果只显示了一个。

  (2)、rank()和dense_rank()可以将所有的都查找出来,rank可以将并列第一名的都查找出来;rank()和dense_rank()区别:rank()是跳跃排序,有两个第二名时接下来就是第四名。

  求班级成绩排名:

select t.name,t.class,t.sroce,rank() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  查询结果:

dss        1        95        1ffd        1        95        1fda        1        80        3gds        2        92        1cfe        2        74        2gf         3        99        1ddd        3        99        13dd        3        78        3asdf       3        55        4adf        3        45        5

  dense_rank()l是连续排序,有两个第二名时仍然跟着第三名

select t.name,t.class,t.sroce,dense_rank() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  查询结果:

dss        1        95        1ffd        1        95        1fda        1        80        2 gds        2        92        1cfe        2        74        2gf         3        99        1ddd        3        99        13dd        3        78        2asdf       3        55        3adf        3        45        4

  (3)、sum() over()的使用

  根据班级进行分数求和

select t.name,t.class,t.sroce,sum(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t
dss        1        95        190  --由于两个95都是第一名,所以累加时是两个第一名的相加ffd        1        95        190 fda        1        80        270  --第一名加上第二名的gds        2        92        92cfe        2        74        166gf         3        99        198ddd        3        99        1983dd        3        78        276asdf       3        55        331adf        3        45        376

  (4)、first_value() over()和last_value() over()的使用 

select t.name,t.class,t.sroce,first_value(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;select t.name,t.class,t.sroce,last_value(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  分别求出第一个和最后一个成绩。

  (5)、sum() over()的使用

select t.name,t.class,t.sroce,sum(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  求出班级的总分。

  下面还有很多用法,就不一一列举了,简单介绍一下,和上面用法类似:

  count() over(partition by ... order by ...):求分组后的总数。  max() over(partition by ... order by ...):求分组后的最大值。  min() over(partition by ... order by ...):求分组后的最小值。  avg() over(partition by ... order by ...):求分组后的平均值。  lag() over(partition by ... order by ...):取出前n行数据。    lead() over(partition by ... order by ...):取出后n行数据。  ratio_to_report() over(partition by ... order by ...):Ratio_to_report() 括号中就是分子,over() 括号中就是分母。  percent_rank() over(partition by ... order by ...):

  (6)、over partition by与group by的区别:

  group by是对检索结果的保留行进行单纯分组,一般和聚合函数一起使用例如max、min、sum、avg、count等一块用。partition by虽然也具有分组功能,但同时也具有其他的高级功能。

转载于:https://my.oschina.net/justfairytale/blog/1545126

你可能感兴趣的文章
将zabbix 监控图以图片格式发送邮件到管理员邮箱
查看>>
30个最好的数据可视化工具推荐
查看>>
芝麻HTTP:爬虫的基本原理
查看>>
python利用json处理数据
查看>>
动态增减表单项(vue+element)
查看>>
Multi Task Learning在工业界如何更胜一筹
查看>>
7.1 安装软件包的三种方法 7.2 rpm包介绍 7.3 rpm工具用法 7.4 yum工具用法 7.5 yum搭建本地仓库...
查看>>
图(graph)
查看>>
1. Spring Boot 启动后执行一些操作
查看>>
四元数基础和DX9的函数
查看>>
sharding-jdbc源码解析之sql单表或绑定表路由
查看>>
使用aliyun提供的迁移工具把本地的虚拟机或主机迁移到阿里云上去
查看>>
干货|比特币如何产生与交易
查看>>
技术工坊|数字货币钱包的设计要素与应用案(上海)
查看>>
Blockathon2018(上海)顺利结束,9个项目打开区块链落地新思路
查看>>
第六届中华灯谜文化节暨第二届中华元宵灯谜节在安徽合肥成功举办
查看>>
BCH希望能和其它的数字货币共同进步
查看>>
CentOS 6.5系统安装配置图解教程以及配置网络
查看>>
Cloudflare能检测HTTPS并拦截MITMEngine
查看>>
独家解密:阿里大规模数据中心性能分析
查看>>