SQLServer中Partition By和row_number 函数使用方法详解

近期有些网友想要了解SQLServer中Partition的相关情况,小编通过整理给您分析,同时介绍一下有关信息。

在处理大规模数据集时,SQL Server 提供了许多强大的工具来优化查询性能和简化复杂的数据操作。其中,PARTITION BY 子句和 ROW_NUMBER() 函数是两个非常有用的功能。它们可以帮助我们对数据进行分组、排序,并生成唯一的行号,从而实现各种复杂的业务需求。本文将详细介绍这两个功能的使用方法,并通过实例演示其应用场景。

partition by关键字是分析性函数的一部分,它和聚合函数不同的地方在于它能返回一个分组中的多条记录,而聚合函数一般只有一条反映统计值的记录,partition by用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组。

今天群里看到一个问题,在这里概述下:查询出不同分类下的最新记录。一看这不是很简单的么,要分类那就用Group By;要最新记录就用Order By呗。然后在自己的表中试着做出来:

首先呢我把表中的数据按照提交时间倒序出来:

“corp_name”就是分类的GUID(请原谅我命名的随意性)。 OK, 这里按照最开始的想法加上Group By来看一下显示效果:

呃,嗯。这尼玛和想象中的结果不一样啊,看来写代码还是要理性分析问题,意念是无法控制结果滴!

既然要求是不同分类的数据,除了使用Group By之外,还有别的函数能用吗?度娘了一下结果还真有,over(partition by )函数,那么它和平时用的Group By有什么区别呢? Group By除了对结果进行单纯的分组之外呢,一般都和聚合函数一起使用,Partition By也具有分组功能,属于Oracle的分析函数,在这里就不详细的不啦不啦不啦了。

看代码:

over(partition by corp_name order by submit_time desc ) as t 。就是按照corp_name分类并按时间倒序出来,"t" 这里一列呢就是不同corp_name类出现的次数,需求是只查询出不同分类的最新提交数据,那么我们只需要针对"t"再进行一次筛选即可:

好啦,结果已经出来,不求各位看官喜欢,但求看在我头像中的胸器望点个赞, 好人一生平安哦!!!

ps:SQL Server数据库partition by 与ROW_NUMBER()函数使用详解

关于SQL的partition by 字段的一些用法心得

先看例子:

ifobject_id('TESTDB')isnotnulldroptableTESTDB
createtableTESTDB(Avarchar(8),Bvarchar(8))
insertintoTESTDB
select'A1','B1'unionall
select'A1','B2'unionall
select'A1','B3'unionall
select'A2','B4'unionall
select'A2','B5'unionall
select'A2','B6'unionall
select'A3','B7'unionall
select'A3','B3'unionall
select'A3','B4'

-- 所有的信息

SELECT*FROMTESTDB
AB
-------
A1B1
A1B2
A1B3
A2B4
A2B5
A2B6
A3B7
A3B3
A3B4

-- 使用PARTITION BY 函数后

SELECT*,ROW_NUMBER()OVER(PARTITIONBYAORDERBYADESC)NUMFROMTESTDB
ABNUM
-------------
A1B11
A1B22
A1B33
A2B41
A2B52
A2B63
A3B71
A3B32
A3B43

可以看到结果中多出一列NUM 这个NUM就是说明了相同行的个数,比如A1有3个,他就给每个A1标上是第几个。

-- 仅仅使用ROW_NUMBER() OVER的结果

SELECT*,ROW_NUMBER()OVER(ORDERBYADESC)NUMFROMTESTDB
ABNUM
------------------------
A3B71
A3B32
A3B43
A2B44
A2B55
A2B66
A1B17
A1B28
A1B39

可以看到它只是单纯标出了行号。

-- 深入一点应用

SELECTA=CASEWHENNUM=1THENAELSE''END,B
FROM(SELECTA,NUM=ROW_NUMBER()OVER(PARTITIONBYAORDERBYADESC)FROMTESTDB)T
AB
---------
A1B1
B2
B3
A2B4
B5
B6
A3B7
B3
B4

接下来我们就通过几个实例来一一介绍ROW_NUMBER()函数的使用。

实例如下:

1.使用row_number()函数进行编号,如

selectemail,customerID,ROW_NUMBER()over(orderbypsd)asrowsfromQT_Customer

原理:先按psd进行排序,排序完后,给每条数据进行编号。

2.在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:

selectDID,customerID,totalPrice,ROW_NUMBER()over(orderbytotalPrice)asrowsfromOP_Order

3.统计出每一个各户的所有订单并按每一个客户下的订单的金额 升序排序,同时给每一个客户的订单进行编号。这样就知道每个客户下几单了

如图:

代码如下:

selectROW_NUMBER()over(partitionbycustomerIDorderbytotalPrice)asrows,customerID,totalPrice,DIDfromOP_Order

4.统计每一个客户最近下的订单是第几次下的订单。

代码如下:

withtabsas
(
selectROW_NUMBER()over(partitionbycustomerIDorderbytotalPrice)asrows,customerID,totalPrice,DIDfromOP_Order
)
selectMAX(rows)as'下单次数',customerIDfromtabsgroupbycustomerID

5.统计每一个客户所有的订单中购买的金额最小,而且并统计改订单中,客户是第几次购买的。

如图:

上图:rows表示客户是第几次购买。

思路:利用临时表来执行这一操作。

1.先按客户进行分组,然后按客户的下单的时间进行排序,并进行编号。

2.然后利用子查询查找出每一个客户购买时的最小价格。

3.根据查找出每一个客户的最小价格来查找相应的记录。

代码如下:

withtabsas
(
selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,customerID,totalPrice,DIDfromOP_Order
)
select*fromtabs
wheretotalPricein
(
selectMIN(totalPrice)fromtabsgroupbycustomerID
)

6.筛选出客户第一次下的订单。

思路。利用rows=1来查询客户第一次下的订单记录。

代码如下:

withtabsas
(
selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,*fromOP_Order
)
select*fromtabswhererows=1
select*fromOP_Order

7.rows_number()可用于分页

思路:先把所有的产品筛选出来,然后对这些产品进行编号。然后在where子句中进行过滤。

8.注意:在使用over等开窗函数时,over里头的分组及排序的执行晚于“where,group by,order by”的执行。

如下代码:

select
ROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,
customerID,totalPrice,DID
fromOP_OrderwhereinsDT>'2011-07-22'

以上代码是先执行where子句,执行完后,再给每一条记录进行编号。

总结

通过本文的介绍,我们可以看到 PARTITION BY 子句和 ROW_NUMBER() 函数在 SQL Server 中的强大功能。PARTITION BY 可以帮助我们将数据划分为多个逻辑分区,而 ROW_NUMBER() 则可以在每个分区内生成唯一的行号。结合使用这两个功能,可以轻松实现诸如分页、排名、去重等复杂的数据操作。希望本文的示例和解释能够帮助读者更好地理解和应用这些功能,从而提高数据处理的效率和准确性。

发布于 2025-01-14 03:28:25
分享
海报
187
上一篇:C#实现美国东部时间与北京时间相互转换的示例代码详解 下一篇:C++使用BitBlt函数进行窗口抓图的示例代码
目录

    忘记密码?

    图形验证码