SQLServer中Partition By和row_number 函数使用方法详解

魁首哥

作者

近期有些网友想要了解SQLServer中Partition的相关情况，小编通过整理给您分析，同时介绍一下有关信息。

在处理大规模数据集时，SQL Server 提供了许多强大的工具来优化查询性能和简化复杂的数据操作。其中，PARTITION BY 子句和 ROW_NUMBER() 函数是两个非常有用的功能。它们可以帮助我们对数据进行分组、排序，并生成唯一的行号，从而实现各种复杂的业务需求。本文将详细介绍这两个功能的使用方法，并通过实例演示其应用场景。

partition by关键字是分析性函数的一部分，它和聚合函数不同的地方在于它能返回一个分组中的多条记录，而聚合函数一般只有一条反映统计值的记录，partition by用于给结果集分组，如果没有指定那么它把整个结果集作为一个分组。

今天群里看到一个问题，在这里概述下：查询出不同分类下的最新记录。一看这不是很简单的么，要分类那就用Group By;要最新记录就用Order By呗。然后在自己的表中试着做出来：

首先呢我把表中的数据按照提交时间倒序出来：

“corp_name”就是分类的GUID（请原谅我命名的随意性）。 OK，这里按照最开始的想法加上Group By来看一下显示效果：

呃，嗯。这尼玛和想象中的结果不一样啊，看来写代码还是要理性分析问题，意念是无法控制结果滴！

既然要求是不同分类的数据，除了使用Group By之外，还有别的函数能用吗？度娘了一下结果还真有，over（partition by ）函数，那么它和平时用的Group By有什么区别呢？ Group By除了对结果进行单纯的分组之外呢，一般都和聚合函数一起使用，Partition By也具有分组功能，属于Oracle的分析函数，在这里就不详细的不啦不啦不啦了。

看代码：

over(partition by corp_name order by submit_time desc ) as t 。就是按照corp_name分类并按时间倒序出来，"t" 这里一列呢就是不同corp_name类出现的次数，需求是只查询出不同分类的最新提交数据，那么我们只需要针对"t"再进行一次筛选即可：

好啦，结果已经出来，不求各位看官喜欢，但求看在我头像中的胸器望点个赞，好人一生平安哦！！！

ps：SQL Server数据库partition by 与ROW_NUMBER()函数使用详解

关于SQL的partition by 字段的一些用法心得

先看例子：

ifobject_id('TESTDB')isnotnulldroptableTESTDB
createtableTESTDB(Avarchar(8),Bvarchar(8))
insertintoTESTDB
select'A1','B1'unionall
select'A1','B2'unionall
select'A1','B3'unionall
select'A2','B4'unionall
select'A2','B5'unionall
select'A2','B6'unionall
select'A3','B7'unionall
select'A3','B3'unionall
select'A3','B4'

-- 所有的信息

SELECT*FROMTESTDB
AB
-------
A1B1
A1B2
A1B3
A2B4
A2B5
A2B6
A3B7
A3B3
A3B4

-- 使用PARTITION BY 函数后

SELECT*,ROW_NUMBER()OVER(PARTITIONBYAORDERBYADESC)NUMFROMTESTDB
ABNUM
-------------
A1B11
A1B22
A1B33
A2B41
A2B52
A2B63
A3B71
A3B32
A3B43

可以看到结果中多出一列NUM 这个NUM就是说明了相同行的个数，比如A1有3个，他就给每个A1标上是第几个。

-- 仅仅使用ROW_NUMBER() OVER的结果

SELECT*,ROW_NUMBER()OVER(ORDERBYADESC)NUMFROMTESTDB
ABNUM
------------------------
A3B71
A3B32
A3B43
A2B44
A2B55
A2B66
A1B17
A1B28
A1B39

可以看到它只是单纯标出了行号。

-- 深入一点应用

SELECTA=CASEWHENNUM=1THENAELSE''END,B
FROM(SELECTA,NUM=ROW_NUMBER()OVER(PARTITIONBYAORDERBYADESC)FROMTESTDB)T
AB
---------
A1B1
B2
B3
A2B4
B5
B6
A3B7
B3
B4

接下来我们就通过几个实例来一一介绍ROW_NUMBER()函数的使用。

实例如下：

1.使用row_number（）函数进行编号，如

selectemail,customerID,ROW_NUMBER()over(orderbypsd)asrowsfromQT_Customer

原理：先按psd进行排序，排序完后，给每条数据进行编号。

2.在订单中按价格的升序进行排序，并给每条记录进行排序代码如下：

selectDID,customerID,totalPrice,ROW_NUMBER()over(orderbytotalPrice)asrowsfromOP_Order

3.统计出每一个各户的所有订单并按每一个客户下的订单的金额升序排序，同时给每一个客户的订单进行编号。这样就知道每个客户下几单了。

如图：

代码如下：

selectROW_NUMBER()over(partitionbycustomerIDorderbytotalPrice)asrows,customerID,totalPrice,DIDfromOP_Order

4.统计每一个客户最近下的订单是第几次下的订单。

代码如下：

withtabsas
(
selectROW_NUMBER()over(partitionbycustomerIDorderbytotalPrice)asrows,customerID,totalPrice,DIDfromOP_Order
)
selectMAX(rows)as'下单次数',customerIDfromtabsgroupbycustomerID

5.统计每一个客户所有的订单中购买的金额最小，而且并统计改订单中，客户是第几次购买的。

如图：

上图：rows表示客户是第几次购买。

思路：利用临时表来执行这一操作。

1.先按客户进行分组，然后按客户的下单的时间进行排序，并进行编号。

2.然后利用子查询查找出每一个客户购买时的最小价格。

3.根据查找出每一个客户的最小价格来查找相应的记录。

代码如下：

withtabsas
(
selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,customerID,totalPrice,DIDfromOP_Order
)
select*fromtabs
wheretotalPricein
(
selectMIN(totalPrice)fromtabsgroupbycustomerID
)

6.筛选出客户第一次下的订单。

思路。利用rows=1来查询客户第一次下的订单记录。

代码如下：

withtabsas
(
selectROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,*fromOP_Order
)
select*fromtabswhererows=1
select*fromOP_Order

7.rows_number()可用于分页

思路：先把所有的产品筛选出来，然后对这些产品进行编号。然后在where子句中进行过滤。

8.注意：在使用over等开窗函数时，over里头的分组及排序的执行晚于“where，group by，order by”的执行。

如下代码：

select
ROW_NUMBER()over(partitionbycustomerIDorderbyinsDT)asrows,
customerID,totalPrice,DID
fromOP_OrderwhereinsDT>'2011-07-22'

以上代码是先执行where子句，执行完后，再给每一条记录进行编号。

总结

通过本文的介绍，我们可以看到 PARTITION BY 子句和 ROW_NUMBER() 函数在 SQL Server 中的强大功能。PARTITION BY 可以帮助我们将数据划分为多个逻辑分区，而 ROW_NUMBER() 则可以在每个分区内生成唯一的行号。结合使用这两个功能，可以轻松实现诸如分页、排名、去重等复杂的数据操作。希望本文的示例和解释能够帮助读者更好地理解和应用这些功能，从而提高数据处理的效率和准确性。

阅读全文

发布于 2025-01-14 03:28:25

SQLServer中Partition