在SQL中,窗口函数允许我们对查询结果集中的行进行排序和排名,而
RANK()和DENSE_RANK()是用来进行排名的常见选择。它们的主要区别在于如何处理排名相同的情况,也就是出现了排名并列的情况。
1. RANK()
RANK()函数根据指定的ORDER BY子句对行进行排序,并为每一行分配一个排名:
- 排名分配: 对每个唯一的行根据指定的排序顺序分配唯一的排名。
- 处理并列: 如果有多行具有相同的排序值(即并列),RANK()将为所有并列的行分配相同的排名,并在排名序列中留下间隙。例如,如果有两行并列排名第一,下一个排名将会是3而不是2。
示例:
SELECT Version_ID,RANK() OVER (ORDER BY Version_ID DESC) AS Rank
FROM Versions;
假设Version_ID的值为[10, 8, 8, 5, 3],则RANK()会分配排名[1, 2, 2, 4, 5]。
2. DENSE_RANK()
DENSE_RANK()函数也根据指定的ORDER BY子句对行进行排序,但它会尽可能地为每一行分配一个唯一的排名:
- 排名分配: 对每个唯一的行根据指定的排序顺序分配唯一的排名,但是不会留下排名序列中的空隙。
- 处理并列: 如果有多行具有相同的排序值(即并列),DENSE_RANK()将为所有并列的行分配相同的排名,但是下一个唯一的行将会得到下一个连续的排名。
示例:
SELECT Version_ID,DENSE_RANK() OVER (ORDER BY Version_ID DESC) AS Dense_Rank
FROM Versions;
继续假设Version_ID的值为[10, 8, 8, 5, 3],则DENSE_RANK()会分配排名[1, 2, 2, 3, 4]。注意到8出现两次,但排名没有间隙,下一个唯一的值5得到了下一个连续的排名。
总结
- RANK()和- DENSE_RANK()都是用来对查询结果集中的行进行排序和排名的SQL窗口函数。
- RANK()会在有并列排名时留下排名间隙,而- DENSE_RANK()会尽可能连续地分配排名。
- 根据具体需求,选择合适的函数可以帮助我们准确地分析和处理数据中的排名情况。