<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
在以前的MySQL版本中是沒有視窗函數的,直到MySQL8.0才引入了視窗函數。視窗函數是對查詢中的每一條記錄執行一個計算,並且這個計算結果是用與該條記錄相關的多條記錄得到的。
視窗函數與聚合函數很像,他們都是在一組記錄而不是整張表上執行的。但是,一個聚合函數在一組記錄執行後只返回一條結果而視窗函卻會對改分組內的每行記錄都返回一個結果。
MySQL8.0中定義的視窗函數主要有以下幾種:
函數名 | 引數 | 描述 |
cume_dist() | 否 | 累計分佈值。即分組值小於等於當前值的行數與分組總行數的比值。取值範圍為(0,1]。 |
dense_rank() | 否 | 不間斷的組內排序。使用這個函數時,可以出現1,1,2,2這種形式的分組。 |
first_value() | 是;first_value(expr) | 返回分組內截止當前行的第一個值。 |
lag() | 是;lag(expr,[N,[default]]) | 從當前行開始往前取第N行,如果N缺失預設為1。若沒有沒有,則預設返回default。default預設值為NULL |
last_value() | 是;last_value(expr) | 返回分組內截止當前行的最後一個值。 |
lead() | 是;lead(expr,[N,[default]]) | 從當前行開始往後取第N行。函數功能與lag()相反,其餘與lag()相同。 |
nth_value() | 是;nth_value(expr,N) | 返回分組內截止當前行的第N行。first_valuelast_valuenth_value函數功能相似,只是返回分組內截止當前行的不同行號的資料。 |
ntile() | 是;ntile(N) | 返回當前行在分組內的分桶號。在計算時要先將改分組內的所有資料劃分成N個桶,之後返回每個記錄所在的分桶號。返回範圍從1到N |
percent_rank() | 否 | 累計百分比。該函數的計算結果為:小於該條記錄值的所有記錄的行數/該分組的總行數-1. 所以改記錄的返回值為[0,1] |
rank() | 否 | 間斷的組內排序。其排序結果可能出現如下結果:1,1,3,4,4,6 |
row_number() | 否 | 當前行在其分組內的序號。不管其排序結果中是否出現重複值,其排序結果都為:1,2,3,4,5 |
注:‘引數’列說明該函數是否可以加引數。“否”說明該函數的括號內不可以加引數。expr即可以代表欄位,也可以代表在欄位上的計算,比如sum(col)等。以下相同。
over子句可以指定如何將記錄劃分分割區以供視窗函數處理。如果over()為空,則是將整個查詢記錄作為一個分組。如果over子句不為空,則其可以指定查詢記錄劃分分組的方式以及記錄在分組內部的排序方式。除此之外,over子句也可以和聚合函數一起用。如果聚合函數後出現over子句,那麼這些聚合函數也就變成了視窗函數。如果沒有over子句,則他們仍然是聚合函數。可以使用over子句的聚合函數主要有以下幾種:
avg()、bit_and()、bit_or()、bit_xor()、count()、max()、min()、stddev_pop()、stddev()、std()、stddev_samp()、sum()、var_pop()、variance()、var_samp()
而對於前一部分中介紹的視窗函數來說,over()子句是強制必須要有的。
over子句中常見的語法形式為:
over_clause:
{OVER (window_spec) | OVER window_name}
其中:
window_spec:
[window_name] [partition_clause] [order_clause] [frame_clause]
window_name: 是指在查詢語句定義的window子句。如果遇到group by、having子句order by子句,那麼window子句要放到having子句和order by子句中間。其語法如下:
WINDOW window_name AS (window_spec)
[, window_name AS (window_spec)] ...
而
window_spec:
[window_name] [partition_clause] [order_clause] [frame_clause]
從語法結構可以看出來window子句其實只是把放在over()括號中的內容單獨抽出來。
partition_clause:即parittion by expr子句。用來指定記錄分組方式。語法中的expr不僅可以是欄位本身,也可以是計算表示式。比如,記錄中有個timestramp型別的欄位 ts,在MySQL中,partition by ts 和partition by hour(ts)都是有效的。
order_clause: 即 order by expr desc|asc,expr desc|asc。 用來指定分組內的排序方式。
frame_clause: 用來指定當前分組中的子集劃分方式。frame可以在依據當前行的位置在每個分組內移動。使用frame來計算流水流水總和(從分割區開始到當前行)及捲動平均(rolling averages)。
其語法結構如下:
frame_clause: frame_units frame_extent frame_units: {ROWS | RANGE} frame_extent: {frame_start | frame_between} frame_between: BETWEEN frame_start AND frame_end frame_start, frame_end: { CURRENT ROW | UNBOUNDED PRECEDING | UNBOUNDED FOLLOWING |expr PRECEDING | expr FOLLOWING }
其中:
frame_units用來指示當前行和frame的關係
ROWS: 用來定義frame的開始行和結束行(偏移量依據的是位置);RANGE: 定義frame的區間。(偏移量的基準為當前行的值)
frame_entent用來指示frame的開始行和結束行。一種是通過指定start和end(frame_start,frame_end。frame_end可以不指定,沒有明確給出的話當前行預設為結束行),另一種使用between(frame_between)。frame_between的語法很簡單。下面來看frame_start和frame_end。
current row:和rows一起用時,邊界就是當前行。和range一起用時,邊界是當前行的對等點(個人理解,這裡所說的對等點應為與當前行的值相等的所有記錄)。
unbounded precceding:使用它時,每個分割區的第一行即為邊界。
unbounded following:使用它時,每個分割區的第一行即為邊界。
expr precedingexpr following: 可以由expr個性化的設定向上(preceding)向下(following)的偏移量。
表結構如下:
select order_date,sum(quantity) as quantity, rank()over(ORDER BY sum(quantity) desc) as rank_result, dense_rank()over(ORDER BY sum(quantity) desc) as dense_result, row_number()over(ORDER BY sum(quantity) desc) as row_result from spm_order group by order_date -- 限定一部分資料,沒有實際意義,能展示出這三個函數的區別就可以了 having quantity>=98 order by quantity desc
執行結果如下:
從上面結果看出:
select order_date,num, cume_dist()over(order by num asc) as cume_result, percent_rank()over(order by num asc) as percent_result from (select order_date,count(1) as num from spm_order group by order_date having num>=27)a order by num asc
程式碼執行結果如下
分析如下:
select sales_name,year_date,num, first_value(num)over(PARTITION by sales_name order by year_date asc) as first_result, last_value(num)over(PARTITION by sales_name order by year_date asc) as last_result, nth_value(num,2)over(PARTITION by sales_name order by year_date asc) as nth_result from (select sales_name,year(order_date)as year_date,count(1) as num from spm_order where sales_name in ('楊健','楚傑','洪光') group by year(order_date),sales_name order by sales_name asc,year_date asc)a
程式碼執行結果如下(要注意,這三個函數計算結果都是截止當前行)
select sales_name,year_date,num, ntile(8)over(order by num asc) as n_bin from (select sales_name,year(order_date)as year_date,count(1) as num from spm_order where sales_name in ('楊健','楚傑','洪光') group by year(order_date),sales_name order by sales_name asc,year_date asc)a
程式碼執行結果如下:
從結果上進行分析:
select sales_name,year_date,num, lag(num,2)over(PARTITION by sales_name order by year_date asc) as lag_result, lead(num,2)over(PARTITION BY sales_name order by year_date asc) as lead_result from (select sales_name,year(order_date)as year_date,count(1) as num from spm_order where sales_name in ('楊健','楚傑','洪光') group by year(order_date),sales_name order by sales_name asc,year_date asc)a
程式碼執行結果如下:
注意,lag()和lead()函數中出現的欄位可以與over()子句中order by中出現的欄位不一致。在程式碼lag(num,2)中2代表的想要取數的那一行相比當前行的偏移量(lead中也類似)。
select sales_name,year_date,num, sum(num)over(PARTITION by sales_name) as sum_order, avg(num)over(PARTITION by sales_name) as mean_order from (select sales_name,year(order_date)as year_date,count(1) as num from spm_order where sales_name in ('楊健','楚傑','洪光') group by year(order_date),sales_name order by sales_name asc,year_date asc)a
程式碼執行結果如下:
select sales_name,year_date,num, sum(num)over(partition by sales_name) as count_1, count(num)over(partition by sales_name order by num) as count_2 from (select sales_name,year(order_date)as year_date,count(1) as num from spm_order where sales_name in ('楊健','楚傑','洪光') group by year(order_date),sales_name order by sales_name asc,year_date asc)a
程式碼執行結果如下:
當frame_clause不存在的時候,預設的frame與order by子句是否存在有關:
select sales_name,year(order_date) as year_1,count(1) as num, sum(count(1)) over w as sales_order, sum(count(1)) over (w_1) as year_order, rank()over(w order by count(1) desc) as rank_order -- 三種寫法都是符合語法規範的 from spm_order where sales_name in ('楊健','楚傑','洪光') group by sales_name,year(order_date) window w as (PARTITION by sales_name), w_1 as (PARTITION by year(order_date)) order by sales_order
程式碼執行結果如下:
rows和range是不能單獨使用的,但是因為實在不理解這兩個用法上的區別,所以就進行了單獨的驗證。
select sales_name,month_1,rn_1,num, sum(num)over(order by month_1 rows between 2 preceding and 1 preceding) as month_row, sum(num)over(order by month_1 range between 2 preceding and 1 preceding) as month_range, sum(num)over(order by rn_1 range between 2 preceding and 1 preceding) as rn_range from (SELECT sales_name,month(order_date) as month_1,count(1) as num, -- 由於rank()over()返回的是unsigned,當相減結果為負時(between子句會用到減法)會報錯,所以這裡轉成signed型別 cast(rank()over(order by month(order_date)) as signed) as rn_1 from spm_order where sales_name in ('洪光','範彩') group by sales_name,month(order_date))a order by month_1 asc
程式碼執行結果如下:
對以上程式碼分析:
首先,在這裡我新建了一個rn_1列。rn_1列和month_1的區別在於,month_1的資料是連續的,而rn_1列是有中斷的(兩個1之後出現的是3,我是故意要建立一箇中斷的序列,來分析一下range的作用範圍)
先來看month_row的區別,month_row列的計算結果為當前行在分割區中按month_1升序排序之後排在其前面的兩行(between and限定的)的sum求和值。所以rows後面的between and限定的偏移量是基於他們在分割區中的排列位置的。
再來看month_range,通過分析其實驗結果可以發現,month_range列的計算為分割區內month_1=當前行-1和month_1=當前行-2(-1,-2是由between an子句決定的。preceding代表負,following代表正)所有列的sum求和值。再來看rn_range, rn_range列的計算結果為分割區內month_1=當前行-2的所有裡列的sum求和值。所以,rang後面的between and限定的偏移量依據的是當前行的數值。
到此這篇關於MySQL8.0中的視窗函數的範例程式碼的文章就介紹到這了,更多相關MySQL8.0 視窗函數內容請搜尋it145.com以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援it145.com!
相關文章
<em>Mac</em>Book项目 2009年学校开始实施<em>Mac</em>Book项目,所有师生配备一本<em>Mac</em>Book,并同步更新了校园无线网络。学校每周进行电脑技术更新,每月发送技术支持资料,极大改变了教学及学习方式。因此2011
2021-06-01 09:32:01
综合看Anker超能充系列的性价比很高,并且与不仅和iPhone12/苹果<em>Mac</em>Book很配,而且适合多设备充电需求的日常使用或差旅场景,不管是安卓还是Switch同样也能用得上它,希望这次分享能给准备购入充电器的小伙伴们有所
2021-06-01 09:31:42
除了L4WUDU与吴亦凡已经多次共事,成为了明面上的厂牌成员,吴亦凡还曾带领20XXCLUB全队参加2020年的一场音乐节,这也是20XXCLUB首次全员合照,王嗣尧Turbo、陈彦希Regi、<em>Mac</em> Ova Seas、林渝植等人全部出场。然而让
2021-06-01 09:31:34
目前应用IPFS的机构:1 谷歌<em>浏览器</em>支持IPFS分布式协议 2 万维网 (历史档案博物馆)数据库 3 火狐<em>浏览器</em>支持 IPFS分布式协议 4 EOS 等数字货币数据存储 5 美国国会图书馆,历史资料永久保存在 IPFS 6 加
2021-06-01 09:31:24
开拓者的车机是兼容苹果和<em>安卓</em>,虽然我不怎么用,但确实兼顾了我家人的很多需求:副驾的门板还配有解锁开关,有的时候老婆开车,下车的时候偶尔会忘记解锁,我在副驾驶可以自己开门:第二排设计很好,不仅配置了一个很大的
2021-06-01 09:30:48
不仅是<em>安卓</em>手机,苹果手机的降价力度也是前所未有了,iPhone12也“跳水价”了,发布价是6799元,如今已经跌至5308元,降价幅度超过1400元,最新定价确认了。iPhone12是苹果首款5G手机,同时也是全球首款5nm芯片的智能机,它
2021-06-01 09:30:45