1. 程式人生 > >Oracle去除重複(某一列的值重複),取最新(日期欄位最新)的一條資料

Oracle去除重複(某一列的值重複),取最新(日期欄位最新)的一條資料

解決思路:用Oracle的row_number() over函式來解決該問題。

解決過程:

 1.查看錶中的重複記錄

select

    t.id,

    t.device_id,

    t.update_dtm,

    t.test_result

from DEVICE_INFO_TBL t

檢視重複資料

 

2.標記重複的記錄

select

    t.id,

    t.device_id,

    t.update_dtm,

    t.test_result,

    row_number() OVER(PARTITION BY device_id ORDER BY t.update_dtm desc) as row_flg   

from DEVICE_INFO_TBL t

標記重複記錄

 

3.過濾重複資料,取得最新的記錄

select

    temp.id,

    temp.device_id,

    temp.update_dtm,

    temp.test_result

from (

         select

             t.id,

             t.device_id,

             t.update_dtm,

             t.test_result,

             row_number() OVER(PARTITION BY device_id ORDER BY t.update_dtm desc) as row_flg   

          from DEVICE_INFO_TBL t ) temp

where temp.row_flg  = '1'

過濾重複資料





 

row_number() OVER (PARTITION BY COL1 ORDER BY COL2) 表示根據COL1分組,在分組內部根據 COL2排序,而此函式計算的值就表示每組內部排序後的順序編號(組內連續的唯一的).

  與rownum的區別在於:使用rownum進行排序的時候是先對結果集加入偽列rownum然後再進行排序,而此函式在包含排序從句後是先排序再計算行號碼.

  row_number()和rownum差不多,功能更強一點(可以在各個分組內從1開時排序).

  rank()是跳躍排序,有兩個第二名時接下來就是第四名(同樣是在各個分組內).

  dense_rank()l是連續排序,有兩個第二名時仍然跟著第三名。相比之下row_number是沒有重複值的 .

  lag(arg1,arg2,arg3):
arg1是從其他行返回的表示式
arg2是希望檢索的當前行分割槽的偏移量。是一個正的偏移量,時一個往回檢索以前的行的數目。
arg3是在arg2表示的數目超出了分組的範圍時返回的值。