新特性解讀 | MySQL 8.0 正則替換

阿新 • • 發佈：2019-08-07

原創：楊濤濤

MySQL 一直以來都支援正則匹配，不過對於正則替換則一直到MySQL 8.0 才支援。對於這類場景，以前要麼在MySQL端處理，要麼把資料拿出來在應用端處理。

比如我想把表y1的列str1的出現第3個action的子串替換成dble，怎麼實現？

1. 自己寫SQL層的儲存函式。程式碼如下寫死了3個，沒有優化，僅僅作為演示，MySQL 裡非常不建議寫這樣的函式。

mysql
DELIMITER $$
USE `ytt`$$
DROP FUNCTION IF EXISTS `func_instr_simple_ytt`$$
CREATE DEFINER=`root`@`localhost` FUNCTION `func_instr_simple_ytt`(
f_str VARCHAR(1000), -- Parameter 1
f_substr VARCHAR(100), -- Parameter 2
f_replace_str varchar(100),
f_times int -- times counter.only support 3.
) RETURNS varchar(1000)
BEGIN
declare v_result varchar(1000) default 'ytt'; -- result.
declare v_substr_len int default 0; -- search string length.

set f_times = 3; -- only support 3.
set v_substr_len = length(f_substr);
select instr(f_str,f_substr) into @p1; -- First real position .
select instr(substr(f_str,@p1+v_substr_len),f_substr) into @p2; Secondary virtual position.
select instr(substr(f_str,@p2+ @p1 +2*v_substr_len - 1),f_substr) into @p3; -- Third virtual position.
if @p1 > 0 && @p2 > 0 && @p3 > 0 then -- Fine.
select
concat(substr(f_str,1,@p1 + @p2 + @p3 + (f_times - 1) * v_substr_len - f_times)
,f_replace_str,
substr(f_str,@p1 + @p2 + @p3 + f_times * v_substr_len-2)) into v_result;
else
set v_result = f_str; -- Never changed.
end if;
-- Purge all session variables.
set @p1 = null;
set @p2 = null;
set @p3 = null;
return v_result;

end;
$$
DELIMITER ;

-- 呼叫函式來更新：
mysql> update y1 set str1 = func_instr_simple_ytt(str1,'action','dble',3);
Query OK, 20 rows affected (0.12 sec)
Rows matched: 20 Changed: 20 Warnings: 0

2. 匯出來用sed之類的工具替換掉在匯入，步驟如下：（推薦使用）

1）匯出表y1的記錄。

mysql
mysql> select * from y1 into outfile '/var/lib/mysql-files/y1.csv';
Query OK, 20 rows affected (0.00 sec)

2）用sed替換匯出來的資料。

shell
root@ytt-Aspire-V5-471G:/var/lib/mysql-files# sed -i 's/action/dble/3' y1.csv

3）再次匯入處理好的資料，完成。

mysql
mysql> truncate y1;
Query OK, 0 rows affected (0.99 sec)

mysql> load data infile '/var/lib/mysql-files/y1.csv' into table y1;
Query OK, 20 rows affected (0.14 sec)
Records: 20 Deleted: 0 Skipped: 0 Warnings: 0

以上兩種還是推薦匯出來處理好了再重新匯入，效能來的高些，而且還不用自己費勁寫函式程式碼。

那MySQL 8.0 對於以上的場景實現就非常簡單了，一個函式就搞定了。

mysql
mysql> update y1 set str1 = regexp_replace(str1,'action','dble',1,3) ;
Query OK, 20 rows affected (0.13 sec)
Rows matched: 20 Changed: 20 Warnings: 0

還有一個regexp_instr 也非常有用，特別是這種特指出現第幾次的場景。比如定義 SESSION 變數@a。

mysql
mysql> set @a = 'aa bb cc ee fi lucy 1 1 1 b s 2 3 4 5 2 3 5 561 19 10 10 20 30 10 40';
Query OK, 0 rows affected (0.04 sec)

拿到至少兩次的數字出現的第二次子串的位置。

mysql
mysql> select regexp_instr(@a,'[:digit:]{2,}',1,2);
+--------------------------------------+
| regexp_instr(@a,'[:digit:]{2,}',1,2) |
+--------------------------------------+
| 50 |
+--------------------------------------+
1 row in set (0.00 sec)

那我們在看看對多位元組字元支援如何。

mysql
mysql> set @a = '中國 美國 俄羅斯 日本 中國 北京 上海 深圳 廣州 北京 上海 武漢 東莞 北京 青島 北京';
Query OK, 0 rows affected (0.00 sec)

mysql> select regexp_instr(@a,'北京',1,1);
+-------------------------------+
| regexp_instr(@a,'北京',1,1) |
+-------------------------------+
| 17 |
+-------------------------------+
1 row in set (0.00 sec)

mysql> select regexp_instr(@a,'北京',1,2);
+-------------------------------+
| regexp_instr(@a,'北京',1,2) |
+-------------------------------+
| 29 |
+-------------------------------+
1 row in set (0.00 sec)

mysql> select regexp_instr(@a,'北京',1,3);
+-------------------------------+
| regexp_instr(@a,'北京',1,3) |
+-------------------------------+
| 41 |
+-------------------------------+
1 row in set (0.00 sec)

那總結下，這裡我提到了 MySQL 8.0 的兩個最有用的正則匹配函式 regexp_replace 和 regexp_instr。針對以前類似的場景算是有一個完美的解決方

新特性解讀 | MySQL 8.0 正則替換

原創：楊濤濤 MySQL 一直以來都支援正則匹配，不過對於正則替換則一直到MySQL 8.0 才支援。對於這類場景，

新特性解讀 | MySQL 8.0 json到表的轉換

原創：楊濤濤我們知道，JSON是一種輕量級的資料互動的格式，大部分NO SQL資料庫的儲存都用JSON。MyS

新特性解讀 | MySQL 8.0 通用表示式

原創：楊濤濤通用表示式在各個商業資料庫中比如ORACLE，SQL SERVER等早就實現了，M

新特性解讀 | MySQL 8.0 索引特性4-不可見索引

MySQL 8.0 實現了索引的隱藏屬性。當然這個特性很多商業資料庫早就有了，比如ORACLE，在11g中就實現了。我來介紹下這個小特性。介紹 INVISIBLE INDEX，不可見索引或者叫隱藏索引。就是對優化器不可見，查詢的時候優化器不會把她作為備選。其實以前要想徹底

新特性解讀 | MySQL 8.0 直方圖

MySQL 8.0 推出了histogram，也叫柱狀圖或者直方圖。先來解釋下什麼叫直方圖。關於直方圖我們知道，在DB中，優化器負責將SQL轉換為很多個不同的執行計劃，完了從中選擇一個最優的來實際執行。但是有時候優化器選擇的最終計劃有可能隨著DB環境的變化不是最優的，這就導致

新特性解讀 | MySQL 8.0 Temptable 引擎介紹

原創作者：楊濤濤提到MySQL臨時表，我們都很熟悉了，一般來說，分為兩類： 1. MySQL 臨時表引擎，名

新特性解讀 | MySQL 8.0 資源組

原創作者：楊濤濤在MySQL 8.0 之前，我們假設一下有一條爛SQL， mysq

新特新解讀 | MySQL 8.0 對 count(*)的優化

原創：楊濤濤摘要：MySQL 8.0 取消了 sql_calc_found_rows 的語法，以後求表 co

MySQL · 特性分析 · MySQL 8.0 資源組 (Resource Groups)

MySQL 8.0已經正式釋出。這個版本包含很多有意思的特性，例如，更快、效能更好的Schema和Information Schema、原子DDL、UNDO空間回收等，在很多的網站，部落格等上面都有大量的推廣介紹。本文將要介紹的一個很有用的特性，資源組，反而沒有得到充分的宣傳

新特性解讀 | MySQL 最新的release notes（轉載）

原創作者公眾號：yangyidba 從MySQL釋出正式版本8.0.11以來，MySQL又相繼釋出8.0.1

MySQL 8.0.2復制新特性（翻譯）

ogl 防止將不地址 arc -- 等待 download 日誌譯者：知數堂星耀隊 MySQL 8.0.2復制新特性 MySQL 8 正在變得原來越好，而且這也在我們MySQL復制研發團隊引起了一陣熱潮。我們一直致力於全面提升MySQL復制，通過引入新的和一些有趣

MySQL 8.0新特性

MySQL8.0新特性一、MySQL 8.0中添加的功能1、新的系統字典表整合了存儲有關數據庫對象信息的事務數據字典，所有的元數據都用InnoDB引擎進行存儲2、支持DDL 原子操作 InnoDB表的DDL支持事務完整性，要麽成功要麽回滾，將DDL操作回滾日誌寫入到data dictionary

MySQL 8.0新特性--CTE(二)

上一篇介紹了CTE的基本用法，參考MySQL 8.0新特性--CTE(一)，本篇再來介紹一下CTE Recurive遞迴。 1、什麼是CTE Recurive? A recursive common table expression is one having a subquery that refe

MySQL 8.0新特性之Windows Function

MySQL8.0開始像Oracle一樣支援視窗函數了，先來跑個SQL,感受一下視窗函式的魅力。 mysql> create table numbers(val int); mysql> insert into numb

MySQL 8.0新特性--invisible index

invisible index特點預設建立的索引都是visible，如果需要invisible索引建立的時候需要指定invisible引數。預設無法使用invisible index索引，需要開啟引數optimizer_switch='use_invisible_indexes=on'才能使用；

MySQL 8.0新特性--Descending Indexes(六)

Descending Indexes降序索引降序索引主要是用來減少排序，去除filesort的。 MySQL支援降序索引:索引定義中的DESC不再被忽略，而是按降序儲存鍵值。以前，索引可以以相反的順序掃描，但會影響效能。可以按前向順序掃描降序索引，效率更高。當最有效的掃描順序混合了某些列的升序和其他

MySQL 8.0新特性--skip scan range access method(七)

先來個示例： mysql> CREATE TABLE t1 (f1 INT NOT NULL, f2 INT NOT NULL, PRIMARY KEY(f1,&nbs

MySQL 8.0新特性之原子DDL

文章來源：愛可生雲資料庫簡介 MySQL8.0 開始支援原⼦ DDL(atomic DDL)，資料字典的更新，儲存引擎操作，寫⼆進位制日誌結合成了一個事務。在沒有原⼦DDL之前，DROP TABLE t

MySQL 8.0新特性-資料字典

歡迎關注MySQL 8.0必知必會系列課程。 MySQL8.0必知必會-自動化部署 https://edu.51c

MySQL 8.0 新特性之 InnoDB 鎖定讀取選項

文章目錄鎖定讀取語句鎖定讀取示例 NOWAIT 和 SKIP LOCKED 選項原文地址：MySQL 8.0 Reference Manual 鎖定讀取語句如果在同一個事務中，先查詢資料，然後再插入或修

新特性解讀 | MySQL 8.0 正則替換

相關推薦