1. 程式人生 > >【乾貨總結】:可能是史上最全的MySQL和PGSQL對比材料

【乾貨總結】:可能是史上最全的MySQL和PGSQL對比材料

【乾貨總結】:可能是史上最全的MySQL和PGSQL的對比材料

運維了MySQL和PGSQL已經有一段時間了,最近接到一個數據庫選型需求,於是便開始收集資料整理了一下,然後就有了下面的對比表

關鍵詞:PostgreSQL 11、MySQL5.7

 

比較版本:PostgreSQL 11    VS      MySQL5.7(innodb引擎) Oracle官方社群版 版權情況:PostgreSQL 11(免費開源)、MySQL5.7 Oracle官方社群版(免費開源)

1. CPU限制 PGSQL 沒有CPU核心數限制,有多少CPU核就用多少     MySQL 能用128核CPU,超過128核用不上

 2. 配置檔案引數

PGSQL 一共有255個引數,用到的大概是80個,引數比較穩定,用上個大版本配置檔案也可以啟動當前大版本資料庫     MySQL 一共有707個引數,用到的大概是180個,引數不斷增加,就算小版本也會增加引數,大版本之間會有部分引數不相容情況
3. 第三方工具依賴情況 PGSQL 只有高可用叢集需要依靠第三方中介軟體,例如:patroni+etcd、repmgr     MySQL 大部分操作都要依靠percona公司的第三方工具(percona-toolkit,XtraBackup),工具命令太多,學習成本高,高可用叢集也需要第三方中介軟體,官方MGR叢集還沒成熟

4. 底層主從複製原理

PGSQL 物理複製,跟SQL Server映象/AlwaysOn一樣,嚴格一致,沒有任何可能導致不一致,效能和可靠性上,物理複製完勝邏輯複製,維護簡單        MySQL 邏輯複製,(sql_log_bin、binlog_format等引數設定不正確都會導致主從不一致)
大事務並行複製效率低,對於重要業務,需要依賴 percona-toolkit的pt-table-checksum和pt-table-sync工具定期比較和修復主從一致
主從複製出錯嚴重時候需要重搭主從
MySQL的邏輯複製並不阻止兩個不一致的資料庫建立複製關係

5. 從庫只讀狀態

PGSQL 系統自動設定從庫預設只讀,不需要人工介入,維護簡單        MySQL 從庫需要手動設定引數super_read_only=on,讓從庫設定為只讀,super_read_only引數有bug,連結:https://baijiahao.baidu.com/s?id=1636644783594388753&wfr=spider&for=pc

6. 版本分支

PGSQL 只有社群版,沒有其他任何分支版本,PGSQL官方統一開發,統一維護,社群版有所有功能,不像SQL Server和MySQL有標準版、企業版、經典版、社群版、開發版、web版之分
國內外還有一些基於PGSQL做二次開發的資料庫廠商,例如:Enterprise DB、瀚高資料庫等等,當然這些只是二次開發並不算獨立分支     MySQL 由於歷史原因,分裂為三個分支版本,MariaDB分支、Percona分支 、Oracle官方分支,發展到目前為止各個分支基本互相不相容
Oracle官方分支還有版本之分,分為標準版、企業版、經典版、社群版

7. SQL特性支援

PGSQL SQL特性支援情況支援94種,SQL語法支援最完善,例如:支援公用表表達式(WITH查詢)     MySQL SQL特性支援情況支援36種,SQL語法支援比較弱,例如:不支援公用表表達式(WITH查詢)   關於SQL特性支援情況的對比,可以參考:http://www.sql-workbench.net/dbms_comparison.html

8. 主從複製安全性

PGSQL
同步流複製、強同步(remote apply)、高安全,不會丟資料
PGSQL同步流複製:所有從庫宕機,主庫會罷工,主庫無法自動切換為非同步流複製(非同步模式),需要通過增加從庫數量來解決,一般生產環境至少有兩個從庫
手動解決:在PG主庫修改引數synchronous_standby_names ='',並執行命令: pgctl reload ,把主庫切換為非同步模式 主從資料完全一致是高可用切換的第一前提,所以PGSQL選擇主庫罷工也是可以理解     MySQL
增強半同步複製 ,mysql5.7版本增強半同步才能保證主從複製時候不丟資料
mysql5.7半同步複製相關引數:
引數rpl_semi_sync_master_wait_for_slave_count 等待至少多少個從庫接收到binlog,主庫才提交事務,一般設定為1,效能最高
引數rpl_semi_sync_master_timeout 等待多少毫秒,從庫無迴應自動切換為非同步模式,一般設定為無限大,不讓主庫自動切換為非同步模式
所有從庫宕機,主庫會罷工,因為無法收到任何從庫的應答包 手動解決:在MySQL主庫修改引數rpl_semi_sync_master_wait_for_slave_count=0

9. 多欄位統計資訊

PGSQL 支援多欄位統計資訊     MySQL 不支援多欄位統計資訊

10. 索引型別

PGSQL 多種索引型別(btree , hash , gin , gist , sp-gist , brin , bloom , rum , zombodb , bitmap,部分索引,表示式索引)     MySQL btree 索引,全文索引(低效),表示式索引(需要建虛擬列),hash 索引只在記憶體表

11. 物理表連線演算法

PGSQL 支援  nested-loop join 、hash join 、merge join        MySQL 只支援  nested-loop join

12. 子查詢和檢視效能

PGSQL 子查詢,檢視優化,效能比較高     MySQL 檢視謂詞條件下推限制多,子查詢上拉限制多

13. 執行計劃即時編譯

PGSQL 支援  JIT    執行計劃即時編譯,使用LLVM編譯器     MySQL 不支援執行計劃即時編譯

14. 並行查詢

PGSQL 並行查詢(多種並行查詢優化方法),並行查詢一般多見於商業資料庫,是重量級功能     MySQL

有限,只支援主鍵並行查詢


15. 物化檢視

PGSQL 支援物化檢視     MySQL

不支援物化檢視


16. 外掛功能

PGSQL 支援外掛功能,可以豐富PGSQL的功能,GIS地理外掛,時序資料庫外掛, 向量化執行外掛等等     MySQL

不支援外掛功能


17. check約束

PGSQL 支援check約束     MySQL

不支援check約束,可以寫check約束,但儲存引擎會忽略它的作用,因此check約束並不起作用(mariadb 支援)


18. gpu 加速SQL

PGSQL 可以使用gpu 加速SQL的執行速度        MySQL

不支援gpu 加速SQL 的執行速度   


19. 資料型別

PGSQL 資料型別豐富,如 ltree,hstore,陣列型別,ip型別,text型別,有了text型別不再需要varchar,text型別欄位最大儲存1GB     MySQL

資料型別不夠豐富


20. 跨庫查詢

PGSQL 不支援跨庫查詢,這個跟Oracle 12C以前一樣     MySQL

可以跨庫查詢


21. 備份還原

PGSQL 備份還原非常簡單,時點還原操作比SQL Server還要簡單,完整備份+wal歸檔備份(增量)
假如有一個三節點的PGSQL主從叢集,可以隨便在其中一個節點做完整備份和wal歸檔備份

    MySQL

備份還原相對不太簡單,完整備份+binlog備份(增量)
完整備份需要percona的XtraBackup工具做物理備份,MySQL本身不支援物理備份
時點還原操作步驟繁瑣複雜


22. 效能檢視

PGSQL 需要安裝pg_stat_statements外掛,pg_stat_statements外掛提供了豐富的效能檢視:如:等待事件,系統統計資訊等
不好的地方是,安裝外掛需要重啟資料庫,並且需要收集效能資訊的資料庫需要執行一個命令:create extension pg_stat_statements命令
否則不會收集任何效能資訊,比較麻煩

  MySQL

自帶PS庫,預設很多功能沒有開啟,而且開啟PS庫的效能檢視功能對效能有影響(如:記憶體佔用導致OOM bug)


23. 安裝方式

PGSQL 有各個平臺的包rpm包,deb包等等,相比MySQL缺少了二進位制包,一般用原始碼編譯安裝,安裝時間會長一些,執行命令多一些

  MySQL

有各個平臺的包rpm包,deb包等等,原始碼編譯安裝、二進位制包安裝,一般用二進位制包安裝,方便快捷


24. DDL操作

PGSQL 加欄位、可變長欄位型別長度改大不會鎖表,所有的DDL操作都不需要藉助第三方工具

  MySQL

由於大部分DDL操作都會鎖表,例如加欄位、可變長欄位型別長度改大,所以需要藉助percona-toolkit裡面的pt-online-schema-change工具去完成操作
將影響減少到最低,特別是對大表進行DDL操作


25. 大版本釋出速度

PGSQL PGSQL每年一個大版本釋出,大版本釋出的第二年就可以上生產環境,版本迭代速度很快 PGSQL 10正式版推出時間:2017年
PGSQL 11正式版推出時間:2018年
PGSQL 12正式版推出時間:2019年   MySQL

MySQL的大版本釋出一般是2年~3年,一般大版本釋出後的第二年才可以上生產環境,避免有坑,版本釋出速度比較慢

MySQL5.6正式版推出時間:2013年
MySQL5.7正式版推出時間:2015年
MySQL8.0正式版推出時間:2018年


26. returning語法

PGSQL 支援returning語法,returning clause 支援 DML 返回 Resultset,減少一次 Client <-> DB Server 互動

  MySQL 不支援returning語法

27. 內部架構

PGSQL 多程序架構,併發連線數不能太多,跟Oracle一樣,既然跟Oracle一樣,那麼很多優化方法也是相通的,例如:開啟大頁記憶體

  MySQL

多執行緒架構,雖然多執行緒架構,但是官方有限制連線數,原因是系統的併發度是有限的,執行緒數太多,反而系統的處理能力下降,隨著連線數上升,反而效能下降
一般同時只能處理200 ~300個數據庫連線


28. 聚集索引

PGSQL 不支援聚集索引,PGSQL本身的MVCC的實現機制所導致

  MySQL

支援聚集索引


29. 空閒事務終結功能

PGSQL 通過設定 idle_in_transaction_session_timeout 引數來終止空閒事務,比如:應用程式碼中忘記關閉已開啟的事務,PGSQL會自動查殺這種型別的會話事務

  MySQL

不支援終止空閒事務功能


30. 應付超大資料量

PGSQL 不能應付超大資料量,由於PGSQL本身的MVCC設計問題,需要垃圾回收,只能期待後面的大版本做優化   

  MySQL

不能應付超大資料量,MySQL自身架構的問題


31. 分散式演進

PGSQL HTAP資料庫:cockroachDB、騰訊Tbase 分片叢集:  Postgres-XC、Postgres-XL

  MySQL
HTAP資料庫:TiDB
分片叢集: 各種各樣的中介軟體,不一一列舉

 

 

小結

上面的對比表還不是很完善,只有一些本人認為比較關鍵的特性拿出來對比

 

總的來說,MySQL因為需要支援更換儲存引擎,所以某些功能都要受制於儲存引擎層,例如:物理複製

而PGSQL不支援更換儲存引擎(在PGSQL V12開始也支援可插撥的表存取介面),而且一直由官方統一開發和維護,所以相對比較穩定,功能也比較完善,對得上它的稱號:《世界上功能最為強大的開源資料庫》

PGSQL V12 支援可插撥的表存取介面之後,有可能由第三方儲存引擎來改進PGSQL本身的MVCC實現機制,而不需要等待官方去解決,聚集索引、undo表空間這些都不再是問題

 

 

如有不對的地方,歡迎大家拍磚o(∩_∩)o 

本文版權歸作者所有,未經作者同意不得轉載。