（百萬資料量級別）java下的mysql資料庫插入越插越慢的問題解決

阿新 • • 發佈：2018-12-31

http://blog.csdn.net/qq547276542/article/details/75097602

最近的專案需要匯入大量的資料，插入的過程中還需要邊查詢邊插入。插入的資料量在100w左右。一開始覺得100w的資料量不大，於是就插啊插，吃了個飯，回來一看，在插入了50多w條資料後，每秒就只能插10條了。。覺得很奇怪，為啥越插越慢呢？於是就開始分析插入的時間損耗，想到了如下的解決方案：（mysql使用的INNODB引擎）

1.分析是否是由主碼，外碼，索引造成的插入效率降低

主碼：由於主碼是每張表必須有的，不能刪除。而mysql會對主碼自動建立一個索引，這個索引預設是Btree索引，因此每次插入資料要額外的對Btree進行一次插入。這個額外的插入時間複雜度約為log(n)。這個索引無法刪除，因此無法優化。但是每次插入的時候，由於主碼約束需要檢查主碼是否出現，這又需要log(n)，能否減少這個開銷呢？答案是肯定的。我們可以設定主碼為自增id AUTO_INCREMENT

,這樣資料庫裡會自動記錄當前的自增值，保證不會插入重複的主碼，也就避免了主碼的重複性檢查。

外碼：由於我的專案的插入表中存在外碼，因此每次插入時需要在另一張表檢測外碼存在性。這個約束是與業務邏輯相關的，不能隨便刪除。並且這個時間開銷應當是與另一張表大小成正比的常數，不應當越插入越慢才對。所以排除。

索引：為了減少Btree插入的時間損耗，我們可以在建表時先不建索引，先將所有的資料插入。之後我們再向表裡新增索引。該方法確實也降低了時間的開銷。

經過以上的折騰，再進行測試，發現速度快了一點，但是到了50w條後又開始慢了。看來問題的關鍵不在這裡。於是繼續查資料，又發現了個關鍵問題：

2.將單條插入改為批量插入（參考：點選開啟連結）

由於java中的executeUpdate(sql)方法只是執行一條sql操作，就需要呼叫sql裡的各種資源，如果使用for迴圈不停的執行這個方法來插入，無疑是開銷很大的。因此，在mysql提供了一種解決方案：批量插入。也就是每次的一條sql不直接提交，而是先存在批任務集中，當任務集的大小到了指定閾值後，再將這些sql一起傳送至mysql端。在100w的資料規模中，我將閾值設定為10000，即一次提交10000條sql。最後的結果挺好，插入的速度比之前快了20倍左右。批量插入程式碼如下：

publicstaticvoid insertRelease() {
Long begin = new Date().getTime();
String sql = "INSERT INTO tb_big_data (count, create_time, random) VALUES (?, SYSDATE(), ?)";
try {
conn.setAutoCommit(false);
PreparedStatement pst = conn.prepareStatement(sql);
for (int i = 1; i <= 100; i++) {
for (int k = 1; k <= 10000; k++) {
pst.setLong(1, k * i);
pst.setLong(2, k * i);
pst.addBatch();
}
pst.executeBatch();
conn.commit();
}
pst.close();
conn.close();
} catch (SQLException e) {
e.printStackTrace();
}
Long end = new Date().getTime();
System.out.println("cast : " + (end - begin) / 1000 + " ms");
}

3.一條UPDATE語句的VALUES後面跟上多條的(?,?,?,?)

這個方法一開始我覺得和上面的差不多，但是在看了別人做的實驗後，發現利用這個方法改進上面的批量插入，速度能快5倍。後來發現，mysql的匯出sql檔案中，那些插入語句也是這樣寫的。。即UPDATE table_name (a1,a2) VALUES (xx,xx),(xx,xx),(xx,xx)... 。也就是我們需要在後臺自己進行一個字串的拼接，注意由於字串只是不停的往末尾插入，用StringBuffer能夠更快的插入。下面是程式碼：

publicstaticvoid insert() {
// 開時時間
Long begin = new Date().getTime();
// sql字首
String prefix = "INSERT INTO tb_big_data (count, create_time, random) VALUES ";
try {
// 儲存sql字尾
StringBuffer suffix = new StringBuffer();
// 設定事務為非自動提交
conn.setAutoCommit(false);
// Statement st = conn.createStatement();
// 比起st，pst會更好些
PreparedStatement pst = conn.prepareStatement("");
// 外層迴圈，總提交事務次數
for (int i = 1; i <= 100; i++) {
// 第次提交步長
for (int j = 1; j <= 10000; j++) {
// 構建sql字尾
suffix.append("(" + j * i + ", SYSDATE(), " + i * j
* Math.random() + "),");
}
// 構建完整sql
String sql = prefix + suffix.substring(0, suffix.length() - 1);
// 新增執行sql
pst.addBatch(sql);
// 執行操作
pst.executeBatch();
// 提交事務
conn.commit();
// 清空上一次新增的資料
suffix = new StringBuffer();
}
// 頭等連線
pst.close();
conn.close();
} catch (SQLException e) {
e.printStackTrace();
}
// 結束時間
Long end = new Date().getTime();
// 耗時
System.out.println("cast : " + (end - begin) / 1000 + " ms");
}

做了以上的優化後，我發現了一個很蛋疼的問題。雖然一開始的插入速度的確快了幾十倍，但是插入了50w條資料後，插入速度總是會一下突然變的非常慢。這種插入變慢是斷崖式的突變，於是我冥思苦想，無意中打開了系統的資源管理器，一看發現：java佔用的記憶體在不斷飆升。突然腦海中想到：是不是記憶體溢位了？

4.及時釋放查詢結果

在我的資料庫查詢語句中，使用到了pres=con.prepareStatement(sql)來儲存一個sql執行狀態，使用了resultSet=pres.executeQuery來儲存查詢結果集。而在邊查邊插的過程中，我的程式碼一直沒有把查詢的結果給釋放，導致其不斷的佔用記憶體空間。當我的插入執行到50w條左右時，我的記憶體空間佔滿了，於是資料庫的插入開始不以記憶體而以磁碟為介質了，因此插入的速度就開始變得十分的低下。因此，我在每次使用完pres和resultSet後，加入了釋放其空間的語句：resultSet.close(); pres.close(); 。重新進行測試，果然，記憶體不飆升了，插入資料到50w後速度也不降低了。原來問題的本質在這裡！

這個事情折騰了一天，也學到了很多。希望這篇部落格能幫助到大家！

（百萬資料量級別）java下的mysql資料庫插入越插越慢的問題解決

（百萬資料量級別）java下的mysql資料庫插入越插越慢的問題解決

CentOS7下MySQL資料庫插入中文顯示問號問題解決

命令列下mysql資料庫插入記錄中包含中文1366錯誤問題解決方法及其他

es 在數據量很大的情況下（數十億級別）如何提高查詢效率啊？

1. win10 下安裝python（環境變量配置）

【XML解析】（1）Java下使用JAXP中的DOM解析方式對XML文件進行解析

Django下mysql資料庫的相關操作（建立資料表、以及增刪查改）

intellij 下編譯單個（沒有main函式的）java檔案

es 在資料量很大的情況下（數十億級別）如何提高查詢效率啊？

Mac 終端 Termial 高亮配置（PS1變量配置）

集合總結（全是代碼）----------java基礎學習

ubuntu下 mysql安裝以後無法登陸的的解決方法（(ERROR 1698 (28000): Access denied for user 'root'@'localhost')）

零基礎自學人工智能，看這些資料就夠了（300G資料免費送）

（整）deepin下mysql的安裝與部分錯誤解決辦法

找出一個數的因子（全部最小的） java實現

計算各種圖形的周長（介面與多型）---Java

SpringMVC_第三章（SpringMVC資料繫結）

去除List集合中的重複值（四種好用的方法）（基本資料型別可用）

每日一題--LeetCode 125 （驗證迴文串）java

Python的安裝與應用（大資料實驗一）

（百萬資料量級別）java下的mysql資料庫插入越插越慢的問題解決

相關推薦