Mysql批量寫入資料，對於這類效能問題，你是如何優化的

阿新 • • 發佈：2019-02-10

測試環境
配置直接影響執行速度，先上一下測試機配置：
cpu i7 5500U（低電壓傷不起，以後再也不買低電壓的U了）
記憶體 8G ddr3 1600
php 7.1
mysql 5.5.40
開發框架 CodeIgniter 3.1.2
影響寫入效率的因素都有什麼？
資料庫引擎
開發中常用的資料庫引擎 MyISAM，InnoDB 這兩種，其他的資料庫引擎我在開發中還沒用到，所以不在這裡測試了。
先看一下庫表結構：
test庫下有兩張表：分別為上面提的兩種引擎：
每張表結構如下（一個自增id，一個varchar型別待插入欄位）：
預設狀態下對兩表插入20w資料看一下效率：
PHP程式碼如下：

 /**
 * 
 * 測試插入效率
 * 
 * @return void
 * 
 */public function insertTest(){
    set_time_limit(0);   //防止超300s 500錯誤

    $t1 = microtime(true);


    //隨機插入num條
    for ($i=1; $i<=200000; $i++){

        $result = $this->db->insert('myisam', ['value' => uniqid().$i]);
    }

    //程式執行時間
    $t2 = microtime(true);
    echo '耗時：'.round($t2-$t1,3).'秒<br>';
    echo '記憶體消耗：'.round(memory_get_usage()/1048576,2)." M<br/>";

}

20w 資料 Myisam要接近3分鐘了。
看一下InnoDb預設狀態下執行時間：
插入1w條資料用了 6分49秒，沒辦法等下去了，按照這個資料量推測 6分49 * 20 = ？？？
後期由於資料量增多，也會影響插入效能，所以InnoDb預設狀態插入20w單欄位資料要2小時以上，無法忍受。

業務邏輯
顯然上面的業務邏輯是有問題的，每條資料單次插入，增加了mysql的開銷，每次插入資料都要重新連接一下mysql，肯定是相當浪費資源了。所以CI提供了 insert_batch()，批量寫入資料。Thinkphp3.2 也有addAll() 這樣的方法來支援。其他框架應該都有！
原理很簡單就是把二維陣列，拼接為sql
將單條Sql如下：
$sql = “INSERT INTO TEST (value) VALUES (‘helloworld1’)”;
$sql = “INSERT INTO TEST (value) VALUES (‘helloworld2’)”;
拼接為：
$sql = “INSERT INTO TEST (value) VALUES (‘helloworld1’), (‘helloworld2’)”;
很明顯批量插入速度要快很多。
還是20w資料，MyISAM 下批量查詢速度多快？（已有資料會影響插入效率，已清空 myisam表）

   /**
 * 
 * 測試批量插入效率
 * 
 * @return void
 * @author [email protected]
 * 
 */
public function insertTest(){
 set_time_limit(0);   //防止超300s 500錯誤

    $t1 = microtime(true);


    //隨機插入num條
    for ($i=1; $i<=200000; $i++){

        $data[$i] = ['value' => uniqid().$i];
    }
    //程式執行時間
    $t2 = microtime(true);
    echo '迴圈耗時：'.round($t2-$t1,3).'秒<br>';

    $this->db->insert_batch('myisam', $data);  //批量插入

    $t3 = microtime(true);
    echo '插入耗時：'.round($t3-$t2,3).'秒<br>';

    echo '記憶體消耗：'.round(memory_get_usage()/1048576,2)." M<br/>";

}

比起之前的167秒的單條插入速度快了 5 倍。記憶體消耗增加1.5倍左右，記憶體換時間，可取~~~
InnoDB 會是什麼速度呢？
執行結果：

這次終於執行完了，而且速度很快。和之前的兩個小時比，效率也提升了N倍。

修改配置引數提升效能：
InnoDB 引擎真的這麼慢？這麼low?
答案顯然是：NO
InnoDB寫入之所以這麼慢的一個原因是：
innodb_flush_log_at_trx_commit

引數配置的問題
如下圖預設的值：

   當innodb_flush_log_at_trx_commit=0時, log buffer將每秒一次地寫入log file, 並且log file的flush(重新整理          到disk)操作同時進行. 此時, 事務提交是不會主動觸發寫入磁碟的操作.
   當innodb_flush_log_at_trx_commit=1時(預設), 每次事務提交時, MySQL會把log buffer的資料寫入log f          ile, 並且將log file flush(重新整理到disk)中去.
   當innodb_flush_log_at_trx_commit=2時, 每次事務提交時, MySQL會把log buffer的資料寫入log file, 但          不會主動觸發flush(重新整理到disk)操作同時進行. 然而, MySQL會每秒執行一次flush(重新整理到disk)操作.

把值設定為2，再試一下：

速度又提升了 3倍，和 MyISAM幾乎相同。
所以以後說InnoDB寫入速度慢，可能是配置問題

還可以優化？
還有什麼可以優化？
由於我們使用了框架的insert_batch，看一下CI原始碼：

   /**
 * The "set_insert_batch" function.  Allows key/value pairs to be set for batch inserts
 *
 * @param   mixed
 * @param   string
 * @param   bool
 * @return  CI_DB_query_builder
 */
public function set_insert_batch($key, $value = '', $escape = NULL)
{
    $key = $this->_object_to_array_batch($key);


    if ( ! is_array($key))
    {
        $key = array($key => $value);
    } is_bool($escape) OR $escape = $this->_protect_identifiers;

    $keys = array_keys($this->_object_to_array(current($key)));
    sort($keys);

    foreach ($key as $row)
    {
        $row = $this->_object_to_array($row);
        if (count(array_diff($keys, array_keys($row))) > 0 OR count(array_diff(array_keys($row), $keys)) > 0)
        {
            // batch function above returns an error on an empty array
            $this->qb_set[] = array();
            return;
        }

        ksort($row); // puts $row in the same order as our keys

        if ($escape !== FALSE)
        {
            $clean = array();
            foreach ($row as $value)
            {
                $clean[] = $this->escape($value);
            }

            $row = $clean;
        }

        $this->qb_set[] = '('.implode(',', $row).')';
    }

    foreach ($keys as $k)
    {
        $this->qb_keys[] = $this->protect_identifiers($k, FALSE, $escape);
    }

    return $this;
}

我們傳入的資料，方法會再迴圈，判斷。所以建議語句自己拼接
程式碼修改如下：

/**
 * 
 * 測試插入效率
 * 
 * @return void
 * @author [email protected]
 * 
 */
public function insertTest(){
set_time_limit(0);   //防止超300s 500錯誤

    $t1 = microtime(true);


    $sql = "insert into innodb (value) VALUES";
    //隨機插入num條
    for ($i=1; $i<=200000; $i++){

        $val = uniqid().$i;

        $sql .= "('{$val}'),";

    }

    $sql = substr($sql,0,-1);

    //程式執行時間
    $t2 = microtime(true);
    echo '迴圈耗時：'.round($t2-$t1,3).'秒<br>';

    $this->db->query($sql);  //批量插入

    $t3 = microtime(true);
    echo '插入耗時：'.round($t3-$t2,3).'秒<br>';

    echo '記憶體消耗：'.round(memory_get_usage()/1048576,2)." M<br/>";

}

執行結果：

20W條資料 InnoDB 迴圈1.6秒，插入1.2秒。速度是不是很爽了。。
拼接語句可能會報錯
設定一下
max_allowed_packet = 500M
允許mysql 接受資料包大小。

Mysql批量寫入資料，對於這類效能問題，你是如何優化的

Mysql批量寫入資料，對於這類效能問題，你是如何優化的

mysql批量寫入數據時，註意事項

mysql 批量更新數據庫主鍵為int，bigint 類型，字段為自增類型

Mybatis 實現Mysql批量插入資料，判斷資料是否存在

Redis的持久化機制包括RBD和AOF兩種，對於這兩種持久化方式各有優勢

mysql 批量刪資料並且整理表碎片

MYSQL 批量插入資料 insert into ON DUPLICATE KEY UPDATE

大資料好不好學，有這幾大步驟你就懂了

5.03-mysql批量更新資料的異常

JAVA使用HBase根據Rowkey批量查詢資料(一次查多條，返回多個記錄)

mybatis學習之路----mysql批量新增資料

關於繼承，不同繼承方式，對於派生類成員以及基類的可見性

MySQL批量刪除資料指令碼

Mysql批量刪除資料

php mysql 批量更新資料

mysql批量遷移資料至redis

python向mySQL批量插入資料的方法

mysql 批量插入資料（INNODB）優化

Sqlite3批量寫入資料到資料庫中

關於JDBC+MySQL批量寫入：用insert values方式批量寫入

Mysql批量寫入資料，對於這類效能問題，你是如何優化的

相關推薦