數據庫批量數據插入問題分析

阿新 • • 發佈：2017-05-15

== 5.0 性能以及 mon 基礎 use 插入 light

在數據庫的相關開發中，經常會遇到數據的批量插入問題。本文主要是通過實驗的方式探討批量數據插入的瓶頸，以及優化建議。

以10w條記錄的插入作為實驗對象，采用下面的幾種方法插入：

1. 普通插入：普通的一條條插入

2. 普通插入+手動提交：setAutoCommit(false)、commit（）

3. 普通插入+手動提交+ prepareStatement方式

4. 批量插入：addBatch、executeBatch

5. 批量插入：insert into tableName (x,xx,xxx) values(x,xx,xxx),(xx,xxx,xxxx)…,

6. 多線程插入。

7. InnoDB引擎和MyISAM引擎的比較。

實驗環境：

數據庫：MySQL 5.0

機器硬件：

內存 3G

CPU AMD雙核4400+ 2.3G

首先建立一個簡單的user表：

CREATE TABLE `user` (

`id` varchar(50) NOT NULL,

`seqid` bigint(20) NOT NULL auto_increment,

`name` varchar(50) NOT NULL,

PRIMARY KEY (`seqid`)

) ENGINE=MyISAM DEFAULT CHARSET=utf8

一、普通插入
代碼：

Connection conn=source.getConnection();
2 技術分享

Statement s=conn.createStatement();
3 技術分享

String sql="";
4 技術分享

long start=System.currentTimeMillis();
5 技術分享

for(int i=0;i<100000;i++)
6 技術分享

{
7

sql="insert into user(id,name) value(‘"+(i+1)+"‘,‘chenxinhan‘)";
8 技術分享

s.execute(sql);
9 技術分享

}
10

s.close();
11 技術分享

conn.close();
12 技術分享

long end=System.currentTimeMillis();
13 技術分享

System.out.println("commonInsert()執行時間為："+(end-start)+"ms");

輸出結果：
commonInsert()執行時間為：13828ms

二、普通插入+手動提交：setAutoCommit(false)、commit()
代碼：

Connection conn=source.getConnection();
2 技術分享

conn.setAutoCommit(false);
3 技術分享

Statement s=conn.createStatement();
4 技術分享

String sql="";
5 技術分享

long start=System.currentTimeMillis();
6 技術分享

for(int i=0;i<100000;i++)
7 技術分享

{
8

sql="insert into user(id,name) value(‘"+(i+1)+"‘,‘chenxinhan‘)";
9 技術分享

s.execute(sql);
10 技術分享

}
11

conn.commit();
12 技術分享

s.close();
13 技術分享

conn.close();
14 技術分享

long end=System.currentTimeMillis();
15 技術分享

System.out.println("commonInsert()執行時間為："+(end-start)+"ms");

輸出結果：
commonInsert()執行時間為：13813ms
對比分析：
可以看出，僅僅是這種方式的設置，對性能的影響並不大。

三、普通插入+手動提交+ prepareStatement方式
代碼：

Connection conn=source.getConnection();
2 技術分享

conn.setAutoCommit(false);
3 技術分享

PreparedStatement ps=conn.prepareStatement("insert into user(id,name) value(?,?)");
4 技術分享

long start=System.currentTimeMillis();
5 技術分享

for(int i=0;i<100000;i++)
6 技術分享

{
7

ps.setString(1,(i+1)+"");
8 技術分享

ps.setString(2,"chenxinhan");
9 技術分享

ps.execute();
10 技術分享

}
11

conn.commit();
12 技術分享

ps.close();
13 技術分享

conn.close();
14 技術分享

long end=System.currentTimeMillis();
15 技術分享

System.out.println("prepareStatementInsert()執行時間為："+(end-start)+"ms");

輸出結果：
prepareStatementInsert()執行時間為：12797ms
對比分析：
采用prepareStatement的方式確實可以提高一點性能，因為減少了數據庫引擎解析優化SQL語句的時間，但是由於現在的插入語句太簡單，所以性能提升不明顯。

四、批量插入：addBatch、executeBatch
代碼：

Connection conn=source.getConnection();
2 技術分享

conn.setAutoCommit(false);
3 技術分享

Statement s=conn.createStatement();
4 技術分享

String sql="";
5 技術分享

long start=System.currentTimeMillis();
6 技術分享

for(int j=0;j<100;j++)
7 技術分享

{
8

for(int i=0;i<1000;i++)
9 技術分享

{
10

sql="insert into user(id,name) value(‘"+(i+1)+"‘,‘chenxinhan‘)";
11 技術分享

s.addBatch(sql);
12 技術分享

}
13

s.executeBatch();
14 技術分享

conn.commit();
15 技術分享

s.clearBatch();
16 技術分享

}
17

s.close();
18 技術分享

conn.close();
19 技術分享

long end=System.currentTimeMillis();
20 技術分享

System.out.println("batchInsert()執行時間為："+(end-start)+"ms");

輸出結果：
batchInsert()執行時間為：13625ms
對比分析：
按道理，這種批處理的方式是要快些的，但是測試結果卻不盡人意，有點不解，請高人拍磚。

五、批量插入：insert into tableName (x,xx,xxx) values(x,xx,xxx),(xx,xxx,xxxx)…,
代碼：

Connection conn=source.getConnection();
2 技術分享

conn.setAutoCommit(false);
3 技術分享

Statement s=conn.createStatement();
4 技術分享

StringBuilder sql=new StringBuilder("");
5 技術分享

long start=System.currentTimeMillis();
6 技術分享

for(int j=0;j<100;j++)
7 技術分享

{
8

sql=new StringBuilder("");
9 技術分享

sql.append("insert into user(id,name) values ");
10 技術分享

for(int i=0;i<1000;i++)
11 技術分享

{
12

if(i==999)
13 技術分享

sql.append("(‘").append(i+1).append("‘,").append("‘cxh‘)");
14 技術分享

else
15

sql.append("(‘").append(i+1).append("‘,").append("‘cxh‘),");
16 技術分享

}
17

s.execute(sql.toString());
18 技術分享

conn.commit();
19 技術分享

}
20

s.close();
21 技術分享

conn.close();
22 技術分享

long end=System.currentTimeMillis();
23 技術分享

System.out.println("manyInsert()執行時間為："+(end-start)+"ms");

輸出結果：
manyInsert()執行時間為：937ms
對比分析：
發現采用這種方式的批量插入性能提升最明顯，有10倍以上的性能提升。所以這種方式是我推薦的批量插入方式！

六、多線程插入
在第五種方式的基礎上采用多線程插入。
代碼：

final Connection conn=source.getConnection();
2 技術分享

for(int j=0;j<3;j++)
3 技術分享

{
4

Thread t=new Thread(){
5 技術分享

@Override
6 技術分享

public void run() {
7 技術分享

try
8

{
9

long start=System.currentTimeMillis();
10 技術分享

Statement s=conn.createStatement();
11 技術分享

StringBuilder sql=new StringBuilder("");
12 技術分享

for(int j=0;j<100;j++)
13 技術分享

{
14

conn.setAutoCommit(false);
15 技術分享

sql=new StringBuilder("");
16 技術分享

sql.append("insert into user (id,name) values ");
17 技術分享

for(int i=0;i<1000;i++)
18 技術分享

{
19

if(i==999)
20 技術分享

sql.append("(‘").append(i+1).append("‘,").append("‘cxh‘)");
21 技術分享

else
22

sql.append("(‘").append(i+1).append("‘,").append("‘cxh‘),");
23 技術分享

}
24

s.execute(sql.toString());
25 技術分享

conn.commit();
26 技術分享

}
27

s.close();
28 技術分享

long end=System.currentTimeMillis();
29 技術分享

System.out.println("multiThreadBatchInsert()執行時間為："+(end-start)+"ms");
30 技術分享

}
31

catch(Exception e)
32 技術分享

{
33

e.printStackTrace();
34 技術分享

}
35

}
36

};
37

t.start();
38 技術分享

//t.join();
39 技術分享

}

輸出結果：
multiThreadBatchInsert()執行時間為：2437ms
multiThreadBatchInsert()執行時間為：2625ms
multiThreadBatchInsert()執行時間為：2703ms

註意：上面我采用的是三個線程插入30w條數據。
取最大時間為2703ms，較上面的937ms，基本還是三倍的時間。
所以發現此時多線程也解決不了批量數據插入問題。原因就是，這時候的性能瓶頸不是CPU，而是數據庫！

七、InnoDB引擎和MyISAM引擎的比較
最後，分析一下，這兩個引擎對批量數據插入的影響。
先建立user2數據表：

CREATE TABLE `user2` (

`id` varchar(50) NOT NULL,

`seqid` bigint(20) NOT NULL auto_increment,

`name` varchar(50) NOT NULL,

PRIMARY KEY (`seqid`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

代碼：

Connection conn=source.getConnection();
2 技術分享

conn.setAutoCommit(false);
3 技術分享

Statement s=conn.createStatement();
4 技術分享

StringBuilder sql=new StringBuilder("");
5 技術分享

long start=System.currentTimeMillis();
6 技術分享

for(int j=0;j<100;j++)
7 技術分享

{
8

sql=new StringBuilder("");
9 技術分享

sql.append("insert into user2 (id,name) values ");
10 技術分享

for(int i=0;i<1000;i++)
11 技術分享

{
12

if(i==999)
13 技術分享

sql.append("(‘").append(i+1).append("‘,").append("‘cxh‘)");
14 技術分享

else
15

sql.append("(‘").append(i+1).append("‘,").append("‘cxh‘),");
16 技術分享

}
17

s.execute(sql.toString());
18 技術分享

conn.commit();
19 技術分享

}
20

s.close();
21 技術分享

conn.close();
22 技術分享

long end=System.currentTimeMillis();
23 技術分享

System.out.println("manyInsert2()執行時間為："+(end-start)+"ms");

輸出結果：
manyInsert2()執行時間為：3484ms
註意：第七項的代碼和第五是一樣的，除了數據表名稱不同（user、user2）
但是，
InnoDB ：3484ms
MyISAM：937ms
所以，MyISAM引擎對大數據量的插入性能較好。

總結：
對於大數據量的插入，建議使用insert into tableName (x,xx,xxx) values(x,xx,xxx),(xx,xxx,xxxx)…,的方式，引擎建議使用MyISAM引擎。
友情提醒：本博文章歡迎轉載，但請註明出處：陳新漢

數據庫批量數據插入問題分析

== 5.0 性能以及 mon 基礎 use 插入 light 在數據庫的相關開發中，經常會遇到數據的批量插入問題。本文主要是通過實驗的方式探討批量數據插入的瓶頸，以及優化建議。以10w條記錄的插入作為實驗對象，采用下面的幾種方法插入： 1. 普通插入：普通

數據庫批量數據插入問題分析

數據庫批量數據插入問題分析

Oracle數據庫批量數據導出工具開發

JSP 插入到數據庫的數據出現 “SQLServerException: 將截斷字符串或二進制數據” 錯誤解決方案

【轉】 WordPress數據庫及各表結構分析

學習筆記sql server數據庫批量查詢和刪除內容執行語句

金蝶KIS&K3助記碼SQL數據庫批量刷新

數據庫批量操作的一些文章

MySQL 數據庫的高可用性分析

簡單地從數據庫查詢數據使用poi插入創建Excel

數據庫索引數據結構分析

2019/1/15 批量刪除數據庫相關數據

Delphi ADOQuery連接數據庫的查詢、插入、刪除、修改

JDBC Insert語句插入Oracle數據庫返回數據主鍵

WordPress數據庫及各表結構分析

使用PowerShell從RDB數據庫批量恢復用戶郵箱

數據庫批量之 Oracle

數據庫設計之數據庫，數據表和字段等的命名總結

數據庫、數據表建立索引的原則

學習Angularjs向數據庫添加數據

mysql數據庫函數 concat 字段類型轉化、字段拼接

數據庫批量數據插入問題分析

相關推薦