1. 程式人生 > >MySQL效能優化的最佳經驗

MySQL效能優化的最佳經驗

今天,資料庫的操作越來越成為整個應用的效能瓶頸了,這點對於Web應用尤其明顯。關於資料庫的效能,這並不只是DBA才需要擔心的事,而這更是我們程式設計師需要去關注的事情。當我們去設計資料庫表結構,對操作資料庫時(尤其是查表時的SQL語句),我們都需要注意資料操作的效能。這裡,我們不會講過多的SQL語句的優化,而只是針對MySQL這一Web應用最多的資料庫。希望下面的這些優化技巧對你有用。

0. 為查詢快取優化你的查詢

大多數的MySQL伺服器都開啟了查詢快取。這是提高性最有效的方法之一,而且這是被MySQL的資料庫引擎處理的。當有很多相同的查詢被執行了多次的時候,這些查詢結果會被放到一個快取中,這樣,後續的相同的查詢就不用操作表而直接訪問快取結果了。

這裡最主要的問題是,對於程式設計師來說,這個事情是很容易被忽略的。因為,我們某些查詢語句會讓MySQL不使用快取。請看下面的示例:

MySQL
123456//查詢快取不開啟$r=mysql_query("SELECT username FROM user WHERE signup_date >= CURDATE()");//開啟查詢快取$today=date("Y-m-d");$r=mysql_query("SELECT username FROM user WHERE signup_date >= '$today'");

上面兩條SQL語句的差別就是 CURDATE() ,MySQL的查詢快取對這個函式不起作用。所以,像 NOW() 和 RAND() 或是其它的諸如此類的SQL函式都不會開啟查詢快取,因為這些函式的返回是會不定的易變的。所以,你所需要的就是用一個變數來代替MySQL的函式,從而開啟快取。

1. EXPLAIN 你的 SELECT 查詢

使用 EXPLAIN 關鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫你分析你的查詢語句或是表結構的效能瓶頸。

EXPLAIN 的查詢結果還會告訴你你的索引主鍵被如何利用的,你的資料表是如何被搜尋和排序的……等等,等等。

挑一個你的SELECT語句(推薦挑選那個最複雜的,有多表聯接的),把關鍵字EXPLAIN加到前面。你可以使用phpmyadmin來做這個事。然後,你會看到一張表格。下面的這個示例中,我們忘記加上了group_id索引,並且有表聯接:

當我們為 group_id 欄位加上索引後:

我們可以看到,前一個結果顯示搜尋了 7883 行,而後一個只是搜尋了兩個表的 9 和 16 行。檢視rows列可以讓我們找到潛在的效能問題。

2. 當只要一行資料時使用 LIMIT 1

當你查詢表的有些時候,你已經知道結果只會有一條結果,但因為你可能需要去fetch遊標,或是你也許會去檢查返回的記錄數。

在這種情況下,加上 LIMIT 1 可以增加效能。這樣一樣,MySQL資料庫引擎會在找到一條資料後停止搜尋,而不是繼續往後查少下一條符合記錄的資料。

下面的示例,只是為了找一下是否有“中國”的使用者,很明顯,後面的會比前面的更有效率。(請注意,第一條中是Select *,第二條是Select 1)

MySQL
1 2 3 4 5 6 7 8 9 10 11 //沒有效率的: $r=mysql_query("SELECT * FROM user WHERE country = 'China'"); if(mysql_num_rows($r)>0){ //... } //有效率的: $r=mysql_query("SELECT 1 FROM user WHERE country = 'China' LIMIT 1"); if(mysql_num_rows($r)>0){ //... }

3. 為搜尋欄位建索引

索引並不一定就是給主鍵或是唯一的欄位。如果在你的表中,有某個欄位你總要會經常用來做搜尋,那麼,請為其建立索引吧。

從上圖你可以看到那個搜尋字串 “last_name LIKE ‘a%’”,一個是建了索引,一個是沒有索引,效能差了4倍左右。

另外,你應該也需要知道什麼樣的搜尋是不能使用正常的索引的。例如,當你需要在一篇大的文章中搜索一個詞時,如: “WHERE post_content LIKE ‘%apple%’”,索引可能是沒有意義的。你可能需要使用MySQL全文索引 或是自己做一個索引(比如說:搜尋關鍵詞或是Tag什麼的)

4. 在Join表的時候使用相當型別的例,並將其索引

如果你的應用程式有很多 JOIN 查詢,你應該確認兩個表中Join的欄位是被建過索引的。這樣,MySQL內部會啟動為你優化Join的SQL語句的機制。

而且,這些被用來Join的欄位,應該是相同的型別的。例如:如果你要把 DECIMAL 欄位和一個 INT 欄位Join在一起,MySQL就無法使用它們的索引。對於那些STRING型別,還需要有相同的字符集才行。(兩個表的字符集有可能不一樣)

MySQL
123456//在state中查詢company$r=mysql_query("SELECT company_name FROM users    LEFT JOIN companies ON (users.state = companies.state)    WHERE users.id = $user_id");//兩個state欄位應該是被建過索引的,而且應該是相當的型別,相同的字符集。

5. 千萬不要 ORDER BY RAND()

想打亂返回的資料行?隨機挑一個數據?真不知道誰發明了這種用法,但很多新手很喜歡這樣用。但你確不瞭解這樣做有多麼可怕的效能問題。

如果你真的想把返回的資料行打亂了,你有N種方法可以達到這個目的。這樣使用只讓你的資料庫的效能呈指數級的下降。這裡的問題是:MySQL會不得不去執行RAND()函式(很耗CPU時間),而且這是為了每一行記錄去記行,然後再對其排序。就算是你用了Limit 1也無濟於事(因為要排序)

下面的示例是隨機挑一條記錄

MySQL
1 2 3 4 5 6 7 8 9 //千萬不要這樣做: $r=mysql_query("SELECT username FROM user ORDER BY RAND() LIMIT 1"); //這要會更好: $r=mysql_query("SELECT count(*) FROM user"); $d=mysql_fetch_row($r); $rand=mt_rand(0,$d[0]-1); $r=mysql_query("SELECT username FROM user LIMIT $rand, 1");

6. 避免 SELECT *

從資料庫裡讀出越多的資料,那麼查詢就會變得越慢。並且,如果你的資料庫伺服器和WEB伺服器是兩臺獨立的伺服器的話,這還會增加網路傳輸的負載。

所以,你應該養成一個需要什麼就取什麼的好的習慣。

MySQL
123456789