1. 程式人生 > >最全MySQL面試題和答案

最全MySQL面試題和答案

Mysql 的儲存引擎,myisam和innodb的區別。

答:

1.MyISAM 是非事務的儲存引擎,適合用於頻繁查詢的應用。表鎖,不會出現死鎖,適合小資料,小併發。

2.innodb是支援事務的儲存引擎,合於插入和更新操作比較多的應用,設計合理的話是行鎖(最大區別就在鎖的級別上),適合大資料,大併發。

資料表型別有哪些

       答:MyISAM、InnoDB、HEAP、BOB,ARCHIVE,CSV等。
       MyISAM:成熟、穩定、易於管理,快速讀取。一些功能不支援(事務等),表級鎖。
       InnoDB:支援事務、外來鍵等特性、資料行鎖定。空間佔用大,不支援全文索引等。

MySQL資料庫作釋出系統的儲存,一天五萬條以上的增量,預計運維三年,怎麼優化?

a. 設計良好的資料庫結構,允許部分資料冗餘,儘量避免join查詢,提高效率。
b. 選擇合適的表字段資料型別和儲存引擎,適當的新增索引。
c. mysql庫主從讀寫分離。
d. 找規律分表,減少單表中的資料量提高查詢速度。
e。新增快取機制,比如memcached,apc等。
f. 不經常改動的頁面,生成靜態頁面。
g. 書寫高效率的SQL。比如 SELECT * FROM TABEL 改為 SELECT field_1, field_2, field_3 FROM TABLE.

對於大流量的網站,您採用什麼樣的方法來解決各頁面訪問量統計問題?

答:a. 確認伺服器是否能支撐當前訪問量。
b. 優化資料庫訪問。
c. 禁止外部訪問連結(盜鏈), 比如圖片盜鏈。
d. 控制檔案下載。
e. 使用不同主機分流。
f. 使用瀏覽統計軟體,瞭解訪問量,有針對性的進行優化。

如何進行SQL優化?

答:
(1)選擇正確的儲存引擎
以 MySQL為例,包括有兩個儲存引擎 MyISAM 和 InnoDB,每個引擎都有利有弊。
MyISAM 適合於一些需要大量查詢的應用,但其對於有大量寫操作並不是很好。甚至你只是需要update一個欄位,整個表都會被鎖起來,而別的程序,就算是讀程序都無法操作直到讀操作完成。另外,MyISAM 對於 SELECT COUNT(*) 這類的計算是超快無比的。

InnoDB 的趨勢會是一個非常複雜的儲存引擎,對於一些小的應用,它會比 MyISAM 還慢。但是它支援“行鎖” ,於是在寫操作比較多的時候,會更優秀。並且,他還支援更多的高階應用,比如:事務。

 

(2)優化欄位的資料型別

記住一個原則,越小的列會越快。如果一個表只會有幾列罷了(比如說字典表,配置表),那麼,我們就沒有理由使用 INT 來做主鍵,使用 MEDIUMINT, SMALLINT 或是更小的 TINYINT 會更經濟一些。如果你不需要記錄時間,使用 DATE 要比 DATETIME 好得多。當然,你也需要留夠足夠的擴充套件空間。

 

(3)為搜尋欄位新增索引

索引並不一定就是給主鍵或是唯一的欄位。如果在你的表中,有某個欄位你總要會經常用來做搜尋,那麼最好是為其建立索引,除非你要搜尋的欄位是大的文字欄位,那應該建立全文索引。

 

(4)避免使用Select *從資料庫裡讀出越多的資料,那麼查詢就會變得越慢。並且,如果你的資料庫伺服器和WEB伺服器是兩臺獨立的伺服器的話,這還會增加網路傳輸的負載。即使你要查詢資料表的所有欄位,也儘量不要用*萬用字元,善用內建提供的欄位排除定義也許能給帶來更多的便利。

 

(5)使用 ENUM 而不是 VARCHAR

ENUM 型別是非常快和緊湊的。在實際上,其儲存的是 TINYINT,但其外表上顯示為字串。這樣一來,用這個欄位來做一些選項列表變得相當的完美。例如,性別、民族、部門和狀態之類的這些欄位的取值是有限而且固定的,那麼,你應該使用 ENUM 而不是 VARCHAR。

 

(6)儘可能的使用 NOT NULL

除非你有一個很特別的原因去使用 NULL 值,你應該總是讓你的欄位保持 NOT NULL。 NULL其實需要額外的空間,並且,在你進行比較的時候,你的程式會更復雜。 當然,這裡並不是說你就不能使用NULL了,現實情況是很複雜的,依然會有些情況下,你需要使用NULL值。

 

(7)固定長度的表會更快

如果表中的所有欄位都是“固定長度”的,整個表會被認為是 “static” 或 “fixed-length”。 例如,表中沒有如下型別的欄位: VARCHAR,TEXT,BLOB。只要你包括了其中一個這些欄位,那麼這個表就不是“固定長度靜態表”了,這樣,MySQL 引擎會用另一種方法來處理。

 

固定長度的表會提高效能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個資料的偏移量的,所以讀取的自然也會很快。而如果欄位不是定長的,那麼,每一次要找下一條的話,需要程式找到主鍵。

 

並且,固定長度的表也更容易被快取和重建。不過,唯一的副作用是,固定長度的欄位會浪費一些空間,因為定長的欄位無論你用不用,他都是要分配那麼多的空間。

 

如何設計一個高併發的系統

① 資料庫的優化,包括合理的事務隔離級別、SQL語句優化、索引的優化

② 使用快取,儘量減少資料庫 IO

③ 分散式資料庫、分散式快取

④ 伺服器的負載均衡

鎖的優化策略

① 讀寫分離

② 分段加鎖

③ 減少鎖持有的時間

④ 多個執行緒儘量以相同的順序去獲取資源

等等,這些都不是絕對原則,都要根據情況,比如不能將鎖的粒度過於細化,不然可能會出現執行緒的加鎖和釋放次數過多,反而效率不如一次加一把大鎖。這部分跟面試官談了很久

索引的底層實現原理和優化

B+樹,經過優化的B+樹

主要是在所有的葉子結點中增加了指向下一個葉子節點的指標,因此InnoDB建議為大部分表使用預設自增的主鍵作為主索引。

 什麼情況下設定了索引但無法使用 

① 以“%”開頭的LIKE語句,模糊匹配

② OR語句前後沒有同時使用索引

③ 資料型別出現隱式轉化(如varchar不加單引號的話可能會自動轉換為int型)

SQL語句的優化 

order by要怎麼處理

alter儘量將多次合併為一次

insert和delete也需要合併

等等

實踐中如何優化MySQL

我當時是按以下四條依次回答的,他們四條從效果上第一條影響最大,後面越來越小。

① SQL語句及索引的優化

② 資料庫表結構的優化

③ 系統配置的優化

④ 硬體的優化

sql注入的主要特點

變種極多,攻擊簡單,危害極大

sql注入的主要危害

未經授權操作資料庫的資料

惡意纂改網頁

私自新增系統賬號或者是資料庫使用者賬號

網頁掛木馬

優化資料庫的方法

  1.  選取最適用的欄位屬性,儘可能減少定義欄位寬度,儘量把欄位設定NOTNULL,例如’省份’、’性別’最好適用ENUM
  2.  使用連線(JOIN)來代替子查詢
  3.  適用聯合(UNION)來代替手動建立的臨時表
  4.  事務處理
  5.  鎖定表、優化事務處理
  6.  適用外來鍵,優化鎖定表
  7.  建立索引
  8.  優化查詢語句

 

簡單描述mysql中,索引,主鍵,唯一索引,聯合索引的區別,對資料庫的效能有什麼影響(從讀寫兩方面)

索引是一種特殊的檔案(InnoDB資料表上的索引是表空間的一個組成部分),它們包含著對資料表裡所有記錄的引用指標。

普通索引(由關鍵字KEY或INDEX定義的索引)的唯一任務是加快對資料的訪問速度。

 

普通索引允許被索引的資料列包含重複的值。如果能確定某個資料列將只包含彼此各不相同的值,在為這個資料列建立索引的時候就應該用關鍵字UNIQUE把它定義為一個唯一索引。也就是說,唯一索引可以保證資料記錄的唯一性。

 

主鍵,是一種特殊的唯一索引,在一張表中只能定義一個主鍵索引,主鍵用於唯一標識一條記錄,使用關鍵字 PRIMARY KEY 來建立。

索引可以覆蓋多個數據列,如像INDEX(columnA, columnB)索引,這就是聯合索引。

 

索引可以極大的提高資料的查詢速度,但是會降低插入、刪除、更新表的速度,因為在執行這些寫操作時,還要操作索引檔案。

資料庫中的事務是什麼?

事務(transaction)是作為一個單元的一組有序的資料庫操作。如果組中的所有操作都成功,則認為事務成功,即使只有一個操作失敗,事務也不成功。如果所有操作完成,事務則提交,其修改將作用於所有其他資料庫程序。如果一個操作失敗,則事務將回滾,該事務所有操作的影響都將取消。ACID 四大特性,原子性、隔離性、一致性、永續性。

瞭解XSS攻擊嗎?如何防止?

XSS是跨站指令碼攻擊,首先是利用跨站指令碼漏洞以一個特權模式去執行攻擊者構造的指令碼,然後利用不安全的Activex控制元件執行惡意的行為。
使用htmlspecialchars()函式對提交的內容進行過濾,使字串裡面的特殊符號實體化。

SQL注入漏洞產生的原因?如何防止?

SQL注入產生的原因:程式開發過程中不注意規範書寫sql語句和對特殊字元進行過濾,導致客戶端可以通過全域性變數POST和GET提交一些sql語句正常執行。

防止SQL注入的方式:
開啟配置檔案中的magic_quotes_gpc 和 magic_quotes_runtime設定

執行sql語句時使用addslashes進行sql語句轉換

Sql語句書寫儘量不要省略雙引號和單引號。

過濾掉sql語句中的一些關鍵詞:update、insert、delete、select、 * 。

提高資料庫表和欄位的命名技巧,對一些重要的欄位根據程式的特點命名,取不易被猜到的。

Php配置檔案中設定register_globals為off,關閉全域性變數註冊

控制錯誤資訊,不要在瀏覽器上輸出錯誤資訊,將錯誤資訊寫到日誌檔案中。

 

 

為表中得欄位選擇合適得資料型別(物理設計)

 欄位型別優先順序: 整形>date,time>enum,char>varchar>blob,text
 優先考慮數字型別,其次是日期或者二進位制型別,最後是字串型別,同級別得資料型別,應該優先選擇佔用空間小的資料型別

儲存時期

Datatime:以 YYYY-MM-DD HH:MM:SS 格式儲存時期時間,精確到秒,佔用8個位元組得儲存空間,datatime型別與時區無關
Timestamp:以時間戳格式儲存,佔用4個位元組,範圍小1970-1-1到2038-1-19,顯示依賴於所指定得時區,預設在第一個列行的資料修改時可以自動得修改timestamp列得值
Date:(生日)佔用得位元組數比使用字串.datatime.int儲存要少,使用date只需要3個位元組,儲存日期月份,還可以利用日期時間函式進行日期間得計算
Time:儲存時間部分得資料
注意:不要使用字串型別來儲存日期時間資料(通常比字串佔用得儲存空間小,在進行查詢過濾可以利用日期得函式)
使用int儲存日期時間不如使用timestamp型別

 

對於關係型資料庫而言,索引是相當重要的概念,請回答有關索引的幾個問題:

a)、索引的目的是什麼?
快速訪問資料表中的特定資訊,提高檢索速度

建立唯一性索引,保證資料庫表中每一行資料的唯一性。

加速表和表之間的連線

使用分組和排序子句進行資料檢索時,可以顯著減少查詢中分組和排序的時間

b)、索引對資料庫系統的負面影響是什麼?
負面影響:
建立索引和維護索引需要耗費時間,這個時間隨著資料量的增加而增加;索引需要佔用物理空間,不光是表需要佔用資料空間,每個索引也需要佔用物理空間;當對錶進行增、刪、改、的時候索引也要動態維護,這樣就降低了資料的維護速度。

c)、為資料表建立索引的原則有哪些?
在最頻繁使用的、用以縮小查詢範圍的欄位上建立索引。

在頻繁使用的、需要排序的欄位上建立索引

d)、 什麼情況下不宜建立索引?
對於查詢中很少涉及的列或者重複值比較多的列,不宜建立索引。

對於一些特殊的資料型別,不宜建立索引,比如文字欄位(text)等

 簡述在MySQL資料庫中MyISAM和InnoDB的區別

區別於其他資料庫的最重要的特點就是其外掛式的表儲存引擎。切記:儲存引擎是基於表的,而不是資料庫。

InnoDB與MyISAM的區別:

InnoDB儲存引擎: 主要面向OLTP(Online Transaction Processing,線上事務處理)方面的應用,是第一個完整支援ACID事務的儲存引擎(BDB第一個支援事務的儲存引擎,已經停止開發)。

特點:

· 行鎖設計、支援外來鍵,支援事務,支援併發,鎖粒度是支援mvcc得行級鎖;

 MyISAM儲存引擎: 是MySQL官方提供的儲存引擎,主要面向OLAP(Online Analytical Processing,線上分析處理)方面的應用。
特點:

不支援事務,鎖粒度是支援併發插入得表級鎖,支援表所和全文索引。操作速度快,不能讀寫操作太頻繁;

 解釋MySQL外連線、內連線與自連線的區別

先說什麼是交叉連線: 交叉連線又叫笛卡爾積,它是指不使用任何條件,直接將一個表的所有記錄和另一個表中的所有記錄一一匹配。

內連線 則是隻有條件的交叉連線,根據某個條件篩選出符合條件的記錄,不符合條件的記錄不會出現在結果集中,即內連線只連線匹配的行。
外連線 其結果集中不僅包含符合連線條件的行,而且還會包括左表、右表或兩個表中
的所有資料行,這三種情況依次稱之為左外連線,右外連線,和全外連線。

左外連線,也稱左連線,左表為主表,左表中的所有記錄都會出現在結果集中,對於那些在右表中並沒有匹配的記錄,仍然要顯示,右邊對應的那些欄位值以NULL來填充。右外連線,也稱右連線,右表為主表,右表中的所有記錄都會出現在結果集中。左連線和右連線可以互換,MySQL目前還不支援全外連線。

寫出三種以上MySQL資料庫儲存引擎的名稱(提示:不區分大小寫)

MyISAM、InnoDB、BDB(BerkeleyDB)、Merge、Memory(Heap)、Example、Federated、
Archive、CSV、Blackhole、MaxDB 等等十幾個引擎

Myql中的事務回滾機制概述

事務是使用者定義的一個數據庫操作序列,這些操作要麼全做要麼全不做,是一個不可分割的工作單位,事務回滾是指將該事務已經完成的對資料庫的更新操作撤銷。

要同時修改資料庫中兩個不同表時,如果它們不是一個事務的話,當第一個表修改完,可能第二個表修改過程中出現了異常而沒能修改,此時就只有第二個表依舊是未修改之前的狀態,而第一個表已經被修改完畢。而當你把它們設定為一個事務的時候,當第一個表修改完,第二表修改出現異常而沒能修改,第一個表和第二個表都要回到未修改的狀態,這就是所謂的事務回滾

 

SQL語言包括哪幾部分?每部分都有哪些操作關鍵字?

答:SQL語言包括資料定義(DDL)、資料操縱(DML),資料控制(DCL)和資料查詢(DQL)四個部分。

資料定義:Create Table,Alter Table,Drop Table, Craete/Drop Index等

資料操縱:Select ,insert,update,delete,

資料控制:grant,revoke

資料查詢:select

 

完整性約束包括哪些?


答:資料完整性(Data Integrity)是指資料的精確(Accuracy)和可靠性(Reliability)。

分為以下四類:

1) 實體完整性:規定表的每一行在表中是惟一的實體。

2) 域完整性:是指表中的列必須滿足某種特定的資料型別約束,其中約束又包括取值範圍、精度等規定。

3) 參照完整性:是指兩個表的主關鍵字和外關鍵字的資料應一致,保證了表之間的資料的一致性,防止了資料丟失或無意義的資料在資料庫中擴散。

4) 使用者定義的完整性:不同的關係資料庫系統根據其應用環境的不同,往往還需要一些特殊的約束條件。使用者定義的完整性即是針對某個特定關係資料庫的約束條件,它反映某一具體應用必須滿足的語義要求。

與表有關的約束:包括列約束(NOT NULL(非空約束))和表約束(PRIMARY KEY、foreign key、check、UNIQUE) 。

 

什麼是事務?及其特性?


答:事務:是一系列的資料庫操作,是資料庫應用的基本邏輯單位。

事務特性:

(1)原子性:即不可分割性,事務要麼全部被執行,要麼就全部不被執行。

(2)一致性或可串性。事務的執行使得資料庫從一種正確狀態轉換成另一種正確狀態

(3)隔離性。在事務正確提交之前,不允許把該事務對資料的任何改變提供給任何其他事務,

(4) 永續性。事務正確提交後,其結果將永久儲存在資料庫中,即使在事務提交後有了其他故障,事務的處理結果也會得到儲存。

或者這樣理解:

事務就是被繫結在一起作為一個邏輯工作單元的SQL語句分組,如果任何一個語句操作失敗那麼整個操作就被失敗,以後操作就會回滾到操作前狀態,或者是上有個節點。為了確保要麼執行,要麼不執行,就可以使用事務。要將有組語句作為事務考慮,就需要通過ACID測試,即原子性,一致性,隔離性和永續性。

 

什麼是鎖?


  答:資料庫是一個多使用者使用的共享資源。當多個使用者併發地存取資料時,在資料庫中就會產生多個事務同時存取同一資料的情況。若對併發操作不加控制就可能會讀取和儲存不正確的資料,破壞資料庫的一致性。

加鎖是實現資料庫併發控制的一個非常重要的技術。當事務在對某個資料物件進行操作前,先向系統發出請求,對其加鎖。加鎖後事務就對該資料物件有了一定的控制,在該事務釋放鎖之前,其他的事務不能對此資料物件進行更新操作。

基本鎖型別:鎖包括行級鎖和表級鎖

 

什麼叫檢視?遊標是什麼?


答:檢視是一種虛擬的表,具有和物理表相同的功能。可以對檢視進行增,改,查,操作,檢視通常是有一個表或者多個表的行或列的子集。對檢視的修改不影響基本表。它使得我們獲取資料更容易,相比多表查詢。

  遊標:是對查詢出來的結果集作為一個單元來有效的處理。遊標可以定在該單元中的特定行,從結果集的當前行檢索一行或多行。可以對結果集當前行做修改。一般不使用遊標,但是需要逐條處理資料的時候,遊標顯得十分重要。

 

什麼是儲存過程?用什麼來呼叫?


答:儲存過程是一個預編譯的SQL語句,優點是允許模組化的設計,就是說只需建立一次,以後在該程式中就可以呼叫多次。如果某次操作需要執行多次SQL,使用儲存過程比單純SQL語句執行要快。可以用一個命令物件來呼叫儲存過程。

 

索引的作用?和它的優點缺點是什麼?


答:索引就一種特殊的查詢表,資料庫的搜尋引擎可以利用它加速對資料的檢索。它很類似與現實生活中書的目錄,不需要查詢整本書內容就可以找到想要的資料。索引可以是唯一的,建立索引允許指定單個列或者是多個列。缺點是它減慢了資料錄入的速度,同時也增加了資料庫的尺寸大小。

 

如何通俗地理解三個正規化?  


答:第一正規化:1NF是對屬性的原子性約束,要求屬性具有原子性,不可再分解;

第二正規化:2NF是對記錄的惟一性約束,要求記錄有惟一標識,即實體的惟一性;  

第三正規化:3NF是對欄位冗餘性的約束,即任何欄位不能由其他欄位派生出來,它要求欄位沒有冗餘。。

正規化化設計優缺點:

優點:

可以儘量得減少資料冗餘,使得更新快,體積小

缺點:對於查詢需要多個表進行關聯,減少寫得效率增加讀得效率,更難進行索引優化

反正規化化:

優點:可以減少表得關聯,可以更好得進行索引優化

缺點:資料冗餘以及資料異常,資料得修改需要更多的成本

 

什麼是基本表?什麼是檢視?


答:基本表是本身獨立存在的表,在 SQL 中一個關係就對應一個表。  檢視是從一個或幾個基本表匯出的表。檢視本身不獨立儲存在資料庫中,是一個虛表  

 

試述檢視的優點?


答:(1) 檢視能夠簡化使用者的操作  (2) 檢視使使用者能以多種角度看待同一資料; (3) 檢視為資料庫提供了一定程度的邏輯獨立性; (4) 檢視能夠對機密資料提供安全保護。

 

 NULL是什麼意思


答:NULL這個值表示UNKNOWN(未知):它不表示“”(空字串)。對NULL這個值的任何比較都會生產一個NULL值。您不能把任何值與一個 NULL值進行比較,並在邏輯上希望獲得一個答案。

使用IS  NULL來進行NULL判斷

 

主鍵、外來鍵和索引的區別?


主鍵、外來鍵和索引的區別

定義:

 主鍵–唯一標識一條記錄,不能有重複的,不允許為空

 外來鍵–表的外來鍵是另一表的主鍵, 外來鍵可以有重複的, 可以是空值

 索引–該欄位沒有重複值,但可以有一個空值

作用:

 主鍵–用來保證資料完整性

 外來鍵–用來和其他表建立聯絡用的

 索引–是提高查詢排序的速度

個數:

 主鍵–主鍵只能有一個

 外來鍵–一個表可以有多個外來鍵

 索引–一個表可以有多個唯一索引

 

你可以用什麼來確保表格裡的欄位只接受特定範圍裡的值?


答:Check限制,它在資料庫表格裡被定義,用來限制輸入該列的值。

觸發器也可以被用來限制資料庫表格裡的欄位能夠接受的值,但是這種辦法要求觸發器在表格裡被定義,這可能會在某些情況下影響到效能。

 

說說對SQL語句優化有哪些方法?(選擇幾條)


(1)Where子句中:where表之間的連線必須寫在其他Where條件之前,那些可以過濾掉最大數量記錄的條件必須寫在Where子句的末尾.HAVING最後。

(2)用EXISTS替代IN、用NOT EXISTS替代NOT IN。

(3) 避免在索引列上使用計算

(4)避免在索引列上使用IS NULL和IS NOT NULL

(5)對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。

(6)應儘量避免在 where 子句中對欄位進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描

(7)應儘量避免在 where 子句中對欄位進行表示式操作,這將導致引擎放棄使用索引而進行全表掃描

 

SQL語句中‘相關子查詢’與‘非相關子查詢’有什麼區別?


答:子查詢:巢狀在其他查詢中的查詢稱之。

子查詢又稱內部,而包含子查詢的語句稱之外部查詢(又稱主查詢)。

所有的子查詢可以分為兩類,即相關子查詢和非相關子查詢

(1)非相關子查詢是獨立於外部查詢的子查詢,子查詢總共執行一次,執行完畢後將值傳遞給外部查詢。

(2)相關子查詢的執行依賴於外部查詢的資料,外部查詢執行一行,子查詢就執行一次。

故非相關子查詢比相關子查詢效率高

 

char和varchar的區別?


答:是一種固定長度的型別,varchar則是一種可變長度的型別,它們的區別是:  

char(M)型別的資料列裡,每個值都佔用M個位元組,如果某個長度小於M,MySQL就會在它的右邊用空格字元補足.(在檢索操作中那些填補出來的空格字元將被去掉)在varchar(M)型別的資料列裡,每個值只佔用剛好夠用的位元組再加上一個用來記錄其長度的位元組(即總長度為L+1位元組).  

varchar得適用場景:

字串列得最大長度比平均長度大很多 2.字串很少被更新,容易產生儲存碎片 3.使用多位元組字符集儲存字串

Char得場景:

    儲存具有近似得長度(md5值,身份證,手機號),長度比較短小得字串(因為varchar需要額外空間記錄字串長度),更適合經常更新得字串,更新時不會出現頁分裂得情況,避免出現儲存碎片,獲得更好的io效能