1. 程式人生 > >數學建模四大模型總結

數學建模四大模型總結

文章作者吳翔

1        優化模型

1.1   數學規劃模型

線性規劃、整數線性規劃、非線性規劃、多目標規劃、動態規劃。

1.2   微分方程組模型

阻滯增長模型、SARS傳播模型。

1.3   圖論與網路優化問題

最短路徑問題、網路最大流問題、最小費用最大流問題、最小生成樹問題(MST)、旅行商問題(TSP)、圖的著色問題。

1.4   概率模型

決策模型、隨機儲存模型、隨機人口模型、報童問題、Markov鏈模型。

1.5   組合優化經典問題

l  多維揹包問題(MKP)

揹包問題:個物品,對物品,體積為,揹包容量為。如何將盡可能多的物品裝入揹包。

多維揹包問題:個物品,對物品,價值為,體積為,揹包容量為。如何選取物品裝入揹包,是揹包中物品的總價值最大。

多維揹包問題在實際中的應用有:資源分配、貨物裝載和儲存分配等問題。該問題屬於難問題。

l  二維指派問題(QAP)

工作指派問題:個工作可以由個工人分別完成。工人完成工作的時間為。如何安排使總工作時間最小。

二維指派問題(常以機器佈局問題為例):臺機器要佈置在個地方,機器與之間的物流量為,位置與之間的距離為,如何佈置使費用最小。

二維指派問題在實際中的應用有:校園建築物的佈局、醫院科室的安排、成組技術中加工中心的組成問題等。

l  旅行商問題(TSP)

旅行商問題:有個城市,城市與之間的距離為,找一條經過個城市的巡迴(每個城市經過且只經過一次,最後回到出發點),使得總路程最小。

l  車輛路徑問題(VRP)

車輛路徑問題(也稱車輛計劃):已知個客戶的位置座標和貨物需求,在可供使用車輛數量及運載能力條件的約束下,每輛車都從起點出發,完成若干客戶點的運送任務後再回到起點,要求以最少的車輛數、最小的車輛總行程完成貨物的派送任務。

TSP問題是VRP問題的特例。

l  車間作業排程問題(JSP)

車間排程問題:存在個工作和臺機器,每個工作由一系列操作組成,操作的執行次序遵循嚴格的序列順序,在特定的時間每個操作需要一臺特定的機器完成,每臺機器在同一時刻不能同時完成不同的工作,同一時刻同一工作的各個操作不能併發執行。如何求得從第一個操作開始到最後一個操作結束的最小時間間隔。

2        分類模型

判別分析是在已知研究物件分成若干型別並已經取得各種型別的一批已知樣本的觀測資料,在此基礎上根據某些準則建立判別式,然後對未知型別的樣品進行判別分析。

聚類分析則是給定的一批樣品,要劃分的型別實現並不知道,正需要通過局內分析來給以確定型別的。

2.1   判別分析

l  距離判別法

基本思想:首先根據已知分類的資料,分別計算各類的重心即分組(類)的均值,判別準則是對任給的一次觀測,若它與第類的重心距離最近,就認為它來自第類。

至於距離的測定,可以根據實際需要採用歐氏距離、馬氏距離、明科夫距離等。

l  Fisher判別法

基本思想:從兩個總體中抽取具有個指標的樣品觀測資料,藉助方差分析的思想構造一個判別函式或稱判別式。其中係數確定的原則是使兩組間的區別最大,而使每個組內部的離差最小。

對於一個新的樣品,將它的p個指標值代人判別式中求出 y 值,然後與判別臨界值(或稱分界點(後面給出)進行比較,就可以判別它應屬於哪一個總體。在兩個總體先驗概率相等的假設下,判別臨界值一般取:

最後,用統計量來檢驗判別效果,若則認為判別有效,否則判別無效。

以上描述的是兩總體判別,至於多總體判別方法則需要加以擴充套件。

Fisher判別法隨著總體數的增加,建立的判別式也增加,因而計算比較複雜。

l  Bayes判別法

基本思想:假定對所研究的物件有一定的認識,即假設個總體中,第個總體的先驗概率為,概率密度函式為。利用bayes公式計算觀測樣品來自第個總體的後驗概率,當時,將樣本判為總體。

l  逐步判別法

基本思想與逐步迴歸法類似,採用“有進有出”的演算法,逐步引入變數,每次引入一個變數進入判別式,則同時考慮在較早引入判別式的某些作用不顯著的變數剔除出去。

2.2   聚類分析

聚類分析是一種無監督的分類方法,即不預先指定類別。

根據分類物件不同,聚類分析可以分為樣本聚類(Q型)和變數聚類(R型)。樣本聚類是針對觀測樣本進行分類,而變數聚類則是試圖找出彼此獨立且有代表性的自變數,而又不丟失大部分資訊。變數聚類是一種降維的方法。

l  系統聚類法(分層聚類法)

基本思想:開始將每個樣本自成一類;然後求兩兩之間的距離,將距離最近的兩類合成一類;如此重複,直到所有樣本都合為一類為止。

適用範圍:既適用於樣本聚類,也適用於變數聚類。並且距離分類準則和距離計算方法都有多種,可以依據具體情形選擇。

l  快速聚類法(K-均值聚類法)

基本思想:按照指定分類數目,選擇個初始聚類中心;計算每個觀測量(樣本)到各個聚類中心的距離,按照就近原則將其分別分到放入各類中;重新計算聚類中心,繼續以上步驟;滿足停止條件時(如最大迭代次數等)則停止。

使用範圍:要求使用者給定分類數目,只適用於樣本聚類(Q型),不適用於變數聚類(R型)。

l  兩步聚類法(智慧聚類方法)

基本思想:先進行預聚類,然後再進行正式聚類。

適用範圍:屬於智慧聚類方法,用於解決海量資料或者具有複雜類別結構的聚類分析問題。可以同時處理離散和連續變數,自動選擇聚類數,可以處理超大樣本量的資料。

l  模糊聚類分析

l  與遺傳演算法、神經網路或灰色理論聯合的聚類方法

2.3   神經網路分類方法

3        評價模型

3.1   層次分析法(AHP)

基本思想:是定性與定量相結合的多準則決策、評價方法。將決策的有關元素分解成目標層、準則層和方案層,並通過人們的判斷對決策方案的優劣進行排序,在此基礎上進行定性和定量分析。它把人的思維過程層次化、數量化,並用數學為分析、決策、評價、預報和控制提供定量的依據。

基本步驟:構建層次結構模型;構建成對比較矩陣;層次單排序及一致性檢驗(即判斷主觀構建的成對比較矩陣在整體上是否有較好的一致性);層次總排序及一致性檢驗(檢驗層次之間的一致性)。

優點:它完全依靠主觀評價做出方案的優劣排序,所需資料量少,決策花費的時間很短。從整體上看,AHP在複雜決策過程中引入定量分析,並充分利用決策者在兩兩比較中給出的偏好資訊進行分析與決策支援,既有效地吸收了定性分析的結果,又發揮了定量分析的優勢,從而使決策過程具有很強的條理性和科學性,特別適合在社會經濟系統的決策分析中使用。

缺點:用AHP進行決策主觀成分很大。當決策者的判斷過多地受其主觀偏好影響,而產生某種對客觀規律的歪曲時,AHP的結果顯然就靠不住了。

適用範圍:尤其適合於人的定性判斷起重要作用的、對決策結果難於直接準確計量的場合。要使AHP的決策結論儘可能符合客觀規律,決策者必須對所面臨的問題有比較深入和全面的認識。另外,當遇到因素眾多,規模較大的評價問題時,該模型容易出現問題,它要求評價者對問題的本質、包含的要素及其相互之間的邏輯關係能掌握得十分透徹,否則評價結果就不可靠和準確。

改進方法:

(1)   成對比較矩陣可以採用德爾菲法獲得。

(2)   如果評價指標個數過多(一般超過9個),利用層次分析法所得到的權重就有一定的偏差,繼而組合評價模型的結果就不再可靠。可以根據評價物件的實際情況和特點,利用一定的方法,將各原始指標分層和歸類,使得每層各類中的指標數少於9個。

3.2   灰色綜合評價法(灰色關聯度分析)

基本思想:灰色關聯分析的實質就是,可利用各方案與最優方案之間關聯度大小對評價物件進行比較、排序。關聯度越大,說明比較序列與參考序列變化的態勢越一致,反之,變化態勢則相悖。由此可得出評價結果。

基本步驟:建立原始指標矩陣;確定最優指標序列;進行指標標準化或無量綱化處理;求差序列、最大差和最小差;計算關聯絡數;計算關聯度。

優點:是一種評價具有大量未知資訊的系統的有效模型,是定性分析和定量分析相結合的綜合評價模型,該模型可以較好地解決評價指標難以準確量化和統計的問題,可以排除人為因素帶來的影響,使評價結果更加客觀準確。整個計算過程簡單,通俗易懂,易於為人們所掌握;資料不必進行歸一化處理,可用原始資料進行直接計算,可靠性強;評價指標體系可以根據具體情況增減;無需大量樣本,只要有代表性的少量樣本即可。

缺點:要求樣本資料且具有時間序列特性;只是對評判物件的優劣做出鑑別,並不反映絕對水平,故基於灰色關聯分析綜合評價具有“相對評價”的全部缺點。

適用範圍:對樣本量沒有嚴格要求,不要求服從任何分佈,適合只有少量觀測資料的問題;應用該種方法進行評價時,指標體系及權重分配是一個關鍵的問題,選擇的恰當與否直接影響最終評價結果。

改進方法:

(1)   採用組合賦權法:根據客觀賦權法和主觀賦權法綜合而得權係數。

(2)   結合TOPSIS法:不僅關注序列與正理想序列的關聯度,而且關注序列與負理想序列的關聯度,依據公式計算最後的關聯度。

3.3   模糊綜合評價法

基本思想:是以模糊數學為基礎,應用模糊關係合成的原理,將一些邊界不清、不易定量的因素定量化,從多個因素對被評價事物隸屬等級(或稱為評語集)狀況進行綜合性評價的一種方法。綜合評判對評判物件的全體,根據所給的條件,給每個物件賦予一個非負實數評判指標,再據此排序擇優。

基本步驟:確定因素集、評語集;構造模糊關係矩陣;確定指標權重;進行模糊合成和做出評價。

優點::數學模型簡單,容易掌握,對多因素、多層次的複雜問題評判效果較好。模糊評判模型不僅可對評價物件按綜合分值的大小進行評價和排序,而且還可根據模糊評價集上的值按最大隸屬度原則去評定物件所屬的等級,結果包含的資訊量豐富。評判逐對進行,對被評物件有唯一的評價值,不受被評價物件所處物件集合的影響。接近於東方人的思維習慣和描述方法,因此它更適用於對社會經濟系統問題進行評價。

缺點:並不能解決評價指標間相關造成的評價資訊重複問題,隸屬函式的確定還沒有系統的方法,而且合成的演算法也有待進一步探討。其評價過程大量運用了人的主觀判斷,由於各因素權重的確定帶有一定的主觀性,因此,總的來說,模糊綜合評判是一種基於主觀資訊的綜合評價方法。

應用範圍:廣泛地應用於經濟管理等領域。綜合評價結果的可靠性和準確性依賴於合理選取因素、因素的權重分配和綜合評價的合成運算元等。

改進方法:

(1) 採用組合賦權法:根據客觀賦權法和主觀賦權法綜合而得權係數。

3.4   BP神經網路綜合評價法

基本思想:是一種互動式的評價方法,它可以根據使用者期望的輸出不斷修改指標的權值,直到使用者滿意為止。因此,一般來說,人工神經網路評價方法得到的結果會更符合實際情況。

優點:神經網路具有自適應能力,能對多指標綜合評價問題給出一個客觀評價,這對於弱化權重確定中的人為因素是十分有益的。在以前的評價方法中,傳統的權重設計帶有很大的模糊性,同時權重確定中人為因素影響也很大。隨著時間、空間的推移,各指標對其對應問題的影響程度也可能發生變化,確定的初始權重不一定符合實際情況。再者,考慮到整個分析評價是一個複雜的非線性大系統,必須建立權重的學習機制,這些方面正是人工神經網路的優勢所在。針對綜合評價建模過程中變數選取方法的侷限性,採用神經網路原理可對變數進行貢獻分析,進而剔除影響不顯著和不重要的因素,以建立簡化模型,可以避免主觀因素對變數選取的干擾。

缺點: ANN在應用中遇到的最大問題是不能提供解析表示式,權值不能解釋為一種迴歸係數,也不能用來分析因果關係,目前還不能從理論上或從實際出發來解釋ANN的權值的意義。需要大量的訓練樣本,精度不高,應用範圍是有限的。最大的應用障礙是評價演算法的複雜性,人們只能藉助計算機進行處理,而這方面的商品化軟體還不夠成熟。

適用範圍:神經網路評價模型具有自適應能力、可容錯性,能夠處理非線性、非局域性的大型複雜系統。在對學習樣本訓練中,無需考慮輸入因子之間的權係數,ANN通過輸入值與期望值之間的誤差比較,沿原連線權自動地進行調節和適應,因此該方法體現了因子之間的相互作用。

改進方法:

(1) 採用組合評價法:對用其它評價方法得出的結果,選取一部分作為訓練樣本,一部分作為待測樣本進行檢驗,如此對神經網路進行訓練,知道滿足要求為止,可得到更好的效果。

3.5   資料包絡法(DEA)

3.6   組合評價法

4        預測模型

定性研究與定量研究的結合,是科學的預測的發展趨勢。在實際預測工作中,應該將定性預測和定量預測結合起來使用,即在對系統做出正確分析的基礎上,根據定量預測得出的量化指標,對系統未來走勢做出判斷。

4.1   迴歸分析法

基本思想:根據歷史資料的變化規律,尋找自變數與因變數之間的迴歸方程式,確定模型引數,據此預測。迴歸問題分為一元和多元迴歸、線性和非線性迴歸。

特點:技術比較成熟,預測過程簡單;將預測物件的影響因素分解,考察各因素的變化情況,從而估計預測物件未來的數量狀態;迴歸模型誤差較大,外推特性差。

適用範圍:迴歸分析法一般適用於中期預測。迴歸分析法要求樣本量大且要求樣本有較好的分佈規律,當預測的長度大於佔有的原始資料長度時,採用該方法進行預測在理論上不能保證預測結果的精度。另外,可能出現量化結果與定性分析結果不符的現象,有時難以找到合適的迴歸方程型別。

4.2   時間序列分析法

基本思想:把預測物件的歷史資料按一定的時間間隔進行排列,構成一個隨時間變化的統計序列,建立相應的資料隨時間變化的變化模型,並將該模型外推到未來進行預測。

適用範圍:此方法有效的前提是過去的發展模式會延續到未來,因而這種方法對短期預測效果比較好,而不適合作中長期預測。一般來說,若影響預測物件變化各因素不發生突變,利用時間序列分析方法能得到較好的預測結果;若這些因素髮生突變,時間序列法的預測結果將受到一定的影響。

灰色預測法

基本思想:將一切隨機變數看作是在一定範圍內變化的灰色變數,不是從統計規律角度出發進行大樣本分析研究,而是利用資料處理方法(資料生成與還原),將雜亂無章的原始資料整理成規律性較強的生成資料來加以研究,即灰色系統理論建立的不是原始資料模型,而是生成資料模型。

適用範圍:預測模型是一個指數函式,如果待測量是以某一指數規律發展的,則可望得到較高精度的預測結果。影響模型預測精度及其適應性的關鍵因素,是模型中背景值的構造及預測公式中初值的選取。

4.3   BP神經網路法

人工神經網路的理論有表示任意非線性關係和學習等的能力,給解決很多具有複雜的不確定性和時變性的實際問題提供了新思想和新方法。

利用人工神經網路的學習功能,用大量樣本對神經元網路進行訓練,調整其連線權值和閉值,然後可以利用已確定的模型進行預測。神經網路能從資料樣本中自動地學習以前的經驗而無需繁複的查詢和表述過程,並自動地逼近那些最佳刻畫了樣本資料規律的函式,而不論這些函式具有怎樣的形式,且所考慮的系統表現的函式形式越複雜,神經網路這種特性的作用就越明顯。

誤差反向傳播演算法(BP演算法)的基本思想是通過網路誤差的反向傳播,調整和修改網路的連線權值和閉值,使誤差達到最小,其學習過程包括前向計算和誤差反向傳播。它利用一個簡單的三層人工神經網路模型,就能實現從輸入到輸出之間任何複雜的非線性對映關係。目前,神經網路模型已成功地應用於許多領域,諸如經濟預測、財政分析、貸款抵押評估和破產預測等許多經濟領域。

優點:可以在不同程度和層次上模仿人腦神經系統的結構及資訊處理和檢索等功能,對大量非結構性、非精確性規律具有極強的自適應功能,具有資訊記憶、自主學習、知識推理和優化計算等特點,其自學習和自適應功能是常規演算法和專家系統技術所不具備的,同時在一定程度上克服了由於隨機性和非定量因素而難以用數學公式嚴密表達的困難。

缺點:網路結構確定困難,同時要求有足夠多的歷史資料,樣本選擇困難,演算法複雜,容易陷入區域性極小點。

4.4   支援向量機法

支援向量機是基於統計學習的機器學習方法,通過尋求結構風險化最小,實現經驗風險和置信範圍的最小,從而達到在統計樣本較少的情況下,亦能獲得良好統計規律的目的。

其中支援向量機是統計學習理論的核心和重點。支援向量機是結構風險最小化原理的近似,它能夠提高學習機的泛化能力,既能夠由有限的訓練樣本得到小的誤差,又能夠保證對獨立的測試集仍保持小的誤差,而且支援向量機演算法是一個凸優化問題,因此區域性最優解一定是全域性最優解,支援向量機就克服了神經網路收斂速度慢和區域性極小點等缺陷。

核函式的選取在SVM方法中是一個較為困難的問題,至今沒有一定的理論方面的指導。

4.5   組合預測法

在實際預測工作中,從資訊利用的角度來說,就是任何一種單一預測方法都只利用了部分有用資訊,同時也拋棄了其它有用的資訊。為了充分發揮各預測模型的優勢,對於同一預測問題,往往可以採用多種預測方法進行預測。不同的預測方法往往能提供不同的有用資訊,組合預測將不同預測模型按一定方式進行綜合。根據組合定理,各種預測方法通過組合可以儘可能利用全部的資訊,儘可能地提高預測精度,達到改善預測效能的目的。

優化組合預測有兩類概念,一是指將幾種預測方法所得的預測結果,選取適當的權重進行加權平均的一種預測方法,其關鍵是確定各個單項預測方法的加權係數;二是指在幾種預測方法中進行比較,選擇擬合度最佳或標準離差最小的預測模型作為最優模型進行預測。組合預測是在單個預測模型不能完全正確地描述預測量的變化規律時發揮其作用的。