1. 程式人生 > >多目標進化優化的Tchebycheff分解方法

多目標進化優化的Tchebycheff分解方法

On Tchebycheff Decomposition Approaches for  Multiobjective Evolutionary Optimization

Digital Object Identifier 10.1109/TEVC.2017.2704118

摘要:

Tchebycheff分解是一種極廣泛使用的分解方法,其能將一個多目標優化問題轉化為一組標量優化子問題。然而,在Tchebycheff分解中,子目標函式的幾何屬性還沒有被詳盡地研究。本文通過對方向向量進行lplp-正規化約束提出了一種Tchebycheff分解方法,其中,子目標函式具有明確的幾何屬性。尤其,對方向向量進行l2l2-正規化約束的Tchebycheff分解作為例子被用於說明其優越性。同時,一個新的一元R2R2指標被引入來近似超體積度量(Hyper-volume metric)及證明提出的Tchebycheff分解的有效性。最終,一個基於使用l2l2-正規化約束的Tchebycheff分解的多目標優化演算法和一個新的種群更新策略被提出來解決多目標優化問題。在基準測試集及現實世界的多目標優化問題上的實驗結果表明,相比其他主流多目標優化演算法,提出的演算法能夠獲得高質量的解。

索引詞

—Tchebycheff分解,基於分解的多目標優化演算法,種群更新策略,最大適應值改善,R2R2指標

I. 引言

一個多目標問題(Multi-objective problem,MOP)【1,2】可以用公式描述為:  minF(x)=(f1(x),f2(x),...,fm(x))minF(x)=(f1(x),f2(x),...,fm(x))(1)  subjectto:x∈Ωsubjectto:x∈Ω  其中,xx為一個決策變數向量,ΩΩ為決策空間,F(x):Ω→RmF(x):Ω→Rm為mm個目標函式的一個mm-維向量。

令xaxa和xbxb表示兩個決策向量,xaxa支配xbxb(表示為xa≺xbxa≺xb),當且僅當∀i∈{1,...,m},fi(xa)≤fi(xb)∀i∈{1,...,m},fi(xa)≤fi(xb)及F(xa)≠F(xb)F(xa)≠F(xb)。一個解x∗∈Ωx∗∈Ω如果不被其他任何解支配,則被稱為是Pareto最優的。所有的Pareto最優解組成了Pareto最優集(Pareto optimal set,PS),即,PS={x∗|∄x∈Ω,x≺x∗}PS={x∗|∄x∈Ω,x≺x∗}。相應的最優目標向量集稱為Pareto最優前沿(Pareto optimal front,PF),即,PF={F(x)|x∈PS}PF={F(x)|x∈PS}。

基於分解的多目標優化演算法(MOEA/D)已被認為是一種非常有效的估計PFPF的方法【3-14】。分解方法是MOEA/D的關鍵組成。Tchebycheff分解是一種最為廣泛使用的分解方法。然而,使用均勻權重向量的Tchebycheff分解所獲得的解通常並不是均勻分佈的【5-9】。廣義分解【5-7】和改進的Tchebycheff分解【9,10】被提出以解決此問題,但在這些Tchebycheff分解方法中的子目標函式的幾何屬性還沒有被詳盡地研究。

本文提出一種對方向向量進行lplp-正規化約束的Tchebycheff分解方法(pp-Tch),其中,子目標函式有明確的幾何屬性。對pp-Tch和其他Tchebycheff分解方法的關係進行了研究。不同的pp值對MOEA/D的子問題施加了不同的競爭壓力。使用l2l2-正規化約束(2-Tch)的Tchebycheff分解被作為例子來說明所提出的分解方法的優點。指標R2tch2R22tch,一種基於2-Tch的R2R2指標【15】的變體,也被引入以近似超體積度量來證實提出的Tchebycheff分解的有效性。

MOEA/D框架中使用了2-Tch及一個新的種群更新策略。在大多數的MOEA/D變體(比如,【4,16-18】)中,進化種群的更新是基於一種區域性隨機策略。在【19】中,一種基於最小適應值的全域性策略被提出。然而,上述策略都是被設計用來優化某些子問題的效能,而不是所有子問題。為解決此問題,本文引入了一種基於最大適應值改善的全域性種群更新策略來優化所有子問題的總體效能。最終的演算法,MOEA/D-2TCHMFI(基於2-Tch和最大適應值提升的種群更新策略的MOEA/D),在多種基準測試集和現實世界的多目標優化問題上進行了測試。實驗結果表明,相比其他多目標優化演算法,MOEA/D-2TCHMFI能夠得到高質量的解。

在本文的其餘部分,第II節回顧了兩種密切相關的Tchebycheff分解方法。所提出的對方向向量進行lplp-正規化約束的Tchebycheff分解方法和分解的廣義形式在第III節引入。第IV節提出了基於最大適應值改善的種群更新策略。最終的MOEA/D-2TCHMFI演算法在第V節被描述。第VI節定義了提出的一元指標R2tch2R22tch。第VII節展示了MOEA/D-2TCHMFI和其他先進多目標優化演算法的比較結果。最後,第VIII節對本工作進行了總結。

II. 兩種關係密切的Tchebycheff分解方法

在本節,我們回顧了兩種關係密切的Tchebycheff分解方法,即,傳統Tchebycheff分解【20】和改進Tchebycheff分解【10】。在這兩種Tchebycheff分解方法中的子問題目標函式的幾何屬性被詳細研究。

A. 傳統Tchebycheff分解

傳統Tchebycheff分解將一個MOP分解成一組標量優化子問題,每一個的定義如下:  minx∈Ωgtch(F(x)|w,z∗)=max1≤i≤m{wi(fi(x)−z∗)}minx∈Ωgtch(F(x)|w,z∗)=max1≤i≤m{wi(fi(x)−z∗)}(2)  其中,wi=(w1,...,wm)wi=(w1,...,wm)滿足∑mi=1wi=1∑i=1mwi=1 及wi≥0wi≥0,為一個子問題的權重向量,z∗=(z∗1,z∗2,...,z∗m)z∗=(z1∗,z2∗,...,zm∗)滿足z∗i<min{fi(x)|x∈Ω}zi∗<min{fi(x)|x∈Ω},為一理想目標向量。

傳統Tchebycheff分解中的子問題目標函式的幾何屬性還沒有被研究。據我們所知,本工作首次研究了Tchebycheff分解中的子問題目標函式的幾何屬性。

命題 2.1:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)為(1)的一個理想目標向量,w=(w1,...,wm)w=(w1,...,wm)為正權重向量。若一個給定的目標向量F(x)=(f1(X),...,Fm(x))F(x)=(f1(X),...,Fm(x))位於直線  L1:w1(f1(x)−z∗1)=...=wm(fm(x)−z∗m)L1:w1(f1(x)−z1∗)=...=wm(fm(x)−zm∗)  如圖1(a)所示。那麼,  gtch(F(x)|w,z∗)=wT(F(x)−z∗)mgtch(F(x)|w,z∗)=wT(F(x)−z∗)m(3)

證明 由於F(x)F(x)位於直線L1L1,我們得到  gtch(F(x)|w,z∗)===(2)max1≤i≤m{wi(fi(x)−z∗i)}===L1w1(f1(x)−z∗1)=...=wm(fm(x)−z∗m)=∑mi=1wi(fi(x)−z∗i)m=wT(F(x)−z∗)m      ■gtch(F(x)|w,z∗)===(2)max1≤i≤m{wi(fi(x)−zi∗)}===L1w1(f1(x)−z1∗)=...=wm(fm(x)−zm∗)=∑i=1mwi(fi(x)−zi∗)m=wT(F(x)−z∗)m      ◼  公式(3)用於說明gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的幾何屬性,而不是找到gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的最優解,即,minx∈Ωgtch(F(x)|w,z∗)minx∈Ωgtch(F(x)|w,z∗)。以F(x)=(1/2,1/4)F(x)=(1/2,1/4),z∗=(0,0)z∗=(0,0)及w=(1/3,2/3)w=(1/3,2/3)為例,如圖1(a)所示,我們可以使用等式(3)來解釋子問題適應值gtch(F(x)|w,z∗)gtch(F(x)|w,z∗),ww,與F(x)−z∗F(x)−z∗的關係。式(3)(即wT(F(x)−z∗)/mwT(F(x)−z∗)/m)給出了l1l1-正規化的加權形式,為gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的對偶式【21,pp. 637】。  F(x)F(x)不位於L1L1的情形可以如下命題描述。

命題 2.2:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)為一個(1)的理想目標向量,w=(w1,...,wm)w=(w1,...,wm)為一個正的權重向量。給定一個目標向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x)),F^(x)=(f^1(x),...,f^m(x))F^(x)=(f^1(x),...,f^m(x))可以如下構建:1)F^(x)F^(x)與F(x)F(x)有相同的子問題適應值,即,gtch(F(x)|w,z∗)=gtch(F^(x)|w,z∗)gtch(F(x)|w,z∗)=gtch(F^(x)|w,z∗);2)F^(x)F^(x)位於圖1(d)所示的直線L1L1。那麼,如下等式可以滿足:  gtch(F(x)|w,z∗)=wT(F^(x)−z∗)mgtch(F(x)|w,z∗)=wT(F^(x)−z∗)m(4)

證明 由F^(x)F^(x)的構建,我們得到  gtch(F(x)|w,z∗)===1)=======2)F^(x) is in L1wT(F^(x)−z∗)m      ■gtch(F(x)|w,z∗)===1)=======2)F^(x) is in L1wT(F^(x)−z∗)m      ◼

備註 給定目標向量F(x)F(x),F^(x)=(f^1(x),...,f^m(x))F^(x)=(f^1(x),...,f^m(x))實際上是gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的等值線與L1L1在目標空間的交點,如圖1(d)所示,並且f^i(x)=z∗i+gtch(F(x)|w,z∗)wi,i=1,...,mf^i(x)=zi∗+gtch(F(x)|w,z∗)wi,i=1,...,m  由於這樣的事實:

gtch(F(x)|w,z∗)===1)gtch(F^(x)|w,z∗)===2)w1(f^1(x)−z∗1)=...=wm(f^m(x)−z∗m)      ■gtch(F(x)|w,z∗)===1)gtch(F^(x)|w,z∗)===2)w1(f^1(x)−z1∗)=...=wm(f^m(x)−zm∗)      ◼  以F(x)=(1,1)F(x)=(1,1),z∗=(0,0)z∗=(0,0),及w=(1/3,2/3)w=(1/3,2/3)為例,我們能得到:  gtch(F(x)|w,z∗)=max{13(1−0),23(1−0)}=2/3gtch(F(x)|w,z∗)=max{13(1−0),23(1−0)}=2/3,  f^1(x)=z∗1+gtch(F(x)|w,z∗)w1=0+2/31/3=2f^1(x)=z1∗+gtch(F(x)|w,z∗)w1=0+2/31/3=2,  f^2(x)=z∗2+gtch(F(x)|w,z∗)w2=0+2/32/3=1f^2(x)=z2∗+gtch(F(x)|w,z∗)w2=0+2/32/3=1.

B. 改進Tchebycheff分解

為處理最優解與相應的子問題權重向量之間的非線性關係【5-8,22-24】,研究【10】提出了改進Tchebycheff分解。並沒有與(2)中的wiwi相乘,改進Tchebycheff分解通過用fi(x)−z∗ifi(x)−zi∗除以wiwi來構建子問題,如下:

minx∈Ωgmtch(F(x)|w,z∗)=max1≤i≤m{fi(x)−z∗iwi}minx∈Ωgmtch(F(x)|w,z∗)=max1≤i≤m{fi(x)−zi∗wi}(5)

對改進Tchebycheff分解中的一個子問題目標函式的幾何屬性的研究如下。

命題 2.3:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)為(1)中的一理想目標向量,w=(w1,...,wm)w=(w1,...,wm)為一正的權重向量。若一給定的目標向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x))位於直線  L2: f1(x)−z∗1w1=...=fm(x)−z∗mwmL2: f1(x)−z1∗w1=...=fm(x)−zm∗wm  如圖1(b)所示。那麼,  gmtch(F(x)|w,z∗)=∥F(x)−z∗∥1gmtch(F(x)|w,z∗)=‖F(x)−z∗‖1(6)

證明 由於F(x)F(x)在L2L2上,我們可以得出,  gmtch(F(x)|w,z∗)===(5)max1≤i≤m{fi(x)−z∗iwi}gmtch(F(x)|w,z∗)===(5)max1≤i≤m{fi(x)−zi∗wi}  ===L2f1(x)−z∗1w1=...=fm(x)−z∗mwm===L2f1(x)−z1∗w1=...=fm(x)−zm∗wm  =∑mi=1(fi(x)−z∗i)∑mi=1wi=∥F(x)−z∗∥1      ■=∑i=1m(fi(x)−zi∗)∑i=1mwi=‖F(x)−z∗‖1      ◼  以F(x)=(1/4,2/4)F(x)=(1/4,2/4),z∗=(0,0)z∗=(0,0),及w=(1/3,2/3)w=(1/3,2/3)為例,式(6)可以如下計算:

gmtch(F(x)|w,z∗)=max{f1(x)−z∗1w1,f2(x)−z∗2w2}gmtch(F(x)|w,z∗)=max{f1(x)−z1∗w1,f2(x)−z2∗w2}  =max{1/4−01/3,2/4−02/3}=34=∥F(x)−z∗∥1=max{1/4−01/3,2/4−02/3}=34=‖F(x)−z∗‖1  當F(x)F(x)不在L2L2時,以下命題描述了gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的幾何屬性。

命題 2.4:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)為(1)中的一理想目標向量,w=(w1,...,wm)w=(w1,...,wm)為一正的權重向量。給定一目標向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x)),可以由滿足以下兩個約束生成F~(x)=(f~1(x),...,f~m(x))F~(x)=(f~1(x),...,f~m(x)):1)f~(x)f~(x)和F(x)F(x)位於同一等值線上,即,gmtch(F(x)|w,z∗)=gmtch(F~(x)|w,z∗)gmtch(F(x)|w,z∗)=gmtch(F~(x)|w,z∗);及2)f~(x)f~(x)位於直線L2L2上,如圖1(e)所示。那麼,  gmtch(F(x)|w,z∗)=∥∥F~(x)−z∗∥∥1gmtch(F(x)|w,z∗)=‖F~(x)−z∗‖1 (7)

證明 據F~(x)F~(x)的情況,我們得到  gmtch(F(x)|w,z∗)====1)gmtch(F~(x)|w,z∗)gmtch(F(x)|w,z∗)====1)gmtch(F~(x)|w,z∗)  ====================2) F~(x) is in L2 {Proposition 2.3}∥∥F~(x)−z∗∥∥1      ■====================2) F~(x) is in L2 {Proposition 2.3}‖F~(x)−z∗‖1      ◼

備註 在幾何中,gmtch(F(x)|w,z∗)gmtch(F(x)|w,z∗)等同於F~(x)−z∗F~(x)−z∗的l1l1-正規化,如圖1(e)所示。F~(x)F~(x)為直線L2L2與gmtch(F(x)|w,z∗)gmtch(F(x)|w,z∗)的等值線的交點,如圖1(e)所示。

F~(x)=(f~1(x),...,f~m(x))=z∗+gmtch(F(x)|w,z∗)⋅wF~(x)=(f~1(x),...,f~m(x))=z∗+gmtch(F(x)|w,z∗)⋅w  由於  gmtch(F(x)|w,z∗)===1)gmtch(F~(x)|w,z∗)gmtch(F(x)|w,z∗)===1)gmtch(F~(x)|w,z∗)  =====2) L2f~1(x)−z∗1w1=...=f~m(x)−z∗mwm      ■=====2) L2f~1(x)−z1∗w1=...=f~m(x)−zm∗wm      ◼

例如,給定F(x)=(0.5,2)F(x)=(0.5,2),z∗=(0,0)z∗=(0,0),及w=(1/3.2/3)w=(1/3.2/3),我們可以計算  gmtch(F(x)|w,z∗)=max{0.5−01/3,2−02/3}=3,gmtch(F(x)|w,z∗)=max{0.5−01/3,2−02/3}=3,  f~1(x)=z∗1+gmtch(F(x)|w,z∗)⋅w1=0+3⋅1/3=1,f~1(x)=z1∗+gmtch(F(x)|w,z∗)⋅w1=0+3⋅1/3=1,  f~2(x)=z∗2+gmtch(F(x)|w,z∗)⋅w2=0+3⋅2/3=2.f~2(x)=z2∗+gmtch(F(x)|w,z∗)⋅w2=0+3⋅2/3=2.

III. 提出的對方向向量進行lplp-正規化約束的Tchebycheff分解

通過對改進Tchebycheff分解進行拓展,本文提出一種新的對方向向量進行lplp-正規化約束的Tchebycheff分解方法,簡稱為pp-Tch。在pp-Tch中,每個子問題的構建基於一個滿足∥λ∥p=1‖λ‖p=1的方向向量λλ,而不是改進Tchebycheff分解中使用的滿足∥w∥1=∑mi=1wi=1‖w‖1=∑i=1mwi=1的權重向量ww,即,

minx∈Ωgptch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−z∗iλi}minx∈Ωgptch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−zi∗λi}(8)  其中,λ=(λ1,...,λm)λ=(λ1,...,λm)滿足∥λ∥p=1‖λ‖p=1及λ1,...,λm>0λ1,...,λm>0。注意,改進Tchebycheff分解(5)是p=1p=1時的pp-Tch的一種特殊形式,近似於Chebyshev近似問題【21,pp. 293】,是pp-Tch(8)的一個同等問題,可用公式描述為:

minx∈Ω   tminx∈Ω   t  s.t.     fi(x)−z∗iλi≤t,i=1,...,ms.t.     fi(x)−zi∗λi≤t,i=1,...,m

A. pp-Tch中的子問題目標函式的幾何屬性

命題 3.1:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)為(1)的一個理想目標向量,方向向量λλ為一正向量且滿足∥λ∥p=1‖λ‖p=1。若一給定的目標向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x))位於直線  L3:f1(x)−z∗1λ1=...=fm(x)−z∗mλm.L3:f1(x)−z1∗λ1=...=fm(x)−zm∗λm.  那麼  gptch(F(x)|λ,z∗)=∥F(x)−z∗∥pgptch(F(x)|λ,z∗)=‖F(x)−z∗‖p(9)

證明 由於fi(x)−z∗i≥0fi(x)−zi∗≥0並且對於∀i∈{1,2,...,m}∀i∈{1,2,...,m}有λi>0λi>0,  k(x)≜gptch(F(x)|λ,z∗)===(8)max1≤i≤m{fi(x)−z∗iλi}k(x)≜gptch(F(x)|λ,z∗)===(8)max1≤i≤m{fi(x)−zi∗λi}  ===L3f1(x)−z∗1λ1=...=fm(x)−z∗mλm≥0===L3f1(x)−z1∗λ1=...=fm(x)−zm∗λm≥0(10)

由於對於i=1,...,mi=1,...,m有fi(x)−z∗i=λi⋅k(x)fi(x)−zi∗=λi⋅k(x),且F(x)−z∗=k(x)⋅λF(x)−z∗=k(x)⋅λ,我們有

gptch(F(x)|λ,z∗)=k(x)=====∥λ∥p=1k(x)⋅∥λ∥p========k(x)≥0  (10)gptch(F(x)|λ,z∗)=k(x)=====‖λ‖p=1k(x)⋅‖λ‖p========k(x)≥0  (10)  ∥k(x)⋅λ∥p===========k(x)⋅=F(x)−z∗∥F(x)−z∗∥p‖k(x)⋅λ‖p===========k(x)⋅=F(x)−z∗‖F(x)−z∗‖p(11)                 ■               ◼  以p=2p=2,F(x)=(1,2)F(x)=(1,2),λ=(1/5–√,2/5–√)λ=(1/5,2/5),及z∗=(0,0)z∗=(0,0)為例,我們能得到  g2tch(F(x)|λ,z∗)=max{f1(x)−z∗1λ1,f2(x)−z∗2λ2}g2tch(F(x)|λ,z∗)=max{f1(x)−z1∗λ1,f2(x)−z2∗λ2}  =max{1−01/5–√,2−02/5–√}=5–√=∥F(x)−z∗∥2=max{1−01/5,2−02/5}=5=‖F(x)−z∗‖2

命題3.1描述的情形在p=2p=2時可以用圖1(c)說明。如圖所示,gptch(F(x)|λ,z∗)gptch(F(x)|λ,z∗)為p=2p=2時的z∗z∗到F(x)F(x)的歐氏距離。F(x)F(x)不位於L3L3的情形可以用如下命題描述。 命題 3.2:,令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)為(1)的一理想目標向量,方向向量λλ為滿足∥λ∥p=1‖λ‖p=1的方向向量。給定一目標向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x)),F¯(x)=(f¯1(x),...,f¯m(x))F¯(x)=(f¯1(x),...,f¯m(x))滿足兩個約束:1)F¯(x)F¯(x)與F(x)F(x)具有相同的適應值,即,gptch(F(x)|λ,z∗)=gptch(F¯(x)|λ,z∗)gptch(F(x)|λ,z∗)=gptch(F¯(x)|λ,z∗);2)F¯(x)F¯(x)位於直線L3L3上,如圖1(f)所示。那麼,  gptch(F(x)|λ,z∗)=∥∥F¯(x)−z∗∥∥pgptch(F(x)|λ,z∗)=‖F¯(x)−z∗‖p(12)

證明 由F¯(x)F¯(x)的組成,我們能得到  gptch(F(x)|λ,z∗)===1)gptch(F¯(x)|λ,z∗)==================2) F¯(x) is in L3  Proposition 3.1∥∥F¯(x)−z∗∥∥p      ■gptch(F(x)|λ,z∗)===1)gptch(F¯(x)|λ,z∗)==================2) F¯(x) is in L3  Proposition 3.1‖F¯(x)−z∗‖p      ◼  根據F¯(x)F¯(x)的兩個約束,我們能得到  F¯(x)=(f¯1(x),...,f¯m(x))=z∗+gptch(F(x)|λ,z∗)⋅λF¯(x)=(f¯1(x),...,f¯m(x))=z∗+gptch(F(x)|λ,z∗)⋅λ

例如,給定p=2p=2,F(x)=(0.5,2)F(x)=(0.5,2),λ=(1/5–√,2/5–√)λ=(1/5,2/5),及z∗=(0,0)z∗=(0,0),我們可以計算  g2tch(F(x)|λ,z∗)=max{0.5−01/5–√,2−02/5–√}=5–√,g2tch(F(x)|λ,z∗)=max{0.5−01/5,2−02/5}=5,  f¯1(x)=z∗1+g2tch(F(x)|λ,z∗)⋅λ1=0+5–√⋅1/5–√=1,f¯1(x)=z1∗+g2tch(F(x)|λ,z∗)⋅λ1=0+5⋅1/5=1,  f¯2(x)=z∗2+g2tch(F(x)|λ,z∗)⋅λ2=0+5–√⋅2/5–√=2.f¯2(x)=z2∗+g2tch(F(x)|λ,z∗)⋅λ2=0+5⋅2/5=2.

B. 改進Tchebycheff分解與pp-Tch的關係

改進Tchebycheff分解與pp-Tch在構造子問題時具有相似之處,即,  gptch(F(x)|λ,z∗)======λ=w∥w∥pgptch(F(x)|w∥w∥p,z∗)gptch(F(x)|λ,z∗)======λ=w‖w‖pgptch(F(x)|w‖w‖p,z∗)  ===(8)max1≤i≤m⎧⎩⎨fi(x)−z∗iwi∥w∥p⎫⎭⎬=∥w∥p⋅max1≤i≤m{fi(x)−z∗iwi}===(8)max1≤i≤m{fi(x)−zi∗wi‖w‖p}=‖w‖p⋅max1≤i≤m{fi(x)−zi∗wi}  ===(5)∥w∥p⋅gmtch(F(x)|w,z∗)===(5)‖w‖p⋅gmtch(F(x)|w,z∗)(13)

其中,pp-Tch與改進Tchebycheff分解的不同之處在於產生權重因子∥w∥p‖w‖p的方法。  式(13)可以被一般化。更具體來說,若g(F(x)|w,z∗)g(F(x)|w,z∗)表示一個分解方法(如,傳統Tchebycheff分解,改進Tchebycheff分解,加權和方法【20】或PBI方法【3】)的子問題,那麼,那麼一個泛化的子問題目標函式可以定義為c(w)⋅g(F(x)|w,z∗)c(w)⋅g(F(x)|w,z∗),其中,c(w)c(w)為只依賴於權重向量ww的係數,且對於任何ww有c(w)>0c(w)>0。在pp-Tch中,c(w)=∥w∥pc(w)=‖w‖p。 這裡寫圖片描述

C. 提出的泛化子問題的優點

泛化子問題相比於原始子問題的優點在於泛化能夠調整子問題在競爭中的重要性/權重,這對應其被後代解更新的機率。

1) 通過劃分可行目標空間調節子問題的重要性:c(w)c(w)能被看作為子問題的權重/重要性。子問題偏好區域的定義可以介紹如下:  Υi={F(x)|x∈Ω,argmin1≤i≤N{c(wj)⋅g(F(x)|wj,z∗)}=i}Υi={F(x)|x∈Ω,arg⁡min1≤i≤N{c(wj)⋅g(F(x)|wj,z∗)}=i}(14)  其中,NN為子問題的個數。在ΥiΥi中,c(wi)⋅g(F(x)|wi,z∗)c(wi)⋅g(F(x)|wi,z∗)為所有c(wj)⋅g(F(x)|wj,z∗), j=1,...,Nc(wj)⋅g(F(x)|wj,z∗), j=1,...,N中的最小的。其他定義子問題偏好區域的方法可參見【25,26】。

這裡寫圖片描述

這裡寫圖片描述

基於(14),c(w)c(w)對於用改進Tchebycheff分解劃分可行目標空間的影響如圖2和表I所示。

在圖2,使用了c(w)=∥w∥4pc(w)=‖w‖p4且pp在三張子圖中分別被設為0.10.1,0.50.5,和1.51.5。圖表表明,提高pp值會縮小邊界問題的偏好區域,即,與w1w1和w3w3關聯的子問題,會增加居間問題的偏好區域,即,與w2w2關聯的第二個子問題。表I總結了泛化子問題偏好區域佔可行目標空間的比率。

調節c(w)c(w)能調整子問題偏好區域,因此,更多的更新機會會被分配到更感興趣的子問題從而加速其收斂。例如,MOEA/D用三個子問題在雙目標ZDT4【27】和DTLZ4【28】問題的測試如圖2所示。廣泛使用的模擬二進位制交叉(simulated binary crossover,SBX)和多項式變異(polynomial mutation)【29】應用於生成子代。使用c(w)c(w)的不同設定,關聯於w1w1的第一個子問題擁有最大的偏好區域,示於圖2(a),且收斂最快,示於圖3(a)和(b),這對應於c(w)=∥w∥40.1c(w)=‖w‖0.14。同樣地,當c(w)=∥w∥41.5c(w)=‖w‖1.54時,第二個子問題具有三者中最大的偏好區域,如圖2所示,並取得了最快的收斂率,如圖3(c)和(d)所示。觀察可以得出,具有更大偏好區域的子問題更有可能被頻繁更新,不斷被改善,這將導致更快的收斂率。

這裡寫圖片描述

提升劃分全部子問題改善空間的均勻度:為闡明這一問題,基於最大適應度提升標準,我們首次如下給出子問題改善區域的定義:  Υi={F(y)|y∈Ω,g(F(y)|wi,z∗)<g(F(xi)|wi,z∗),Υi={F(y)|y∈Ω,g(F(y)|wi,z∗)<g(F(xi)|wi,z∗),  i=argmax1≤j≤N{c(w)⋅[g(F(xi)|wj,z∗)−g(F(y)|wj,z∗)]}}i=arg⁡max1≤j≤N{c(w)⋅[g(F(xi)|wj,z∗)−g(F(y)|wj,z∗)]}}  其中,xixi為第ii個子問題的當前解。不等式g(F(y)|wi,z∗)<g(F(x)|wi,z∗)g(F(y)|wi,z∗)<g(F(x)|wi,z∗)表明子代yy對於第ii個子問題比當前解xx具有更好的適應值。(15)中最後的約束確認取得最大適應值提升的子問題。

這裡寫圖片描述

一個所有子問題提升區域的示例如圖4(d)所示。通過使用(15)和改進Tchebycheff分解,c(w)c(w)對所有子問題提升區域的劃分的影響示於圖4(a)-(c)。使用了c(w)=∥w∥pc(w)=‖w‖p,且在圖4(a)-(c)中2,pp分別被設為1/31/3,11,和33。結果表明,提升pp值能提升劃分所有子問題提升區域的均勻度。此現象對於可行目標空間的邊界區域更為明顯,即,圖4(a)-(c)中的Υ1Υ1和Υ4Υ4。

通過c(w)c(w),演算法能夠調節提升區域的均勻度以提高演算法的效能。一個簡單的示例如圖4(a)-(c)所示,其中,MOEA/D融合了使用不同c(w)c(w)設定的四個均勻的子問題。雙目標ZDT4和DTLZ4問題被選作測試問題。多項式變異和SBX應用於生成子代。第ii個子問題的當前解將被子代yy更新,若其對應的目標向量位於ΥiΥi。提升區域的均勻劃分將使所有的子問題得到更好的一般結果,如圖4(e)-(f)所示。

IV. 基於最大適應值改善的種群更新策略

種群更新機制是MOEAs的關鍵組成,近年來已被充分研究。例如,基於差分進化(differential evolution,DE)【17】的MOEA/D,其限制了一個子代解能更新的父代解的數目。自適應全域性替換MOEA/D(MOEA/D with an adaptive global replacement,MOEA/D-AVR)【19】基於最小函式值用一個新生成解替換父代解。基於穩定匹配模型的MOEA/D【30】在更新種群時,使用了一個穩定匹配模型來使每個子問題與一個單一解匹配,因此不同子問題有不同解。為提升種群的多樣性,Li等人【31】進一步提出了基於互動關係的選擇來選取精英解使其在進化過程中存活。基於一種泛化資源排程策略的MOEA/D【32】使用一種全域性替換策略更新子問題解。這些種群更新策略已成功地提升了MOEA/D的效能,然而,它們大多是設計用於只是優化了一部分子問題的表現【17】【19】【32】。

這裡寫圖片描述

為提升演算法效能,本文提出了一種基於最大適應值提升的全域性種群更新策略,示於演算法1。尤其,對於目標子問題給定一般解yy,在演算法1的前兩步,yy能夠取得最大適應值提升的子問題ll可以識別如下

l=argmax1≤i≤N{gptch(F(xi)|λi,z∗)−gptch(F(y)|λi,z∗)}l=arg⁡max1≤i≤N{gptch(F(xi)|λi,z∗)−gptch(F(y)|λi,z∗)} (16)

之後,在第3步,相應的解xlxl被yy替換,若yy在子問題ll的表現優於xlxl。最後,為提升所提出的演算法的魯棒性,少量的父代解(不超過一個預定義的數目nr−1nr−1)同樣被隨機選擇並被yy替換,如第4步所示。使用不同pp-Tchs的影響在實驗研究中被考察,其基於如下公式:

gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)======(13)wi=λi/∥λi∥1∥wi∥p⋅[gmtch(F(xi)|wi,z)−gmtch(F(y)|wi,z)]gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)======wi=λi/‖λi‖1(13)‖wi‖p⋅[gmtch(F(xi)|wi,z)−gmtch(F(y)|wi,z)]

演算法1給出的種群更新策略基於pp-Tch,但是,在實驗研究中使用的是2-Tch。選擇p=2p=2的原因是,首先pp應該大於1,以提升子問題更新區域的均勻度,並且,p=2p=2優於p>2p>2,因為,相比於其他更大的pp值,在2-Tch中,對於歐氏距離來說,子問題目標函式具有一個更加清晰的幾何屬性。2-Tch的一個子問題定義如下:

minx∈Ωg2tch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−z∗iλi}minx∈Ωg2tch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−zi∗λi} (17)

其中,λ=(λ1,…,λm)λ=(λ1,…,λm)且∥λ∥2=1‖λ‖2=1及λ1,…,λm≥0λ1,…,λm≥0。

這裡寫圖片描述

在演算法1中,適應值的提升使用gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)進行計算。此適應值提升在2-Tch的相應的幾何屬性示於圖5。按照命題6,適應值提升計算如下:

g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)=∥F¯¯¯¯(xi)−z∥2−∥F¯¯¯¯(y)−z∥2=∥F¯¯¯¯(xi)−F¯¯¯¯(y)∥2g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)=‖F¯(xi)−z‖2−‖F¯(y)−z‖2=‖F¯(xi)−F¯(y)‖2

其中

F¯¯¯¯(xi)=z+g2tch(F(xi)|λi,z)⋅λiF¯(xi)=z+g2tch(F(xi)|λi,z)⋅λi  F¯¯¯¯(y)=z+g2tch(F(y)|λi,z)⋅λiF¯(y)=z+g2tch(F(y)|λi,z)⋅λi

其實,這是F¯¯¯¯(y)F¯(y)到F¯¯¯¯(xi)F¯(xi)的距離,如圖5所示。

與其他兩種具有代表性策略,即MOEA/D-AGR使用的基於最小適應值的策略與MOEA/D使用的隨機提升策略,所提出的基於最大適應值提升的策略具有如下優點:

這裡寫圖片描述

  1. 好的子代個體在提出的策略中能夠存活更長時間。為解釋這一點,適應值提升與適應值的區別首先可以使用一個雙目標優化問題在圖6進行說明。比如,在用一個子代yy更新了一個特定子問題ii之後,相應的適應值提升g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)和新的適應值g2tch(F(y)|λi,z)g2tch(F(y)|λi,z)分別使用實線和虛線部分表示。按照圖6的註釋,一個兩步的例子進一步示於圖7,以區分三種種群更新策略的工作過程。尤其,兩個有潛力的解yy和y1y1被生成,並用於依次更新種群。在圖7(a)的例子中,第一個有潛力的子代解yy佔優三個父代解x2x2,x3x3和x4x4。解yy在第三個子問題同時取得最大適應值提升與最小適應值由於:  argmax1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=3arg⁡max1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=3  argmin1≤i≤5 g2tch(F(y)|λi,z)=3arg⁡min1≤i≤5 g2tch(F(y)|λi,z)=3  因此,在第一步中,基於最大適應值提升與最小適應值的種群更新策略使用子代yy更新x3x3,分別示於圖7(b)和(d)。MOEA/D所用的策略隨機替換一個可提升的父代個體,比如圖7(f)的x2x2。為清晰起見,一個新生成的子代解yy用於替換最多一個父代個體,即,nr=1nr=1,示於圖7。在第二步,如圖7(b),(d)和(f)所示,給定第二個潛力解y1y1,三種策略分別用y1y1替換了x4x4,x3x3與x2x2,如圖7(c),(e)和(g)所示。其原因如下:  argmax1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=4arg⁡max1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=4  argmin1≤i≤5 g2tch(F(y)|λi,z)=3arg⁡min1≤i≤5 g2tch(F(y)|λi,z)=3  在圖7(f)中,MOEA/D所用的更新策略能夠隨機用y1y1替換x2x2或x3x3。圖7(g)假定x2x2被y1y1替換。可以觀察到,所提出的基於最大適應值提升策略成功地保留了第一個潛力個體yy,即,圖7(c)中的x3x3,然而,另兩個策略捨棄了yy,如圖7(e)和(g)所示。換句話說,在提出的更新策略中,好的解更可能倖存。 這裡寫圖片描述
  2. 提出的策略提升了在所有子問題上的泛化效能,即,∑Ni=1g2tch(F(xi)|λi,z∗)∑i=1Ng2tch(F(xi)|λi,z∗),而不是部分子問題。使用∑Ni=1g2tch(F(xi)|λi,z∗)∑i=1Ng2tch(F(xi)|λi,z∗)來評估整個種群效能的合理性亦將在節VI的R2tch2R22tch指標(20)的定義中解釋。給定一個種群A={x1,…,xN}A={x1,…,xN},如下假定是合理的:  g2tch(F(xi)|λi,z∗)=minF(x)∈A{g2tch(F(x)|λi,z∗)}g2tch(F(xi)|λi,z∗)=minF(x)∈A{g2tch(F(x)|λi,z∗)}  其中,xixi為MOEA/D中子問題ii的當前最優解。理想目標向量z∗z∗一般是事先未知的,故【3】中提出的用參考點zz估計z∗z∗的方法在本文采用了。所有子問題的一般效能能夠通過將AA中所有個體的適應值相加而進行估計,其為  g2tch(F(A)|D,z)=∑i=1Ng2tch(F(xi)|λi,z)g2tch(F(A)|D,z)=∑i=1Ng2tch(F(xi)|λi,z)  其中,D={λ1,…,λN}D={λ1,…,λN}且較小的g2tch(F(A)|D,z)g2tch(F(A)|D,z)意味著整個種群或所有子問題的較好的一般效能。

令所有三個比較的策略由同一初始種群AA開始,一個新生成的子代解yy用於只替換一個父代解。不失一般性,提出的基於最大適應值提升的策略應該更新子問題ll,而其他兩種策略更新子問題jj。根據(16)中最大適應值提升的定義,很明顯:

g2tch(F(xl)|λl,z)−g2tch(F(y)|λl,z)≥g2tch(F(xj)|λj,z)−g2tch(F(y)|λj,z)g2tch(F(xl)|λl,z)−g2tch(F(y)|λl,z)≥g2tch(F(xj)|λj,z)−g2tch(F(y)|λj,z)

相應地,更新子問題ll得到的新種群的適應值和小於或等於更新子問題jj的,即:

g2tch(F(A)|D,z)−g2tch(F(xl)|λl,z)+g2tch(F(y)|λl,z)≤g2tch(F(A)|D,z)−g2tch(F(xj)|λj,z)+g2tch(F(y)|λj,z)g2tch(F(A)|D,z)−g2tch(F(xl)|λl,z)+g2tch(F(y)|λl,z)≤g2tch(F(A)|D,z)−g2tch(F(xj)|λj,z)+g2tch(F(y)|λj,z)

換句話說,提出的策略能夠在所有子問題上得到更好的一般效能,相比於另外兩種在MOEA/D和MOEA/D-AGR使用的更新策略。

V. 提出的MOEA/D-2TCHMFI的細節

這裡寫圖片描述

2-Tch與提出的基於最大適應值改進的種群更新策略被組合到MOEA/D框架中,以組成新演算法,稱為MOEA/D-2TCHMFI。MOEA/D-2TCHMFI致力於就解的收斂性而言,提升MOEA/D,在演算法2進行了概述。權重向量/方向向量的選擇對於尋找在PF均勻分佈的解是關鍵的。對於一個分解方法,權重的一種最優分佈能夠根據【5】-【7】得到,若一個MOP的PF的幾何形狀是事先知道的,且提供了分佈良好的Pareto最優解集的清晰定義的話。

這裡寫圖片描述

在演算法2中,步驟1設定方向向量{λ1,…,λN}{λ1,…,λN}如下:

λi=wi∥wi∥2, i=1,…,Nλi=wi‖wi‖2, i=1,…,N

其中,{w1,…,wN}{w1,…,wN}為由【3】中建議的方法隨機生成的權重向量。均勻權重向量{w1,…,wN}{w1,…,wN}及相應的方向向量{λ1,…,λN}{λ1,…,λN}的視覺化在圖8中。步驟2僅選擇了⌊N/5⌋⌊N/5⌋子問題,這基於它們在每一代生成子代的最近的表現。步驟3使用2-Tch與基於最大適應值提升標準的種群更新策略來迭代地進化選擇的子問題。尤其地,在步驟3.1中,每個子問題通過主要來自其鄰域的子問題的資訊進行優化。參考點zz在步驟3.2更新,父代解在步驟3.3根據演算法1進行更新。在步驟3.4中,若代數gengen可以被3030整除,子問題ii的適應值在近30代的相應的減少計算如下:

Δi=g2tch(F(xi,gen−30)|λi,z)−g2tch(F(xi,gen)|λi,z)g2tch(F(xi,gen−30)|λi,z)Δi=g2tch(F(xi,gen−30)|λi,z)−g2tch(F(xi,gen)|λi,z)g2tch(F(xi,gen−30)|λi,z)

其中,xi,genxi,gen與xi,gen−30xi,gen−30分別為在當前代與代數gen−30gen−30時子問題ii的解。根據【16】,MOEA/D-2TCHMFI基於ΔiΔi更新每個子問題πi, i=1,…,Nπi, i=1,…,N,如下:

πi=1,if Δi>0.001πi=1,if Δi>0.001  πi=(0.95+0.05×Δi0.001)×πi,otherwiseπi=(0.95+0.05×Δi0.001)×πi,otherwise

最後,在步驟4,若達到預定義的最大適應值評估次數,演算法終止。

VI. 基於2-Tch的一元R2R2指標

為證實所提演算法的有效性,本節介紹了一種基於2-Tch的R2R2指標。R2R2首先由Hanson與Jaszkiewicz【15】在1998年提出。最近,R2R2指標日益吸引到了研究興趣【33】-【38】。R2R2指標的大多數研究【15】,【34】-【38】是基於傳統的Tchebycheff分解的,少數【33】基於改進的Tchebycheff分解。然而,基於這兩種Tchebycheff分解方法的R2R2指標的幾何屬性並不易懂。在這裡,具有更清晰的幾何屬性的新的R2R2指標被提出以估計超體積度量,如下:

R2tch2(A|z∗)=∫λ∈ΛminF(x)∈A{g2tch(F(x)|λ,z∗)}du∫ΛduR22tch(A|z∗)=∫λ∈ΛminF(x)∈A{g2tch(F(x)|λ,z∗)}du∫Λdu (18)

其中

Λ={λ=(λ1,…,λm)|λi≥0, i=1,…,m, ∥λ∥2=1}Λ={λ=(λ1,…,λm)|λi≥0, i=1,…,m, ‖λ‖2=1}

且dudu為在ΛΛ上的Lebesgue度量【39】。若沒有決策者(DM)的參考資訊,可以合理地假定方向向量λλ服從ΛΛ上的一個均勻分佈。∫Λdu∫Λdu等於2−m2−m倍的mm維單位超球的表面積,因為ΛΛ為單位超球表面在第一象限的部分,其中,mm為目標函式的數目。子問題目標函式g2tch(F(x)|λ,z∗)g2tch(F(x)|λ,z∗)可看作為DM的一個效用函式/參照【20】。給定種群AA的所有個體中的選擇權,DM傾向於選擇具有minF(x)∈A{g2tch(F(x)|λ,z∗)}minF(x)∈A{g2tch(F(x)|λ,z∗)}的那一個,示於圖9(a)。R2tch2(A|z∗)R22tch(A|z∗)越小,DM所期望的效用/參照就越好。

這裡寫圖片描述

所提出的R2tch2R22tch度量的幾何屬性示於圖9(b)。尤其,一個點P¯¯¯¯iP¯i被引入以便於minF(x)∈A{g2tch(F(x)|λi,z∗)}minF(x)∈A{g2tch(F(x)|λi,z∗)}的計算,即:

minF(x)∈A{g2tch(F(x)|λi,z∗)}=∥P¯¯¯¯i−z∗∥2minF(x)∈A{g2tch(F(x)|λi,z∗)}=‖P¯i−z∗‖2

很容易證明:

R2tch2(A|z∗)≈∑Mi=1minF(x)∈A{g2tch(F(x)|λi,z∗)}MR22tch(A|z∗)≈∑i=1MminF(x)∈A{g2tch(F(x)|λi,z∗)}M  =∑Mi=1∥P¯¯¯¯i−z∗∥2M=∑i=1M‖P¯i−z∗‖2M

其中,MM為方向向量集的大小。因此,所提出的R2tch2(A|z∗)R22tch(A|z∗)指標的幾何屬性實際上為連線z∗z∗與P¯¯¯¯iP¯i的線段的平均長度。P¯¯¯¯iP¯i的分佈很適合估計集A={x1,x2,x3,x4}A={x1,x2,x3,x4}的超體的表面。按【35】的建議,R2tch2(A|z∗)R22tch(A|z∗)能夠用於估計集AA的超體積。(20)中的一個簡化的形式的解釋提供於補充材料的附錄A中。如補充材料的附錄B所證明,所提出的一元指標R2tch2R22tch(DM所期望的效用/參考)是對於Pareto佔優嚴格單調的,這對於一種評估指標【40】是必要的。

這裡寫圖片描述

基於2-Tch的R2R2指標對於另外兩種基於傳統Tchebycheff分解和改進的Tchebycheff分解的指標的優勢示於圖10。通過分別用gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)與gmtch(F(x)|w,z∗)gmtch(F(x)|w,z∗)替換(18)中的g2tch(F(x)|λ,z∗)g2tch(F(x)|λ,z∗),可以令Rtch2(A|z∗)R2tch(A|z∗)與Rmtch2(A|z∗)R2mtch(A|z∗)分別表示這兩種指標。圖10展示了R2tch2(A|z∗)R22tch(A|z∗),Rtch2(A|z∗)R2tch(A|z∗)與Rmtch2(A|z∗)R2mtch(A|z∗)在一個雙目標優化問題中的幾何含義。R2tch2(A|z∗)R22tch(A|z∗),Rtch2(A|z∗)R2tch(A|z∗)與Rmtch2(A|z∗)R2mtch(A|z∗)分別為從理想點z∗z∗到曲線1-3的平均距離。可以從圖10(a)看出,R2tch2(A|z∗)R22tch(A|z∗)表示從理想點z∗z∗到非佔優解集的超體表面的的平均距離。相比而言,Rtch2(A|z∗)R2tch(A|z∗)與Rmtch2(A|z∗)R2mtch(A|z∗)均不能表明與非佔優解集的分佈的直觀關係,示於圖10(b)和(c)中。

VII. 實驗研究

這裡寫圖片描述 這裡寫圖片描述 這裡寫圖片描述

這裡寫圖片描述 這裡寫圖片描述

這裡寫圖片描述 這裡寫圖片描述

這裡寫圖片描述 這裡寫圖片描述

這裡寫圖片描述

參考文獻

這裡寫圖片描述 這裡寫圖片描述 這裡寫圖片描述 這裡寫圖片描述