1. 程式人生 > >程式設計師面試100題之九 求子陣列的最大和

程式設計師面試100題之九 求子陣列的最大和

                        題目:輸入一個整形陣列,數組裡有正數也有負數。陣列中連續的一個或多個整陣列成一個子陣列,每個子陣列都有一個和。求所有子陣列的和的最大值。要求時間複雜度為O(n)。

       例如輸入的陣列為1, -2, 3, 10, -4, 7, 2, -5,和最大的子陣列為3, 10, -4, 7, 2,因此輸出為該子陣列的和18。

       如果不考慮時間複雜度,我們可以枚舉出所有子陣列並求出他們的和。不過非常遺憾的是,由於長度為n的陣列有O(n2)個子陣列;而且求一個長度為n的陣列的和的時間複雜度為O(n)。因此這種思路的時間是O(n3)。

      很容易理解,當我們加上一個正數時,和會增加;當我們加上一個負數時,和會減少。如果當前得到的和是個負數,那麼這個和在接下來的累加中應該拋棄並重新清零,不然的話這個負數將會減少接下來的和。基於這樣的思路,我們可以寫出如下程式碼:

/*// Find the greatest sum of all sub-arrays// Return value: if the input is valid, return true, otherwise return falseint *pData,              // an arrayunsigned int nLength,    // the length of arrayint &nGreatestSum        // the greatest sum of all sub-arrays*/int start,end;bool FindGreatestSumOfSubArray
(int *pData, unsigned int nLength, int &nGreatestSum)
// if the input is invalid, return false if((pData == NULL) || (nLength == 0))  return falseint k=0int nCurSum = nGreatestSum = 0for(unsigned int i = 0; i < nLength; ++i) {  nCurSum += pData[i];  // if the current sum is negative, discard it
  if(nCurSum < 0)  {   nCurSum = 0;   k = i+1;  }  // if a greater sum is found, update the greatest sum  if(nCurSum > nGreatestSum)  {   nGreatestSum = nCurSum;   start = k;   end = i;  } } // if all data are negative, find the greatest element in the array if(nGreatestSum == 0) {  nGreatestSum = pData[0];  for(unsigned int i = 1; i < nLength; ++i)  {   if(pData[i] > nGreatestSum)   {    nGreatestSum = pData[i];    start = end = i;   }  } } return true;}

   討論:上述程式碼中有兩點值得和大家討論一下:

  •  函式的返回值不是子陣列和的最大值,而是一個判斷輸入是否有效的標誌。如果函式返回值的是子陣列和的最大值,那麼當輸入一個空指標是應該返回什麼呢?返回0?那這個函式的使用者怎麼區分輸入無效和子陣列和的最大值剛好是0這兩中情況呢?基於這個考慮,本人認為把子陣列和的最大值以引用的方式放到引數列表中,同時讓函式返回一個函式是否正常執行的標誌。
  •  輸入有一類特殊情況需要特殊處理。當輸入陣列中所有整數都是負數時,子陣列和的最大值就是陣列中的最大元素。

 方法二:程式設計之美2.14

/**  求最大子陣列和(程式設計之美2.14,返回下標及首尾不相連) ** author :liuzhiwei   ** date   :2011-08-17起始點與結束點下標如何來記錄:由於我要求起始點下標、結束點下標都靠前的子陣列,所以我們在動態規劃的時候最好從後向前遞推,這樣dp[i]表示的值就是以下標i為開始的最大子陣列的值,那麼當dp[i]與dp[j]相同時我們選取i,j中較小的下標作為起點**/int maxSum(int *arr, int n, int & start, int & end)  {    int i , temp , dp , max ;    dp = max = arr[n-1];    start = end = n-1;    temp = n-1;    for(i = n - 2 ; i >= 0 ; --i)    {        if(dp > 0)            dp += arr[i];        else        {            dp = arr[i];    //拋棄當前子序列            temp = i;        //開始新的子序列搜尋        }        if(dp > max)        //更新最大子序列        {            max = dp;            end = temp;            start = i;           //最大和增加,此時的i一定是最右端        }    }    return max;}//特殊測試用例 -10 -1 -4

另外一種從前往後遍歷的方法如下:

// 需要儲存起始點與結束點下標的時候,從前往後遍歷也是可以的int MaxSum(int *a , int n){    int tempstart = 0 , sum=0 , max = -1000;    int i , start , end;    start = end = 0;    for(i = 0 ; i < n ; ++i)    {        if(sum < 0)        {            sum = a[i];            tempstart = i;        }        else            sum += a[i];        if(sum > max)        {            max = sum;            start = tempstart;            end = i;        }    }    return max;}
拓展問題1:如果認為陣列是環形的,即首尾相接(下標n-1的元素後面的元素下標為0),求最大子段和。解析:我覺得這個問題要比第一個問題容易,有很多種方法解決。我介紹三種方法,但是其中一種我覺得有問題,但卻作為《程式設計之美》這本書的一道練習答案,也可能是我理解錯作者的演算法了,一會慢慢討論。方法一:這個問題的最優解一定是以下兩種可能。可能一:最優解沒有跨過a[n-1]到a[0],即原問題,非環形陣列。可能二:最優解跨過a[n-1]到a[0],新問題。對於第一種情況,我們可以按照簡單的動態規劃解法求得,設為max1;對於第二種情況,可以將原問題轉化為陣列的最小子段和問題,再用陣列全部元素的和減去最小子段和,那麼結果一定是跨過a[n-1]到a[0]情況中最大的子段和,設為max2。最終結果即為max1與max2中較大的那個。例1:有陣列6、-1、-6、8、2求得max1=10,max2=16,則取較大的max2作為結果。例2:有陣列-6、8、2、6、-1求得max1=16,max2=15,則取較大的max1作為結果。可能有些同學會對為什麼:陣列元素“sum - 最小子段和 = 跨過a[n-1]到a[0]情況中的最大子段和”這一點有些疑問。我們可以這樣理解:n個數的和是一定的,那麼如果我們在這n個數中找到連續的一段數,並且這段數是所有連續的數的和最小的,那麼“sum-最小子段和”的結果一定最大。故求得:跨過a[n-1]到a[0]情況中的最大子段和。完整程式碼如下:
//環形陣列求最大子陣列的和int MaxSum(int *a , int n)int i , sum , max1 , max2 , dp, min; dp = max1 = a[0]; for(i = 1 ; i < n ; ++i)   //最優解沒有跨過a[n-1]到a[0],即原問題,非環形陣列 {  if(dp < 0)   dp = a[i];  else   dp += a[i];  if(dp > max1)   max1 = dp; } sum = min = dp = a[0]; for(i = 1 ; i < n ; ++i)   //可以將原問題轉化為陣列的最小子段和問題,再用陣列全部元素的和減去最小子段和,那麼結果一定是跨過a[n-1]到a[0]情況中最大的子段和 {  if(dp > 0)   dp = a[i];  else   dp += a[i];  if(dp < min)   min = dp;  sum += a[i]; } max2 = sum - min;    //陣列全部元素的和減去最小子段和 return max1 > max2 ? max1 : max2;;     //返回一個較大值}
第一部分即求第一種情況的最大值max1(用變數Max代替),第二部分中最初tmp為最小子段和,然後tmp值為sum-tmp;最後Max取兩者較大的數。方法二:方法二將問題轉化成另外一個問題:既然一段數的首尾可以相接,那麼我們可以將陣列複製,並接到自己的後面,然後我們求新陣列的最大子陣列的和,但這裡要限制一個條件,就是最大子陣列的長度不可以超過n。這樣我們就把問題轉化為拓展問題3了,我會在第三部分中介紹。方法三:方法三是《程式設計之美》這本書中介紹的,詳細見188頁,但是我覺得這種演算法是錯誤的,可能是我理解作者的思路有問題,我將解法抄在下面,並舉出一個反例,有興趣討論的同學希望能給我留言。摘自《程式設計之美》P188:如果陣列(A[0],A[1],A[2],......,A[n-1])首尾相鄰,也就是我們允許找到一段數字(A[i],A[i+1],......A[n-1],A[0],A[1],....,A[j]),使其和最大,怎麼辦?(1)解沒有跨過A[n-1] 到A[0] (原問題)。(2)解跨過A[n-1]到A[0]。對於第2種情況,只要找到從A[0]開始和最大的一段(A[0],…,A[j])(0<=j<n),以及以A[n-1]結尾的和最大的一段(A[i],…,A[n-1])(0<=i<n),那麼,第2種情況中,和的最大值M_2為:M_2=A[i]+…+A[n-1]+A[0]+…+A[j]如果i <= j,則M_2=A[0]+…+A[n-1]否則M_2=A[0]+…+A[j]+A[i]+…+A[n-1]最後,再取兩種情況的最大值就可以了,求解跨過A[n-1]到A[0]的情況只需要遍歷陣列一次,故總時間複雜度為O(N)+O(N)=O(N)。解析:分為兩種情況討論是沒有問題的,但是對於第2種情況的解法我認為是錯誤的,反例:求5個元素的陣列6,-1,-6,8,2的最大子陣列和:M_1為10,但是如果利用上面的方法,M_2求得的結果為9,因為從A[0]開始和最大的一段即為A[0],…,A[n-1]為9,以A[n-1]結尾的和最大的一段(A[i],…,A[n-1])為A[n-1],由於這兩段有相交,故M_2= A[0]+…+A[n-1]。最終結果為9,取兩種情況較大的,那麼結果為10。但是正確結果明顯為16。出現這種結果的原因:從A[0]開始和最大的一段雖然求的沒有錯,但是我們希望求得的結果並非是這一段,我們希望求得A[0]這一段,這樣就不會出現兩段相交的情況。 在第二部分中,我分析了兩個拓展問題,後面兩個拓展問題我會在第三部分中分析。 如果我上面有寫的不對的地方或者你有更好的方法,希望能提出來,互相學習嘛。拓展問題2:有一個整數數列,其中有負數、正數, 其中連續的幾個數求和,求和的絕對值最大的數字串。分析思路

最大子矩陣和

#include <iostream>#include <cstdio>using namespace std;#include <memory.h>int a[102][102];int maxSubArray(int *arr, int len)       //最大子序列和int i,sum=arr[0],b=0for(i=0;i<len;++i) {  if(b>0)   b+=arr[i];  else   b=arr[i];  if(b>sum)   sum=b; } return sum;}int maxSubMatrix(int n, int m,int array[102][102])int i,j,h,max,sum=-100000int b[102]; for(i=0;i<n;i++) {  memset(b,0,sizeof(b));       //初始化b[]  for(j=i;j<n;j++)             //把第i行到第j行相加,對每一次相加求出最大值  {   for(h=0;h<m;h++)   {    b[h]+=array[j][h];    //二維陣列壓縮成一維陣列,然後求最大子序列和   }   max=maxSubArray(b,h);    if(max>sum)    sum=max;  } } return sum;}int main(void)int n,i,j; while(scanf("%d",&n)!=EOF) {    for(i=0;i<n;i++)  {   for(j=0;j<n;j++)    scanf("%d",&a[i][j]);  }  printf("%d\n",maxSubMatrix(n,n,a)); } return 0;}