1. 程式人生 > >[LeetCode] Longest Substring with At Most Two Distinct Characters 最多有兩個不同字元的最長子串

[LeetCode] Longest Substring with At Most Two Distinct Characters 最多有兩個不同字元的最長子串

Given a string S, find the length of the longest substring T that contains at most two distinct characters.
For example,
Given S = “eceba”,
T is “ece” which its length is 3.

這道題給我們一個字串,讓我們求最多有兩個不同字元的最長子串。那麼我們首先想到的是用雜湊表來做,雜湊表記錄每個字元的出現次數,然後如果雜湊表中的對映數量超過兩個的時候,我們需要刪掉一個對映,比如此時雜湊表中e有2個,c有1個,此時把b也存入了雜湊表,那麼就有三對映射了,這時我們的left是0,先從e開始,對映值減1,此時e還有1個,不刪除,left自增1。這是雜湊表裡還有三對對映,此時left是1,那麼到c了,對映值減1,此時e對映為0,將e從雜湊表中刪除,left自增1,然後我們更新結果為i - left + 1,以此類推直至遍歷完整個字串,參見程式碼如下:

解法一:

class Solution {
public:
    int lengthOfLongestSubstringTwoDistinct(string s) {
        int res = 0, left = 0;
        unordered_map<char, int> m;
        for (int i = 0; i < s.size(); ++i) {
            ++m[s[i]];
            while (m.size() > 2) {
                if (--m[s[left]] == 0
) m.erase(s[left]); ++left; } res = max(res, i - left + 1); } return res; } };

我們除了用雜湊表來對映字元出現的個數,我們還可以對映每個字元最新的座標,比如題目中的例子"eceba",遇到第一個e,對映其座標0,遇到c,對映其座標1,遇到第二個e時,對映其座標2,當遇到b時,對映其座標3,每次我們都判斷當前雜湊表中的對映數,如果大於2的時候,那麼我們需要刪掉一個對映,我們還是從left=0時開始向右找,我們看每個字元在雜湊表中的對映值是否等於當前座標left,比如第一個e,雜湊表此時對映值為2,不等於left的0,那麼left自增1,遇到c的時候,雜湊表中c的對映值是1,和此時的left相同,那麼我們把c刪掉,left自增1,再更新結果,以此類推直至遍歷完整個字串,參見程式碼如下:

解法二:

class Solution {
public:
    int lengthOfLongestSubstringTwoDistinct(string s) {
        int res = 0, left = 0;
        unordered_map<char, int> m;
        for (int i = 0; i < s.size(); ++i) {
            m[s[i]] = i;
            while (m.size() > 2) {
                if (m[s[left]] == left) m.erase(s[left]);
                ++left;
            }
            res = max(res, i - left + 1);
        }
        return res;
    }
};

後來又在網上看到了一種解法,這種解法是維護一個sliding window,指標left指向起始位置,right指向window的最後一個位置,用於定位left的下一個跳轉位置,思路如下:

1. 若當前字元和前一個字元相同,繼續迴圈。

2. 若不同,看當前字元和right指的字元是否相同

    (1) 若相同,left不變,右邊跳到i - 1

    (2) 若不同,更新結果,left變為right+1,right變為i - 1

最後需要注意在迴圈結束後,我們還要比較res和s.size() - left的大小,返回大的,這是由於如果字串是"ecebaaa",那麼當left=3時,i=5,6的時候,都是繼續迴圈,當i加到7時,跳出了迴圈,而此時正確答案應為"baaa"這4個字元,而我們的res只更新到了"ece"這3個字元,所以我們最後要判斷s.size() - left和res的大小。

另外需要說明的是這種解法僅適用於於不同字元數為2個的情況,如果為k個的話,還是需要用上面兩種解法。

解法三:

class Solution {
public:
    int lengthOfLongestSubstringTwoDistinct(string s) {
        int left = 0, right = -1, res = 0;
        for (int i = 1; i < s.size(); ++i) {
            if (s[i] == s[i - 1]) continue;
            if (right >= 0 && s[right] != s[i]) {
                res = max(res, i - left);
                left = right + 1;
            }
            right = i - 1;
        }
        return max(s.size() - left, res);
    }
};

類似題目:

參考資料: