1. 程式人生 > >string的字串替換函式,類似於CString的Replace

string的字串替換函式,類似於CString的Replace

標準C++中的string中的函式不多,沒有CString的功能強大,但是如果想在Unicode編碼下使用多位元組,就不能使用CString,於是自己寫了一個類似於CString的Replace函式。
string replace( const string& inStr, const char* pSrc, const char* pReplace )
{
     string str = inStr;
    string::size_type stStart = 0;
    string::iterator iter = str.begin();
    while( iter != str.end() )
    {
        // 從指定位置 查詢下一個要替換的字串的起始位置。
        string::size_type st = str.find( pSrc, stStart );
        if ( st == str.npos )
        {
            break;
        }
        iter = iter + st - stStart;
        // 將目標字串全部替換。
        str.replace( iter, iter + strlen( pSrc ), pReplace );
        iter = iter + strlen( pReplace );
        // 替換的字串下一個字元的位置
        stStart = st + strlen( pReplace );
    }
    return str;
}

上述方法在執行replace( "h h h h h h h h h h h h h h h h h h h ", " ", "  " )時出現問題。
下面再列出一種方法:
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
    string strSrc = inStr;
    string::size_type pos=0;      
    string::size_type srclen = strlen( pSrc );       
    string::size_type dstlen = strlen( pReplace );       
    while( (pos=strSrc.find(pSrc, pos)) != string::npos)
    {               
        strSrc.replace(pos, srclen, pReplace);               
        pos += dstlen;       
    }
    return strSrc;
}

補充,經過測試,上面方法再執行,replace( “暴”, "//","==" )時,依然會遇到問題。
在日文系統上,因為“暴”佔兩個位元組,而"//"只佔一個位元組,但與“暴”的低位位元組ASCII碼相同。
而string的Find函式,是按照位元組比較的,所以,將這個位元組替換了,導致文字替換出現問題。
於是考慮到不應該按位元組比較,應該按字元比較,測試發現,CString的替換函式沒有問題,於是考慮按照CString的方法重新寫一個replace函式。
程式碼如下:
因為CString在_MBCS和_UNICODE下是變寬的,而我寫的replace函式,只針對string。
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
    string strSrc = inStr;
    LPSTR lpch = ( CHAR* )strSrc.c_str();
    int   nOldLength = strlen( lpch );
    int      nSourceLen = strlen(pSrc);
    if (nSourceLen == 0)
    {
        return lpch;
    }
    int   nReplacementLen = strlen(pReplace);
    LPSTR lpszStart = lpch;
    LPSTR lpszEnd = lpszStart + nOldLength;
    LPSTR lpszTarget;

    // 先列出判斷替換字元是否存在的方法, 但在此函式中不使用這段程式碼。
    /*  
    // judge whether exist
    while (lpszStart < lpszEnd)
    {
        while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
        {
            nCount++;
            lpszStart = lpszTarget + nSourceLen;
        }
        lpszStart += strStart.length() + 1;
    }
    *//
   
    // 下面是替換的程式碼。
    while (lpszStart < lpszEnd)
    {
        while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
        {
            int nBalance = nOldLength - (lpszTarget - lpch + nSourceLen);
            memmove(lpszTarget + nReplacementLen, lpszTarget + nSourceLen,
                nBalance * sizeof(CHAR));
            memcpy(lpszTarget, pReplace, nReplacementLen*sizeof(CHAR));
            lpszStart = lpszTarget + nReplacementLen;
            lpszStart[nBalance] = '/0';
            nOldLength += (nReplacementLen - nSourceLen);
        }
        lpszStart += strlen(lpszStart) + 1;
    }
    return lpch;
}

 此方法最關鍵的是_mbsstr函式,在"MBSTRING.H"標頭檔案中宣告。