1. 程式人生 > >寬字節與多字節互相轉換

寬字節與多字節互相轉換

fun mes ide main 設置 def 允許 flags tom

這裏需要用到兩個函數:WideCharToMultiByteMultiByteToWideChar

前者是從寬字節轉換為多字節,後者則相反,是從多字節轉換為寬字節。下面介紹下這兩個函數:

WideCharToMultiByte

該函數可以映射一個unicode字符串到一個多字節字符串,執行轉換的代碼頁、接收轉換字符串、允許額外的控制等操作。

WideCharToMultiByte(
_In_ UINT CodePage,   // 指定執行轉換的代碼頁,這個參數可以為系統已安裝或有效的任何代碼頁所給定的值
_In_ DWORD dwFlags, // 一組位標記用以指出是否未轉換成預作或寬字符(若組合形式存在),是否使用象形文字替代控制字符,以及如何處理無效字符
_In_NLS_string_(cchWideChar) LPCWCH lpWideCharStr, // 指向將被轉換的unicode字符串 _In_ int cchWideChar, // 指定由參數lpWideCharStr指向的緩沖區的字符個數。如果這個值為-1,字符串將被設定為以NULL為結束符的字符串,並且自動計算長度 _Out_writes_bytes_to_opt_(cbMultiByte, return) LPSTR lpMultiByteStr,// 指向接收被轉換字符串的緩沖區    _In_ int cbMultiByte, // 指定由參數lpMultiByteStr指向的緩沖區最大值(用字節來計量)。若此值為零,函數返回lpMultiByteStr指向的目標緩沖區所必需的字節數,在這種情況下,lpMultiByteStr參數通常為NULL
_In_opt_ LPCCH lpDefaultChar, // 遇到一個不能轉換的寬字符,函數便會使用pDefaultChar參數指向的字符 _Out_opt_ LPBOOL lpUsedDefaultChar // 至少有一個字符不能轉換為其多字節形式,函數就會把這個變量設為TRUE );

需要註意最後兩個參數lpDefaultChar和pfUsedDefaultChar:只有當WideCharToMultiByte函數遇到一個寬字節字符,而該字符在uCodePage參數標識的代碼頁中並沒有它的表示法時,WideCharToMultiByte函數才使用這兩個參數。如果寬字節字符不能被轉換,該函數便使用lpDefaultChar參數指向的字符。如果該參數是NULL(這是大多數情況下的參數值),那麽該函數使用系統的默認字符。該默認字符通常是個問號。這對於文件名來說是危險的,因為問號是個通配符。pfUsedDefaultChar參數指向一個布爾變量,如果Unicode字符串中至少有一個字符不能轉換成等價多字節字符,那麽函數就將該變量置為TRUE。如果所有字符均被成功地轉換,那麽該函數就將該變量置為FALSE。當函數返回以便檢查寬字節字符串是否被成功地轉換後,可以測試該變量。

返回值:如果函數運行成功,並且cchMultiByte不為零,返回值是由 lpMultiByteStr指向的緩沖區中寫入的字節數;如果函數運行成功,並且cchMultiByte為零,返回值是接收到待轉換字符串的緩沖區所必需的字節數。如果函數運行失敗,返回值為零。

MultiByteToWideChar

該函數可以映射一個多字節字符串到一個unicode字符串

MultiByteToWideChar(
    _In_ UINT CodePage,  // 指定執行轉換的字符集,這個參數可以為系統已安裝或有效的任何字符集所給定的值
    _In_ DWORD dwFlags,  // 一組位標記用以指出是否未轉換成預作或寬字符(若組合形式存在),是否使用象形文字替代控制字符,以及如何處理無效字符。
    _In_NLS_string_(cbMultiByte) LPCCH lpMultiByteStr,  // 指向將被轉換字符串的字符。
    _In_ int cbMultiByte,  // 指定將被轉換的字符串中字節的個數。如果lpMultiByteStr指定的字符串以空字符終止,可以設置為-1(如果字符串不是以空字符中止,設置為-1可能失敗,可能成功),此參數設置為0函數將失敗。
    _Out_writes_to_opt_(cchWideChar, return) LPWSTR lpWideCharStr,  // 指向接收被轉換字符串的緩沖區
    _In_ int cchWideChar  // 指定接收被轉換字符串緩沖區的寬字符個數。若此值為零,函數返回緩沖區所必需的寬字符數,在這種情況下,lpWideCharStr中的緩沖區不被使用。
    );

返回值:如果函數運行成功,並且cchWideChar不為零,返回值是由lpWideCharStr指向的緩沖區中寫入的寬字符數;如果函數運行成功,並且cchWideChar為零,返回值是接收到待轉換字符串的緩沖區所需求的寬字符數大小。如果函數運行失敗,返回值為零。

/************************************************************************/
/* Project:    寬字節與多字節互相轉換                                        */
/* Author:    LandyTan                                                    */
/* Time:    2017/11/04                                                    */
/************************************************************************/


#include <iostream>
#include <Windows.h>
using namespace std;


char* _WTA(__in wchar_t* pszInBufBuf, __in int nInSize, __out char** pszOutBuf, __out int* pnOutSize);
wchar_t* _ATW(__in char* pszInBuf, __in int nInSize, __out wchar_t** pszOutBuf, __out int* pnOutSize);


int main()
{
    {
        char* pszIn = "Hello";
        wchar_t* pszOut = NULL;
        int nOutSize = 0;
        if (!_ATW(pszIn, strlen(pszIn), &pszOut, &nOutSize))
            cerr << "多字節轉寬字節失敗" << endl;
        else cout << "多字節:" << pszIn << "\t寬字節:" << pszOut << endl;
        delete[] pszOut;
        pszOut = NULL;
    }

    {
        wchar_t* pszIn = L"Hello";
        char* pszOut = NULL;
        int nOutSize = 0;
        if (!_WTA(pszIn, wcslen(pszIn), &pszOut, &nOutSize))
            cerr << "寬字節轉多字節失敗" << endl;
        else cout << "寬字節:" << pszIn << "\t多字節:" << pszOut << endl;
        delete[] pszOut;
        pszOut = NULL;
    }
    
    system("pause");
    return 0;
}


/************************************************************************/
/* Name:        _ATW                                                    */
/* Function:    多字節轉寬字節                                            */
/* Parameter list:                                                        */
/*                pszInBuf        被轉換的字符串                            */
/*                nInSize            字符串長度                                */
/*                pszOutBuf        接收轉換的字符串                            */
/*                pnOutSize        接收字符串的長度                            */
/************************************************************************/
wchar_t* _ATW(__in char* pszInBuf, __in int nInSize, __out wchar_t** pszOutBuf, __out int* pnOutSize)
{
    if(!pszInBuf || !pszOutBuf || !pnOutSize || nInSize <= 0)return NULL;
    *pnOutSize = MultiByteToWideChar(NULL, NULL, pszInBuf, nInSize, *pszOutBuf, 0);// 獲取待轉換字符串的緩沖區所需大小
    if(*pnOutSize == 0)return NULL;
    (*pnOutSize)++;
    *pszOutBuf = new wchar_t[*pnOutSize];
    memset((void*)*pszOutBuf, 0, sizeof(wchar_t) * (*pnOutSize));
    if(MultiByteToWideChar(NULL, NULL, pszInBuf, nInSize, *pszOutBuf, *pnOutSize) == 0)  // 這裏才是轉換
        return NULL;
    else return *pszOutBuf;
}


/************************************************************************/
/* Name:        _WTA                                                    */
/* Function:    寬字節轉多字節                                            */
/* Parameter list:                                                        */
/*                pszInBuf        被轉換的字符串                            */
/*                nInSize            字符串長度                                */
/*                pszOutBuf        接收轉換的字符串                            */
/*                pnOutSize        接收字符串的長度                            */
/************************************************************************/
char* _WTA(__in wchar_t* pszInBuf, __in int nInSize, __out char** pszOutBuf, __out int* pnOutSize)
{
    if(!pszInBuf || !pszOutBuf || !pnOutSize || nInSize <= 0)return NULL;
    *pnOutSize = WideCharToMultiByte(NULL, NULL, pszInBuf, nInSize, *pszOutBuf, 0, NULL, NULL);// 獲取待轉換字符串的緩沖區所需大小
    if(*pnOutSize == 0)return NULL;
    (*pnOutSize)++;
    *pszOutBuf = new char[*pnOutSize];
    memset((void*)*pszOutBuf, 0, sizeof(char)* (*pnOutSize));
    if (WideCharToMultiByte(NULL, NULL, pszInBuf, nInSize, *pszOutBuf, *pnOutSize, NULL, NULL) == 0) // 這裏才是轉換
        return NULL;
    else return *pszOutBuf;
}

寬字節與多字節互相轉換