C++ 對字串處理方式整理

阿新 • • 發佈：2019-01-05

判斷字元是英文還是漢字

/*
brief 判斷字元是英文還是漢字
param ch 字元（位元組）
return true：是英文；false：是中文
*/
static bool isEnglishChar(char ch)
{
    /*漢字的三個位元組（有些編碼格式是兩個位元組）的最高為都為1,這裡採用判斷最高位的方法
    將ch位元組進行移位運算，右移8位，這樣，如果移位後是0，
    則說明原來的位元組最高位為0，不是1那麼也就不是漢字的一個位元組
    */
    if (~(ch >> 8) == 0)
    {
        return false;  //代表不是漢字 

    }
    return true;
}

判斷字元是英文還是漢字

//是否是漢字
static bool IsChinese(std::string strBuffer)
{
    if (strBuffer == "")
    {
        return false;
    }
    for (int i = 0; i < strBuffer.length()-1; i++)
    {
        if (!isEnglishChar(strBuffer.at(i)))
        {
            return true;
        }
    }
    return 
 false;
}

獲取剪下排除emoji表情的字串

//獲取剪下排除emoji表情的字串
static std::string GetStringByCutEmoji(std::string strValue)
{
    int size = strValue.size();
    std::string result = "";
    if (size > 0)
    {
        for (int i = 0; i < size; i++)
        {
            //是否是英文
            if (isEnglishChar(strValue[i]))
            {
                result.push_back(strValue[i]);
            }
            else 

            {
                if ((unsigned)(strValue[i] & 0xf0) == 0xe0)
                {
                    for (int j = 0; j < CHINESE_CHAR_LENGTH_UTF8; ++j)
                    {
                        result.push_back(strValue[i + j]);
                    }
                    i += CHINESE_CHAR_LENGTH_UTF8 - 1;
                }
            }
        }
    }
    return result.c_str();
}

擷取字串

/*
brief 擷取字串
param start 起始下標，從1開始
param end   結束下標
param isNeedPoint 是否需要在末尾新增“...”
return 擷取之後的字串
*/
static std::string CutStringUtil(std::string util,int start, int end, bool isNeedPoint)
{
    //CCLOG("util = %d", util.length());
    util = GetStringByCutEmoji(util);
    if ( util.length() <= 0 || start >= end )
        return util;

    std::vector<std::string> _result;
    int i = 0;
    while (i < util.length())
    {
        if (!isEnglishChar(util.at(i)))
        {
            _result.push_back(util.substr(i, CHINESE_CHAR_LENGTH_UTF8));  // 一個漢字三個位元組
            i = i + CHINESE_CHAR_LENGTH_UTF8;
        }
        else
        {
            _result.push_back(util.substr(i, 1));  // 一個英文一個位元組
            i = i + 1;
        }
    }

    if (start >= 1 && _result.size() <= start)return util;

    // 容錯處理，如果end大於字串長度，則捨棄多餘部分
    end = _result.size() >= end ? end : _result.size();
    std::string temp = "";
    //直接從_result裡取即可
    int max = end * 2;
    int curValue = 0;
    int enIdx = 0;
    for (int i = start; i < end; i++)
    {
        if (i > _result.size() - 1 || curValue >= max)
        {
            break;
        }
        temp += _result[i];

        //CCLOG("_result[%d] = %s", i, _result[i].c_str());
        if (!IsChinese(_result[i].c_str()))
        {
            curValue++;
            if (++enIdx % 2 == 0)
                end++;
        }
        else
        {
            curValue += 2;
        }
    }

    // 如果字串太長，在末尾新增“...”
    if (isNeedPoint)
    {
        if (_result.size() > end)
        {
            temp += "...";
        }
    }
    //CCLOG("temp = %s", temp.c_str());
    return temp;
}

//判斷是不是整形
static bool IsINT(const char *str)
{
    for (int i = 0; i < strlen(str); i++)
    if (str[i] < '0' || str[i] > '9')
        return false;
    return true;
}

C++ 對字串處理方式整理

判斷字元是英文還是漢字 /* brief 判斷字元是英文還是漢字 param ch 字元（位元組） return true：是英文；false：是中文 */ static bool isEngli

C 語言字串處理方式積累

寫在前面：本文主要用來積累字串處理的各種方式。正文： 1、目的：函式輸入一個字串，要求去掉字串中的行首和行尾的空格後輸出。實現函式和測試程式碼如下： #include <

C/C++對字串常量的處理策略

#include<stdio.h> char *a="Hello"; extern void func(); int main() { char *b="Hello"; ch

(C/C++學習)14.C語言字串處理函式(二)

說明：上節著重解釋了字串處理的庫函式處理，這節將針對一些常用的需求，進行非庫函式的處理。一.去除某一個字串中的某個字元 1.去除字串右邊的空格 1 void trimStrRightSpace(char * str) 2 { 3 while(*str) 4 s

201403-3命令列選項（c++，字串處理）

試題編號： 201403-3 試題名稱：命令列選項時間限制： 1.0s 記憶體限制： 256.0MB 問題描述：問

C語言字串處理

//輸入一段字串，無論是否有重複字母出現， //都只打印出現過的小寫字母，並按照小寫字母順序列印。 //如輸入qewqwr322rqw<>211qESFSSEraZz，列印aeqrwz） #include <stdio.h> void fun(); voi

14. C語言 -- 字串處理函式

本部落格主要內容為 “小甲魚” 視訊課程《帶你學C帶你飛》【第一季】學習筆記，文章的主題內容均來自該課程，在這裡僅作學習交流。在文章中可能出現一些錯誤或者不準確的地方，如發現請積極指出，十分感謝。也歡迎大家一起討論交流，如果你覺得這篇文章對你有所幫助，記得評論、點贊哦　～(｡

常用的c語言字串處理函式

1.獲取一個字串 char *p = fgets(buf, size, stdin); 2.字串查詢 ret = strstr(cmd, "test"); if(ret != NULL)

C語言字串處理基礎函式（一）

1.strlen()函式功能：函式返回字串str 的長度( 即空值結束符之前字元數目，不包括控制結束符)。語法： #include <string.h> size_t strlen( char *str ); 例子： #include <stdio

P3880[JLOI2008]提示問題洛谷 (C++)(模擬)(字串處理)

題意很好理解，但這道題實在太考細節了... 隨便亂打的一個測試樣例竟然幫我找到第八組測試樣例過不去的原因？？hhhh... 有個小地方忘寫了導致第十組樣例一直WA... 為各位dalao獻上蒟蒻的程式碼，詳情請看註釋。 #include <iostream> #

C語言—字串處理函式

1、puts(字串陣列) ，gets(字串陣列) 2、strcat(字串陣列1，字串陣列2) 把字串陣列2接到字串陣列1中。 3、strcpy(字串陣列1，字串陣列2) 把字串陣列2複製到字串陣列1中。 strncpy(字串陣列1,字串陣列2,n)，將字串2中前n個

C++中字串處理函式

一、C++中substr函式的用法#include<string> #include<iostream> using namespace std; main() { string s("12345asdf"); string a=s.substr(0

【mysql】MySQL以逗號隔開的字串查詢方式整理

1 單個值查詢使用函式進行處理，FIND_IN_SET()實用 SELECT * FROM `by_info` WHERE FIND_IN_SET('7',type_id); 2 多個值模糊查詢，使用正則，此方式相當於 ( LIKE '%1%' OR LIK

Codeforces 1099 C. Postcard-字串處理(Codeforces Round #530 (Div. 2))

C. Postcard time limit per test 1 second memory limit per te

[C++]對字串向量排序

讓字串向量首先按字串長度進行排序，長度短的在前，長的在後。如果長度相等則按字典序排序，並移除重複的字串。去重複並按字典序排序： void elimDumps(vector<string> &words) { // 按字典序排序 sort(words

C++和C對字串操作總結

一 c語言的字串 c語言中沒有字串這個資料型別，用兩種方法來表示字串，第一種是字元陣列char s[]，第二種是字元指標char *s，兩者有區別，不能任務是一樣的,區別如下（不完整，後期再慢慢補充） 1 初始化和賦值 char[]字串賦值c語言中可以用

c，c++中字串處理函式strtok，strstr，strchr，strsub

函式原型：char *strtok(char *s, char *delim); 函式功能：把字串s按照字串delim進行分割，然後返回分割的結果。函式使用說： 1.strtok函式的實質上的處理是，strtok在s中查詢包含在delim中的字元並用NULL(’/0′)來替換,直到找遍整個字串。這句

C語言-字串處理-識別一個字串的子字串-然後擷取這個字串的後面一段

我怎麼從一個很長很長的字串中，識別到某個字串之後，開始從這個字串擷取到這個原字串的最後一位？這個問題是我同事問我的，當時我一臉懵逼，然後想到一個數組，然後對比查詢，再然後獲取位置，然後直接指標相減。開發遇到的小問題。記錄下來，便於自己思維總結。後面想起前面的資料庫開發，只想喊

Java-字串處理的整理

內容：(1)連線字串(2)獲取字串資訊(3)字串操作(4)格式化字串 String類：形如“ABCD”，“你好” 宣告：String str=null;//String指定該變數為字串型別，str識別符號，表示字串變數的名稱，null未初始化建立：

[C/C++]_[字串處理]_[過濾出HTML標籤的屬性值]

typedef struct ElementAttribute ElementAttribute; struct ElementAttribute { const char* name; con

C++ 對字串處理方式整理

判斷字元是英文還是漢字

判斷字元是英文還是漢字

獲取剪下排除emoji表情的字串

擷取字串

相關推薦