Java按位元組數擷取字串

阿新 • • 發佈：2019-01-26

1、擷取字串，若是遇到不完整的中文，則捨棄掉那部分中文資訊

碰到可能會擷取漢字的情況，當然是要不能截取出亂碼來，就是不能對整個漢字擷取一半。如"我ABC漢字d"這個字串，擷取５個位元組的時候，應該是"我ABC"，而擷取８個位元組的時候，應該是"我ABC漢"，而不應該是"我ABC漢？"，其中"？"為半個漢字，可理解為向前擷取

package com.lxh.ser.test;

import java.io.UnsupportedEncodingException;

public class SubStrTest {
	
	private static final String DEFAULT_ENCODING = "GBK";
	
	public static void main(String[] args) throws UnsupportedEncodingException {
		String str = "我ABC漢字d";
		for (int i = 0; i < str.getBytes(DEFAULT_ENCODING).length; i++) {
			System.out.println("i: " + i + "  " + subStr(str, i));
		}
	}

	/**
	 * @param str 需要擷取的字串
	 * @param subSLength 需要擷取的位元組數
	 * @return 擷取完成的字串
	 * @throws UnsupportedEncodingException
	 */
	public static String subStr(String str, int subStrLength) throws UnsupportedEncodingException {
		if (null == str) {
			return "";
		}
		// 擷取位元組數
		int tempSubLength = subStrLength;
		// 擷取的子串
		String subStr = str.substring(0, str.length() < subStrLength ? str.length() : subStrLength);
		// 擷取子串的位元組長度
		int subStrByetsL = subStr.getBytes(DEFAULT_ENCODING).length;
		// 比較擷取後的字串位元組數大於需要擷取的自己數，說明擷取的字串中包含有漢字並且擷取後的位元組數大於需要的位元組數
		while (subStrByetsL > tempSubLength) {
			int subSLengthTemp = --subStrLength;
			// 再少擷取一個字元
			subStr = str.substring(0, subSLengthTemp > str.length() ? str.length() : subSLengthTemp);
			subStrByetsL = subStr.getBytes(DEFAULT_ENCODING).length;
		}
		return subStr;
	}
}

Java按位元組數擷取字串

1、擷取字串，若是遇到不完整的中文，則捨棄掉那部分中文資訊碰到可能會擷取漢字的情況，當然是要不能截取出亂碼來，就是不能對整個漢字擷取一半。如"我ABC漢字d"這個字串，擷取５個位元組的時候，應該是"我ABC"，而擷取８個位元組的時候，應該是"我ABC漢"，而不應該是"我A

Java按位元組數擷取字串（防止中文被截成一半）

Web應用程式在瀏覽器中顯示字串時，由於顯示長度的限制，常常需要將字串擷取後再進行顯示。但目前很多流行的語言，如C#、Java內部採用的都是 Unicode 16（UCS2）編碼，在這種編碼中所有的字元都是兩個字元，因此，如果要擷取的字串是中、英文、數字混合的，就會產生問

JAVA按指定的位元組數擷取字串

/** * 按指定的位元組數擷取字串（一箇中文字元佔3個位元組，一個英文字元或數字佔1個位元組） * @param sourceString 源字串 * @param cutBytes 要擷取的位元組數 * @return */ public sta

Java實現按位元組長度擷取字串的方法

Java實現按位元組長度擷取字串的方法個人實踐結果: Web應用程式在瀏覽器中顯示字串時，由於顯示長度的限制，常常需要將字串擷取後再進行顯示。但目前很多流行的語言，如C#、Java內部採用的都是 Unicode 16（UCS2）編碼，在這種編碼中所有的字元都是兩個字

Java：根據位元組數擷取字串，但是漢字不能擷取半個。

擷取字串指定指定位元組數的內容，如果指定的位元組數在漢字的中間，漢字不能擷取部分，只擷取前面的內容。package com.lcx.test; import java.io.UnsupportedEncodingException; /** * *

按位元組長度擷取字串

有時我們需要按照位元組長度來擷取字串，但是又不希望把中文給擷取散。下面提供一下utf-8的擷取方法： /** * 按位元組長度擷取字串 * @param orgin 需要擷取的字串 * @param length 位元組長度 * @param charsetName 編碼 * @return 擷取後的

JQuery 根據位元組數擷取字串（）

功能：在網頁中顯示過長的字串，擷取指定長度，結尾新增省略號。例如： testStr = "測試1字串"; autoAddEllipsis(testStr, 1); // "測..." autoAddEllipsis(testStr, 2); // "測..." autoA

java按位元組擷取字串

首先分編碼格式，gbk和gb2312公用一套方案，，而u8是另一套。為什麼呢，因為gbk和gb2312是兩個位元組表示一個漢字，前者兩個位元組的值都是負數，後者第二個數有時為正，比如（琲bei）那u8呢，是三個位元組表示一個漢字，所以判斷條件比gbk多了一點。

Java 按位元組擷取字串

public class MyTest1 { @Test public void test() { String s = "112我似そして懂12非懂2"; s = "てそしてててて

java 按位元組讀寫二進位制檔案（Base64編碼解碼）

最近在做專案時遇到這樣一個需求：依次讀取本地資料夾裡所有檔案的內容，轉為JSON，傳送到ActiveMQ的訊息佇列, 然後從MQ的訊息佇列上獲取檔案的資訊，依次寫到本地。常見的檔案型別，比如.txt 和.png等檔案的讀寫並不難。但是，我剛才所提到的需求，如果用常規的方法去讀寫，比如按位元組讀取檔案內容

MySQL 按指定分隔符擷取字串函式substring_index

1 需求類別欄位ctgr中的值是連在一起的，入庫時需要分割開來，方便查詢。資料如下所示： 2 方法使用 MySQL 提供的字串分割函式 SUBSTRING_INDEX 函式可以方便的實現需求。函

Java按位元組讀寫二進位制檔案

java 按位元組讀寫二進位制檔案（Base64編碼解碼）最近在做專案時遇到這樣一個需求：依次讀取本地資料夾裡所有檔案的內容，轉為JSON，傳送到ActiveMQ的訊息佇列, 然後從MQ的訊息佇列上獲取檔案的資訊，依次寫到本地。常見的檔案型別，比如.txt

Java的中英文混合擷取字串的問題解決方法

Java預設的獲取一個字元的長度（不管是否是中英文）都是作為一個位元組來處理，但是插入資料庫（Oracle）時中文卻佔了2個位元組，這點搞得人很苦惱。在網上搜索時，找到兩種好的解決方案，這裡進行了修改，程式碼如下： package com.core.utils; imp

java 中利用subString 擷取字串中第三個"/"後面的內容，並將/用>代替

private String extractString(String s){ for(int i = 0; i < 3; i++){ s = s.substring(s.indexOf("/")+1 ); }

C++按指定模式擷取字串函式

char *source="hello world ni hao"; char *c=strtok(s,"."); while(c!=NULL) { cout<<s; c=strtok(NULL,"."); } 輸出為helloworldnihao

C語言實現按分隔符來擷取字串

問題描述：我們的系統通過Socket網路通訊往linux伺服器上傳送資料，伺服器上接收的資料格式是以逗號隔開的字串。我們需要將這個字串按逗號作為分隔符來擷取。解決方法：使用C語言中的strtok()函式實現程式碼實現（下面程式碼的功能是將字串"now , is the

java按位元組方式讀檔案

java讀檔案 /* Readfile.java 讀取檔案的內容，並將原樣輸出至螢幕上使用方法：java Readfile 檔名 */ import java.io.*; public class Readfile { public static void main(

java 字串擷取指定長度位元組數

轉自：https://www.cnblogs.com/jiyanle/p/5161533.html /** * 返回擷取指定長度位元組數後的字串,多餘部分用“...”代替 * * @作者 jiyanle * @日期 2014-7-6 * @param strs * @param l

【每天演算法4】編寫一個擷取字串的函式，輸入為一個字串和位元組數，輸出為按位元組擷取的字串。

題目: 編寫一個擷取字串的函式，輸入為一個字串和位元組數，輸出為按位元組擷取的字串。但是要保證漢字不被截半個，如“我ABC”4，應該截為“我AB”，輸入“我ABC漢DEF”，6，應該輸出為“我ABC”而不是“我ABC+漢的半個”。 package com.sw.su

編寫一個擷取字串的函式，輸入為一個字串和位元組數，輸出為按位元組擷取的字串。但是要保證漢字不被截半個。

題目：編寫一個擷取字串的函式，輸入為一個字串和位元組數，輸出為按位元組擷取的字串。但是要保證漢字不被截半個，如“我ABC”4，應該截為“我AB”，輸入“我ABC漢DEF”，6，應該輸

Java按位元組數擷取字串

相關推薦