Go語言中的字串處理
1 概述
字串,string,一串固定長度的字元連線起來的字元集合。Go語言的字串是使用UTF-8編碼的。UTF-8是Unicode的實現方式之一。
Go語言原生支援字串。使用雙引號("")或反引號(``)定義。
雙引號:"", 用於單行字串。
反引號:``,用於定義多行字串,內部會原樣解析。
示例:
// 單行 "心有猛虎,細嗅薔薇" // 多行 ` 大風歌 大風起兮雲飛揚。 威加海內兮歸故鄉。 安得猛士兮守四方! `
字串支援轉義字元,列表如下:
"\u5eb7"
Go語言中字串的頂層結構是由一個指標和長度構成的。使用 unsafe.Sizeof("") 會得到16長度,其中8個位元組是指標,指向字串的記憶體地址,8個是儲存字串的長度。
2 常規操作
以下是針對字串的操作總結,主要來自於Go語言的API的說明和測試。
[]索引訪問
可以使用[index]方式,訪問到字串中的字元。可以訪問,不可以修改。
s := "Hank" fmt.Printf("%c", s[2]) // 返回 n
unicode/utf8 包
多位元組字元的處理,請參考 unicode/utf8 包的相關說明。
例如:
import "unicode/utf8" utf8.RuneCountInString("小韓說課") // 返回 4
len(),字串佔用的位元組數
utf-8
是變長字符集,英文標點佔用1個位元組,中文佔用3個位元組。
len("Hank康") // 返回 7
+,字串連線"
"Hello" + " " + "Hank"
==, >, <
字串比較,比較機制是字元的對稱比較。
"abc" > "bbcd" // 結果為false
strings.Compare(a, b string) int
字串比較,比較機制是字元的對稱比較。返回值為:
- 0,表示a == b
- -1,表示a < b
- 1,表示a > b
strings.Compare("abc", "abcd") // 返回 1
strings.Contains(s, substr string) bool
檢測字串 substr 是否在 s 中。
strings.Contains("foobar", "foo") // 返回 true strings.Contains("fobar", "foo") // 返回 false
strings.ContainsAny(s, chars string) bool
檢測字串 chars 的中任意字元是否出現在 s 中。
fmt.Println(strings.ContainsAny("Hank", "kang")) // 返回 true fmt.Println(strings.ContainsAny("Hank", "go")) // 返回 false
strings.ContainsRune(s string, r rune) bool
檢測 rune字元是否出現在 s 中。
strings.ContainsRune("Hank", 'a') // 返回 true strings.ContainsRune("Hank", 97) // 返回 true,a的碼值97
strings.Count(s, substr string) int
統計字串 s 中非重疊substr的數量。若統計空字串"",會返回 s 的長度加1。
strings.Count("HanZhongKang", "n") // 返回 3 strings.Count("Hank", "") // 返回 5,"Hank"每個rune的前後都算
strings.EqualFold(s, t string) bool
檢測字串 s 和 t 在忽略大小寫的情況下是否相等。
strings.EqualFold("Hank", "hank") // 返回 true
strings.Fields(s string) []string
返回使用空格分割的字串 s,結果為切片。
strings.Fields("Han Zhong Kang") // 返回 []string, ["Han", "Zhong", "Kang"]
strings.FieldsFunc(s string, f func(rune) bool) []string
使用函式確定分隔符,來分割字串 s。結果是切片。
// ,|/ 都是分隔符 fn := func(c rune) bool { return strings.ContainsRune(",|/", c) } strings.FieldsFunc("go,python,c++/c,Js|JavaScript", fn) // 返回 ["go" "python" "c++" "c" "Js" "JavaScript"]
strings.HasPrefix(s, prefix string) bool
檢測字串 s 是否以字串 prefix 作為字首。
strings.HasPrefix("Gopher", "Go") // 返回 true
strings.HasSuffix(s, suffix string) bool
檢測字串 s 是否以字串 suffix 作為字尾。
strings.HasSuffix("Gopher", "er") // 返回 true
strings.Index(s, substr string) int
返回字串 substr 在字串 s 中第一次出現的索引位置,若沒有出現,返回-1。
strings.Index("Gopher", "ph") // 返回 2
strings.IndexAny(s, chars string) int
返回字串 chars 中的任意字元在字串 s 中第一次出現的索引位置,若沒有出現,返回-1。
strings.IndexAny("Gopher", "lmno") // 返回 1
strings.IndexByte(s string, c byte) int
返回byte字元 c 在字串 s 中第一次出現的索引位置,若沒有出現,返回-1。
strings.IndexByte("Gopher", 'h') // 返回 3
strings.IndexFunc(s string, f func(rune) bool) int
返回字串 s 中第一次滿足函式 f 的rune字元的索引位置,若沒有出現,返回-1。
fn := func(c rune) bool { return strings.ContainsRune(",|/", c) } strings.IndexFunc("go,python,c++/c,Js|JavaScript", fn) // 返回 2
strings.IndexRune(s string, r rune) int
返回run字元 r 在字串 s 中第一次出現的索引位置,若沒有出現,返回-1。
strings.IndexRune("小韓說課", '說') // 返回 6
strings.Join(a []string, sep string) string
使用分隔符 sep 連線字串切片 a。
ss := []string{"Go", "Hank", "Python", "PHP"} strings.Join(ss, "-") // 返回 "Go-Hank-Python-PHP"
strings.LastIndex(s, substr string) int
返回字串 substr 在字串 s 中最後一次出現的索引位置,若沒有出現,返回-1。
strings.LastIndex("Hankang", "an") // 返回 4
strings.LastIndexAny(s, chars string) int
返回字串 chars 中的任意字元在字串 s 中最後一次出現的索引位置,若沒有出現,返回-1。
strings.LastIndexAny("Hankang", "lmno") // 返回 5
strings.LastIndexByte(s string, c byte) int
返回byte字元 c 在字串 s 中最後一次出現的索引位置,若沒有出現,返回-1。
strings.LastIndexByte("Hankang", 'n') // 返回 5
strings.LastIndexFunc(s string, f func(rune) bool) int
返回字串 s 中字後一次滿足函式 f 的rune字元的索引位置,若沒有出現,返回-1。
fn := func(c rune) bool { return strings.ContainsRune(",|/", c) } strings.LastIndexFunc("go,Js|JavaScript", fn) // 返回 5
strings.Map(mapping func(rune) rune, s string) string
返回字串 s 中的每個字元經過對映函式 mapping 處理之後的字串。
fn := func(c rune) rune { if strings.ContainsRune(",|/", c) { return '-' } else { return c } } strings.Map(fn, "go,Js|JavaScript") // 返回 "go-Js-JavaScript"
strings.Repeat(s string, count int) string
返回將字串 s 重複 count 的字串。
strings.Repeat("la~", 3) // 返回值 "la~la~la~"
strings.Replace(s, old, new string, n int) string
在字串 s 中使用字串 new 替換字串 old,使用 n 限定替換次數,n設定為負數表示沒有限制。返回替換結果。
strings.Replace("han zhong kang", "n", "N", 2) // 返回 "haN zhoNg kang"
strings.Split(s, sep string) []string
使用分隔符 sep 分割字串 s,返回字串切片
strings.Split("go-Js-JavaScript", "-") // 返回 ["go", "Js", "JavaScript"]
strings.SplitAfter(s, sep string) []string
在分隔符 sep 後分割字串 s,返回字串切片
strings.SplitAfter("go-Js-JavaScript", "-") // 返回 ["go-", "Js-", "JavaScript"]
strings.SplitAfterN(s, sep string, n int) []string
在分隔符 sep 後分割字串 s,使用 n 限定分割的元素數量,n<0全部子字串,n>0最後一個子字串包含餘下內容,n==0返回nil。返回子字串切片。
strings.SplitAfterN("go-Js-JavaScript", "-", 2) // 返回 ["go-", "Js-JavaScript"]
strings.SplitN(s, sep string, n int) []string
在分隔符 sep 分割字串 s,使用 n 限定分割的元素數量,n<0全部子字串,n>0最後一個子字串包含餘下內容,n==0返回nil。返回子字串切片。
strings.SplitN("go-Js-JavaScript", "-", 2) // 返回 ["go", "Js-JavaScript"]
strings.Title(s string) string
返回Title化的字串。
strings.Title("hello Hank's go") // 返回 "Hello Hank's Go"
strings.ToLower(s string) string
轉換字串 s 到小寫。
strings.ToLower("Hank's Go Guide") // 返回 "hank's go guide"
strings.ToLowerSpecial(c unicode.SpecialCase, s string) string
使用特定的規則轉換字串 s 到小寫。
strings.ToLowerSpecial(unicode.TurkishCase, "Önnek İş") // 返回 önnek iş
strings.ToTitle(s string) string
返回全部字元都Title化的字串。
strings.Title("hello Hank's go") // 返回 "HELLO HANK'S GO"
strings.ToTitleSpecial(c unicode.SpecialCase, s string) string
使用特定的規則將全部字元都Title化。
strings.ToTitleSpecial(unicode.TurkishCase, "dünyanın ilk borsa yapısı Aizonai kabul edilir") // 返回 "DÜNYANIN İLK BORSA YAPISI AİZONAİ KABUL EDİLİR"
strings.ToUpper(s string) string
將字串 s 中所有字元轉換為大寫。
strings.ToUpper("hello Hank's go") // 返回 "HELLO HANK'S GO"
strings.ToUpperSpecial(c unicode.SpecialCase, s string) string
使用特定的規則將字串 s 中所有字元轉換為大寫。
strings.ToUpperSpecial(unicode.TurkishCase, "örnek iş") // 返回 "ÖRNEK İŞ"
strings.Trim(s string, cutset string) string
擷取字串 s 兩端包裹的特定字符集 cutset。
strings.Trim("user name", " ") // 返回 "user name"
strings.TrimFunc(s string, f func(rune) bool) string
擷取字串 s 兩端滿足函式 f 的字元。
fn := func(c rune) bool { return strings.ContainsRune(",|/", c) } strings.TrimFunc("|/user name,/", fn) // 返回 "user name"
strings.TrimLeft(s string, cutset string) string
擷取字串 s 左邊包裹的特定字符集 cutset。
strings.TrimLeft("user name", " ") // 返回 "user name"
strings.TrimLeftFunc(s string, f func(rune) bool) string
擷取字串 s 左邊滿足函式 f 的字元。
fn := func(c rune) bool { return strings.ContainsRune(",|/", c) } strings.TrimLeftFunc("|/user name,/", fn) // 返回 "user name,/"
strings.TrimPrefix(s, prefix string) string
擷取字串 s 的字首 prefix。
strings.TrimPrefix("hank_goGuide", "hank_") // 返回 "goGuide"
strings.TrimRight(s string, cutset string) string
擷取字串 s 右邊包裹的特定字符集 cutset。
strings.TrimRight("user name", " ") // 返回 "user name"
strings.TrimRightFunc(s string, f func(rune) bool) string
擷取字串 s 右邊滿足函式 f 的字元。
fn := func(c rune) bool { return strings.ContainsRune(",|/", c) } strings.TrimRightFunc("|/user name,/", fn) // 返回 "|/user name"
strings.TrimSpace(s string) string
擷取字串 s 兩端的空白字元。
strings.TrimSpace(" \t\n Hello, Gophers \n\t\r\n") // 返回 "Hello, Gophers"
strings.TrimSuffix(s, suffix string) string
擷取字串 s 的字尾 suffix。
strings.TrimSuffix("goGuide_beta", "_beta") // 返回 "goGuide"