1. 程式人生 > >簡單測試--C#實現中文漢字轉拼音首字母

簡單測試--C#實現中文漢字轉拼音首字母

esp chart htm foreach ext ads linq 類庫 play

第一種:

這個是自己寫的比較簡單的實現方法,要做漢字轉拼音首字母,首先應該有一個存儲首字母的數組,然後將要轉拼音碼的漢字與每個首字母開頭的第一個漢字即“最小”的漢字作比較,這裏的最小指的是按拼音規則比較最小,例如a比h小,所以“愛”比“恨”小,同一個字母開頭的拼音比較大小以此類推。最後實現的結果是只轉漢字,對於中文特殊字符、標點符號和英文都原樣輸出,不轉碼。

實現方法如下:

 1 using System;
 2 using System.Collections.Generic;
 3 using System.Globalization;
 4 using System.Linq;
 5 using
System.Text; 6 using System.Threading.Tasks; 7 using System.Text.RegularExpressions;//先導入這個使用正則表達式 8 9 namespace WritePinYin 10 { 11 12 public class SimplePinYin 13 { 14 //漢字每個首字母的拼音中最小的字,順序不能亂 15 private static char[] firstcn = { , , , , , , , , 16
, , , , , , , , 17 , , , , , , }; 18 //所有漢字首字母 19 private static char[] firsten = { Z, Y, X, W, T, S, R, Q, 20 P, O, N, M, L, K, J, H, 21
G, F, E, D, C, B, A }; 22 23 /// <summary> 24 /// 漢字轉化為拼音首字母 25 /// </summary> 26 /// <param name="str">漢字</param> 27 /// <returns>首字母</returns> 28 public static string GetFirstPinyin(string strcn) 29 { 30 int intlen = strcn.Length; 31 int index = 0; 32 char chartemp = char.MinValue; 33 string strtemp = string.Empty; 34 Regex reg = new Regex(@"[\u4e00-\u9fa5]");//\u4e00-\u9fa5用來判斷是不是中文的正則表達式 35 CultureInfo pinyin = new CultureInfo(0x804);//保存區域特定的信息,如關聯的語言、子語言、國家/地區、日歷和區域性約定,這裏表示中文 36 if (intlen > 0) 37 { 38 char[] strchar = new char[intlen + 1]; 39 for (int i = 0; i < intlen; i++) 40 { 41 strchar[i] = Convert.ToChar(strcn.Substring(i, 1)); 42 } 43 foreach (char cstr in strchar) 44 { 45 chartemp = char.MinValue; 46 if (reg.IsMatch(cstr.ToString()))//對於中文漢字,不包括中文特定字符 47 { 48 foreach (char fstr in firstcn) 49 { 50 if (string.Compare(cstr.ToString(), fstr.ToString(), pinyin, CompareOptions.None) >= 0)//將漢字與設定的漢字按拼音比較大小 51 { 52 index = Array.IndexOf(firstcn, fstr); 53 chartemp = firsten[index]; 54 break; 55 } 56 } 57 } 58 else//對於非中文漢字,不作拼音碼處理 59 { 60 chartemp = cstr; 61 } 62 strtemp += chartemp; 63 } 64 } 65 return strtemp; 66 } 67 68 } 69 }

調用:Console.WriteLine("{0}:{1}", strcn, SimplePinYin.GetFirstPinyin("我是托爾其!"));

第二種:

參考:http://www.cnblogs.com/yazdao/archive/2011/06/04/2072488.html

使用微軟的Visual Studio International Pack 類庫提取漢字拼音首字母,首先下載Visual Studio International Pack 1.0,官方下載地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=44CAC7F0-633B-477D-AED2-99AEE642FC10&displaylang=zh-cn。下載完畢後解壓,解壓後可以發現7個MSI安裝文件,其中CHSPinYinConv.msi是漢字拼音組件,CHTCHSConv.msi是進行繁簡體互轉組件,安裝這兩個MSI就可以了 (x86操作系統上的默認安裝目錄是 C:\Program Files\Microsoft Visual Studio International Pack\) 。安裝完畢後,需要在VS裏添加引用,分別引用:C:\Program Files\Microsoft Visual Studio International Pack\Simplified Chinese Pin-Yin Conversion Library(拼音)下和C:\Program Files\Microsoft Visual Studio International Pack\Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool(繁簡互轉)下的dll 即可使用。

 1 using Microsoft.International.Converters.PinYinConverter;//導入拼音相關
 2 
 3 namespace WebApplication2
 4 {
 5     public class Class1
 6     {   
 7         /// <summary> 
 8         /// 漢字轉化為拼音
 9         /// </summary> 
10         /// <param name="str">漢字</param> 
11         /// <returns>全拼</returns> 
12         public static string GetPinyin(string str)
13         {
14             string r = string.Empty;
15             foreach (char obj in str)
16             {
17                 try
18                 {
19                     ChineseChar chineseChar = new ChineseChar(obj);
20                     string t = chineseChar.Pinyins[0].ToString();
21                     r += t.Substring(0, t.Length - 1);
22                 }
23                 catch
24                 {
25                     r += obj.ToString();
26                 }
27             }
28             return r;
29         }
30 
31         /// <summary> 
32         /// 漢字轉化為拼音首字母
33         /// </summary> 
34         /// <param name="str">漢字</param> 
35         /// <returns>首字母</returns> 
36         public static string GetFirstPinyin(string str)
37         {
38             string r = string.Empty;
39             foreach (char obj in str)
40             {
41                 try
42                 {
43                     ChineseChar chineseChar = new ChineseChar(obj);
44                     string t = chineseChar.Pinyins[0].ToString();
45                     r += t.Substring(0, 1);
46                 }
47                 catch
48                 {
49                     r += obj.ToString();
50                 }
51             }
52             return r;
53         }
54     }
55 }

調用:Console.WriteLine("{0}:{1}", strcn, MSPinyin.GetFirstPinyin("我是托爾其!"));

簡單測試--C#實現中文漢字轉拼音首字母