1. 程式人生 > >Python-去除字串中不想要的字元

Python-去除字串中不想要的字元

#!/usr/bin/python3

import sys
import unicodedata
s = "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng"
remap = {
    # ord返回ascii值
    ord('\t'): '',
    ord('\f'): '',
    ord('\r'): None
    }
# 去除\t, \f, \r
a = s.translate(remap)
'''
  通過使用dict.fromkeys() 方法構造一個字典,每個Unicode 和音符作為鍵,對於的值全部為None
  然後使用unicodedata.normalize() 將原始輸入標準化為分解形式字元
  sys.maxunicode : 給出最大Unicode程式碼點的值的整數,即1114111(十六進位制的0x10FFFF)。
  unicodedata.combining:將分配給字元chr的規範組合類作為整數返回。 如果未定義組合類,則返回0。
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) #此部分建議拆分開來理解
b = unicodedata.normalize('NFD', a)
'''
   呼叫translate 函式刪除所有重音符
'''
print(b.translate(cmb_chrs))

相關推薦

Python-去除字串字元

#!/usr/bin/python3 import sys import unicodedata s = "Zhào Qián Sūn Lǐ Zhōu Wú Zhèng Wáng" remap = { # ord返回ascii值 ord('\t'): '', ord('\f'):

python如何去除字串字元

問題:     過濾使用者輸入中前後多餘的空白字元       ‘    ++++abc123---    ‘     過濾某windows下編輯文字中的’\r’:       ‘hello world \r\n’     去掉文字中unicode組合字元,音調       "Zhào Qián Sūn L

python3 如何去除字串字元

cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) #此部分建議拆分開來理解 (adsbygoogle = window.adsbygoogle ||

python 4-6 如何去掉字串需要的字元strip('-+*')/lstrip()/rstrip()/切片分段+/replace/sub/translate

4-6 如何去掉字串中不需要的字元 方法一,字串strip() lstrip() rstrip() 去掉字串兩端字元 方法二,刪除單個位置的字元,可以使用切片 + 拼接的方式 方法三,字串的replace()方法或者正則表示式re.sub刪除任意位置字元

去除字串相鄰重複的字元

public class Test{ public static void main(String[] args) { String str = "aabbbccccdddddeeeeeeeeefff234tttdddfffbbbggg"; String result = removeR

去除字串所有重複的字元(只保留第一個重複的字元)

public class Ac { public static void main(String[] args) { String str = "aabbbccccdddddeeeeeeeeefff234tttdddfffbbbggg"; removeMethod(str); }

字串包含重複字元的最長子串的長度

題: 已知一個字串,求這個字串中不包含重複字元的最長子串的長度,如abba返回2,aaaaabc返回3,bbbbbbb返回1. 解題思路: 藉助hashmap來解決,map的鍵key存放字串中出現的

python 判斷字串是否只有中文字元

python中的encode和decode: 首先,在python中字串的表示是 用unicode編碼。所以在做編碼轉換時,通常要以unicode作為中間編碼。 decode的作用是將其他編碼的字串轉換成unicode編碼,比如 a.decode('utf-8')

asp.net去除字串的所有空格字元

方法一、最常用的就是Replace函式      string str = "str=1 3 45. 7 8 9 0 5"; Response.Write(str.Replace(" ","")); 方法二:由於空格的ASCII碼值是32,因此,

字串重複連續字元子串的長度最大值

 森林舉行運動會,小夥伴們身上每個都印著一個字元標記,排成一列,委員會要挑出每列裡相鄰小夥伴身上沒有重複字元標記的,最多能挑出幾個? 比如:小夥伴們的字元標記串起來是“ccccccbc” 那相鄰的小夥伴身上沒有重複的字元標記是cb或者bc,那這個人數就是2。 這題的意思是

百度面試題 求字串含重複字元的最長子串長度

#include<iostream> #include<string> using namespace std; void MaxNoRepeatStrLength(string a) { unsigned int hashtable[128] =

去除字串所有的非英文字元,再統計每種英文字元的個數(區分大小寫)

import java.util.Scanner; import java.util.regex.Matcher; import java.util.regex.Pattern; public class TestString {public static void mai

python怎樣去除字串的某些字元

1、用while迴圈,檢查是否存在空字元,如果存在用remove移除:while '' in f: f.remove('') print(f)注意:不能寫成這樣的for迴圈,這樣會造成有的空字元不能去掉for i in f: if i=='': f.

去掉字串開頭,結尾或者中間的空格及其他字元

討論 這些 strip() 方法在讀取和清理資料以備後續處理的時候是經常會被用到的。 比如,你可以用它們來去掉空格,引號和完成其他任務。 但是需要注意的是去除操作不會對字串的中間的文字產生任何影響。比如: >>> s = ' hello world \n' >>

maven專案,去除jar包的依賴關係

<dependency><groupId>httpclient</groupId><artifactId>httpclient</artifactId><version>4.2.5</version></dependen

Python去除字串空格的方法

Python中去除字串中指定字元或者空格的方法有幾種: str.strip() //該方法用於去除字串開頭和結尾的指定字元或字串(預設為空格或換行符) str.lstrip() //該方法用於截掉字串左邊的空格或指定字元 str.rstrip() //該方法用於截掉字串右邊的空格或指定字元

python去除列表的重複元素,但能改變原列表

‘’’ 去除列表中的重複元素 1.列表中的元素有重複,需要去掉重複元素 2.要求保留原來的元素順序 3.不需要返回值,直接修改原列表即可 ‘’’ def duplicate_removal(lt): lt1 = [] for i in lt: if i

Python 正則去除字串的指定元素

在獲取資料時,經常會遇到        ['\n文字\n']       [‘\r\r文字\r\r’]       ['文\xa0\xa0字]      

EF的連線字串用config寫到程式碼裡,總是報錯支援的關鍵字 data source

用WPF寫一個小東西,EF連線資料庫的字串是寫在app.config裡的,明文。網上找了很久,倒是有加解密的文章。我覺得太複雜了。 事實上只要不顯示明文就行了。 修改了EF的建構函式,在程式碼裡對connectStrings賦值。明明是複製的原來工作正常的app.config中的connectstring

c語言程式設計:用strcpy比較陣列(銀行卡密碼程式設計),strcpy(複製陣列內容)和getchar()(敲鍵盤字元,統計字元的個數)

統計從鍵盤輸入一行字元的個數:   1 //用了getchar() 語句 2 //這裡的\n表示回車 1 #include <stdio.h> 2 #include <stdlib.h> 3 int main() 4 { 5 int n =