1. 程式人生 > >Python 正則去除字串中的指定元素

Python 正則去除字串中的指定元素

在獲取資料時,經常會遇到

       ['\n文字\n']

      [‘\r\r文字\r\r’]

      ['文\xa0\xa0字]

      ... ...

這樣的資料  為了保證資料的清潔 

使用正則表示式去除指定的元素

例如: 

去除  '文\xa0\xa0\xa0\xa0字'  中\xa0只保留文字

import re

a = '文\xa0\xa0\xa0\xa0字'
s =re.sub('[\xa0]','',a)
print(s)

輸出結果為:

文字

例:

import re

a = '\n\n\n文\xa0\xa0\xa0\xa0字\n\n\n'
s =re.sub('[\xa0\n]','',a)
print(s)

輸出結果為:

文字