1. 程式人生 > >Python中過濾Windows檔名中的非法字元

Python中過濾Windows檔名中的非法字元

網上有三種寫法:

第一種(所有非法字元都不轉義):
def setFileTitle(self,title):      
            fileName = re.sub('[\/:*?"<>|]','-',title)#去掉非法字元  
            self.file = open(fileName + ".txt","w+")  

\非法字元必須轉義,否則\/被解釋為/

第二種(所有非法字元都轉義):
def validateTitle(title):
    rstr = r"[\/\\\:\*\?\"\<\>\|]"  # '/ \ : * ? " < > |'
new_title = re.sub(rstr, "_", title) # 替換為下劃線 return new_title
第三種(部分非法字元轉義):
private static Pattern FilePattern = Pattern.compile("[\\\\/:*?\"<>|]");  
public static String filenameFilter(String str) {  
    return str==null?null:FilePattern.matcher(str).replaceAll("");  
}  
最佳寫法:
pattern=r'[\\/:*?"<>|\r\n]+'

在[]中*不需要轉義,此時*不表示多次匹配,就表示本身的字元

注意

資料夾名和檔名的字串中可以包含不是26個字母和數字的特殊字元,例如“┽┾┿╀╂╁╃ ”這個字串是可以命名成功的的,另一方面檔名首尾的空格要去掉,首尾的點號要去掉,特殊的空白符(如換行符和製表符)也要去掉。

python中strip(),lstrip(),rstrip()可以取出兩端的某些特殊的字元