簡單掌握Python中glob模塊查找文件路徑的用法

分類:IT技術 時間:2016-10-11

glob使用UNIX shell規則查找與一個模式匹配的文件名。只要程序需要查找文件系統中名字與某個模式匹配的一組文件,就可以使用這個模塊。
glob的模式規則與re模塊使用的正則表達式不相同。glob模式遵循標準UNIX路徑擴展規則。只是用幾個特殊字符來實現兩個不同的通配符和字符區間。模式規則要應用於文件名中的段。模式中的路徑可以是相對路徑或絕對路徑。
shell變量名和波浪線都不會擴展。

基本用法

1.glob.glob(pathname), 返回所有匹配的文件路徑列表。它只有一個參數pathname,定義了文件路徑匹配規則,這裏可以是絕對路徑,也可以是相對路徑。
2.glob.iglob(pathname), 獲取一個可編歷對象,使用它可以逐個獲取匹配的文件路徑名。與glob.glob()的區別是:glob.glob同時獲取所有的匹配路徑,而glob.iglob一次只獲取一個匹配路徑。

3.eg:

import glob 
 
print glob.glob(r'E:\*\*.doc') 
print glob.glob(r'.\*.py') 
 
f = glob.iglob(r'.\*.py') 
 
for py in f: 
  print py 

運行結果:

['E:\\test_file\\adplus.doc'] 
['.\\perfrom_test.py', '.\\pyTest.py', '.\\simulation_login.py', '.\\widget.py', '.\\__init__.py'] 
.\perfrom_test.py 
.\pyTest.py 
.\simulation_login.py 
.\widget.py 
.\__init__.py 

下面我們分知識點詳細來講:


通配符
星號匹配一個文件名段中的0個或多個字符。

import glob
for name in glob.glob('tmp/*'):
  print name

這個模式會匹配所有的路徑名,但是不會遞歸搜索到子目錄。

>>> ================================ RESTART ================================
>>> 
tmp\checklog_status.sh
tmp\check_Adwords_v1.2.sh
tmp\check_traffic.sh
tmp\cut_nginxlog_V1.2.sh
tmp\ip_conn.sh
tmp\ip_keepalive.sh
tmp\nagios使用手冊.doc
tmp\nmap_ping
tmp\nrpe_install-1.3.sh
tmp\one
tmp\syn.sh
tmp\zabbix_agentd_2.0.10_win_V1.2.bat
tmp\zabbix_agentd_2.0.8_V1.3.sh
tmp\工作內容.doc

要列出子目錄中的文件,必須把子目錄包含在模式中。

import glob
print 'Name explicitly:'
for name in glob.glob('tmp/one/*'):
  print '\t', name
print 'Name with wildcard:'
for name in glob.glob('tmp/*/*'):
  print '\t', name 

第一種情況顯示列出子目錄名,第二種情況則依賴一個通配符查找目錄。

>>> ================================ RESTART ================================
>>> 
Name explicitly:
  tmp/one\another.txt
  tmp/one\file.txt
Name with wildcard:
  tmp\one\another.txt
  tmp\one\file.txt


單字節通配符
問號會匹配文件名中該位置的單個字符。

import glob
for name in glob.glob('tmp/chec"jb51code">
>>> ================================ RESTART ================================
>>> 
tmp\check_traffic.sh

   

字符區間
使用字符區間([a-z]),可以匹配多個字符中的一個字符。

import glob
for name in glob.glob('tmp/one/[a-z]*'):
  print name

區間可以匹配所有小寫字母。   

>>> ================================ RESTART ================================
>>> 
tmp/one\another.txt
tmp/one\file.txt


Tags: import 表達式 通配符 知識點 波浪

文章來源:


ads
ads

相關文章
ads

相關文章

ad