如何用python遍歷資料夾下的所有excel檔案

阿新 • • 發佈：2019-01-01

大資料處理經常要用到一堆表格，然後需要把資料匯入一個list中進行各種演算法分析，簡單講一下自己的做法：

1.如何讀取excel檔案

網上的版本很多，在xlrd模組基礎上，找到一些原始碼：

import  xdrlib ,sys
import xlrd
def open_excel(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx"):
        data = xlrd.open_workbook(file)
        return data
#根據索引獲取Excel表格中的資料   引數:file：Excel檔案路徑     colnameindex：表頭列名所在行的所以  ，by_index：表的索引
def excel_table_byindex(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx",colnameindex=0,by_index=0):
    data = open_excel(file)
    table = data.sheets()[by_index]
    nrows = table.nrows #行數
    ncols = table.ncols #列數
    colnames =  table.row_values(colnameindex) #某一行資料
    list =[]
    for rownum in range(1,nrows):
         row = table.row_values(rownum)
         if row:
             app = {}
             for i in range(len(colnames)):
                app[colnames[i]] = row[i]
             list.append(app)
    return list
#根據名稱獲取Excel表格中的資料   引數:file：Excel檔案路徑     colnameindex：表頭列名所在行的所以  ，by_name：Sheet1名稱
def excel_table_byname(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx",colnameindex=0,by_name=u'Sheet1'):
    data = open_excel(file)
    table = data.sheet_by_name(by_name)
    nrows = table.nrows #行數
    colnames =  table.row_values(colnameindex) #某一行資料
    list =[]
    for rownum in range(1,nrows):
         row = table.row_values(rownum)
         if row:
             app = {}
             for i in range(len(colnames)):
                app[colnames[i]] = row[i]
             list.append(app)
    return list

def main():
   tables = excel_table_byindex()
   for row in tables:
       print(row)
   tables = excel_table_byname()
   for row in tables:
       print(row)
if __name__=="__main__":
    main()

最後一句是重點，所以這裡也給程式碼人點個贊！

最後一句讓程式碼裡的函式都可以被複用，簡單地說：假設檔名是a，在程式中import a以後，就可以用a.excel_table_byname()和a.excel_table_byindex()這兩個超級好用的函數了。

2.然後是遍歷資料夾取得excel檔案以及路徑：，原創程式碼如下：

import os
import xlrd
import test_wy
xpath="E:/唐偉捷/電力/電力系統總資料夾/舟山電力"
xtype="xlsx"
typedata = []
name = []
raw_data=[]
file_path=[]
def collect_xls(list_collect,type1):
    #取得列表中所有的type檔案
    for each_element in list_collect:
        if isinstance(each_element,list):
            collect_xls(each_element,type1)
        elif each_element.endswith(type1):
              typedata.insert(0,each_element)
    return typedata
#讀取所有資料夾中的xls檔案
def read_xls(path,type2):
    #遍歷路徑資料夾
    for file in os.walk(path):
        for each_list in file[2]:
            file_path=file[0]+"/"+each_list
            #os.walk()函式返回三個引數：路徑，子資料夾，路徑下的檔案，利用字串拼接file[0]和file[2]得到檔案的路徑
            name.insert(0,file_path)
        all_xls = collect_xls(name, type2)
    #遍歷所有type檔案路徑並讀取資料
    for evey_name in all_xls:
        xls_data = xlrd.open_workbook(evey_name)
        for each_sheet in xls_data.sheets():
            sheet_data=test_wy.excel_table_byname(evey_name,0,each_sheet.name)
            #請參考讀取excel檔案的程式碼
            raw_data.insert(0, sheet_data)
            print(each_sheet.name,":Data has been done.")
    return raw_data
a=read_xls(xpath,xtype)
print("Victory")

歡迎各種不一樣的想法~~

用Python遍歷資料夾下所有電子字典檔案（不包括子資料夾）提取單詞到一個檔案

經過若干天的嘗試，最後凝鍊出了這麼一段程式碼，集幾天研究之成果，可謂費盡心機。裡面用到的成果包括： 1.with open...as 2.處理有亂碼的文字於是趕緊先寫下來，做個階段性成果。 import re import os.path p=re.compile

【python Excel 合併】python合併同一個資料夾下所有excel檔案

一、需求說明一個資料夾下有多個excel表格，格式統一，均為 xlsx字尾，欄位也一樣，現在要合併為一個excel表格。二、合併效果三、python 實現程式碼 # -*- cod

如何用python遍歷資料夾下的所有excel檔案

大資料處理經常要用到一堆表格，然後需要把資料匯入一個list中進行各種演算法分析，簡單講一下自己的做法： 1.如何讀取excel檔案網上的版本很多，在xlrd模組基礎上，找到一些原始碼： import xdrlib ,sys import xlrd def open_

OpenCV實現遍歷資料夾下所有檔案

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

linux迴圈遍歷資料夾下所有檔案

demofun(){ for file in `ls $1` do if test -f $file then echo "file: $file" elif test -d $file then

遞迴遍歷資料夾下所有檔案

遞迴遍歷資料夾下所有檔案程式碼塊遞迴遍歷資料夾下所有檔案 package com.chow; import java.io.File; import java.util.ArrayList; /** * Created by zhouhaiming on 20

遍歷資料夾下所有檔案的路徑

import os def traverse(f): fs = os.listdir(f) for f1 in fs: tmp_path = os.path.join(f, f1) if not os.path.isdir(tmp_path):

shell指令碼遍歷資料夾下及其子檔案下所有檔案，本且替換指定文字

今天寫了一個需求，在linux上，對一個資料夾下的所有檔案中，指定的文字內容進行替換，比如把 www.baidu.com 替換成 www.google.com 1.先熟悉幾個linux命令（1）新建資料夾 : mkdir 資料夾名（2）新建檔案：touch 檔

遍歷資料夾下所有檔案

void getFiles( string path, vector<string>& files, vector<string> &ownname) { /*file

windows API遞迴遍歷資料夾下所有檔案

1.網上有些程式碼有問題，改進如下 #include <stdio.h> #include<windows.h> #include<iostream> #inclu

linux下 c語言遞迴遍歷資料夾下所有檔案和子資料夾(附上替換文字檔案內容的方法)

#include <stdio.h> #include <sys/dir.h> #include <string> #include <sys/stat.h> //判斷是否為資料夾 bool isDir(const cha

Java遍歷資料夾下所有檔案並替換指定字串

應用場景：比如有一個深層次的檔案目錄結構，如：javaAPI每個檔案裡面都有相同的內容，而我們要統一修改為其他內容。上千個檔案如果一個個修改顯得太不明智。import java.io.BufferedReader; import java.io.File; import ja

ruby遍歷資料夾下所有檔案，輸出檔名(migrate報錯處理)

１．例子：／／註釋：file_path檔案路徑 def traverse_dir(file_path) if File.directory? file_path Dir.foreach(file_path) do |file|

ASP.NET2.0 遍歷資料夾下所有圖片【月兒原創】

ASP.NET2.0 遍歷資料夾下所有圖片作者：清清月兒 1.以下目錄有若干圖片（都是大圖片） 2.在頁面展現效果圖 3.程式碼後臺程式碼using System;using System.Data;using System.Configuration;using

Python遍歷資料夾查詢最新的檔案 demo

前情提要：需要再報告資料夾中，查詢最新建立的報告檔案。程式碼呈現： import os import time dir = r'C:\Users\jishi\Desktop\mine\work\report' a = os.path.getatime(dir) #輸出最近訪問時間

Python遍歷資料夾和讀寫檔案的方法

#-*- coding: UTF-8 -*- ''' 1、讀取指定目錄下的所有檔案 2、讀取指定檔案，輸出檔案內容 3、建立一個檔案並儲存到指定目錄 ''' import os # 遍歷指定目錄，顯示目錄下的所有檔名 def eachFile(filepath): pathDir = os.l

python下遍歷資料夾中所有檔案

python下遍歷某個路徑所有檔案是很常用的事，一直對其有所困擾，今天想明白了之後記錄下來，供以後查閱。首先，資料夾是這樣的： a,b,c是各包含一張jpg圖片的資料夾，其餘是4張jpg圖片。遍歷資料夾的方法首先需要呼叫os庫，即 import

用深度優先和廣度優先遍歷資料夾下符合條件的檔案

第一步：需要有一個萬能過濾器：MyFileFilter.java package com.ten.practice.test15; import java.io.File; import jav

C++遍歷資料夾下的所有資料夾及檔案

問題：給定一個資料夾，獲取資料夾下的所有檔案，並將檔案的路徑進行儲存解決方法：採用遞迴的思想，在遞迴過程中對每一層進行遍歷。若為資料夾，繼續向下遍歷。若為檔案，將路徑儲存。實現程

c++ 遍歷資料夾下的所有檔案

同樣的程式碼在VS2010中可以得到正常結果,但是VS2013中卻不行,實在想不通.. 沒有找到解決VS2013中遍歷問題的解決辦法,只好另外想辦法.然後想起C++中應該也有能夠實現資料夾遍歷的方法. 在VS2013中實踐一下: #include <s

如何用python遍歷資料夾下的所有excel檔案

相關推薦