1. 程式人生 > >利用java讀取Excel中的資料

利用java讀取Excel中的資料

使用Windows作業系統的朋友對Excel(電子表格)一定不會陌生,但是要使用Java語言來操縱Excel檔案並不是一件容易的事。在Web應用日益盛行的今天,通過Web來操作Excel檔案的需求越來越強烈,目前較為流行的操作是在JSP或Servlet 中建立一個CSV (comma separated values)檔案,並將這個檔案以MIME,text/csv型別返回給瀏覽器,接著瀏覽器呼叫Excel並且顯示CSV檔案。這樣只是說可以訪問到Excel檔案,但是還不能真正的操縱Excel檔案,本文將給大家一個驚喜,向大家介紹一個開放原始碼專案——Java Excel API,使用它大家就可以方便地操縱Excel檔案了。


JAVA EXCEL API
簡介
Java Excel是一開放原始碼專案,通過它Java開發人員可以讀取Excel檔案的內容、建立新的Excel檔案、更新已經存在的Excel檔案。使用該API非Windows作業系統也可以通過純Java應用來處理Excel資料表。因為是使用Java編寫的,所以我們在Web應用中可以通過JSP、Servlet來呼叫API實現對Excel資料表的訪問。

現在釋出的穩定版本是V2.0,提供以下功能:

· 從Excel 95、97、2000等格式的檔案中讀取資料;

· 讀取Excel公式(可以讀取Excel 97以後的公式);

· 生成Excel資料表(格式為Excel 97);

· 支援字型、數字、日期的格式化;

· 支援單元格的陰影操作,以及顏色操作;

· 修改已經存在的資料表;

· 現在還不支援以下功能,但不久就會提供了:

· 不能夠讀取圖表資訊;

可以讀,但是不能生成公式,任何型別公式最後的計算值都可以讀出;


應用示例
從Excel檔案讀取資料表

Java Excel API
既可以從本地檔案系統的一個檔案(.xls),也可以從輸入流中讀取Excel資料表。讀取Excel資料表的第一步是建立Workbook(術語:工作薄),下面的程式碼片段舉例說明了應該如何操作:(完整程式碼見ExcelReading.java)

import java.io.*;
import jxl.*;
… … … …
try
{
//構建Workbook物件, 只讀Workbook物件
//直接從本地檔案建立Workbook
//從輸入流建立Workbook
    InputStream is = new FileInputStream(sourcefile);
    jxl.Workbook rwb = Workbook.getWorkbook(is);
}
catch (Exception e)
{
e.printStackTrace();
}


一旦建立了Workbook,我們就可以通過它來訪問Excel Sheet(術語:工作表)。參考下面的程式碼片段:

//獲取第一張Sheet表
Sheet rs = rwb.getSheet(0);


我們既可能通過Sheet的名稱來訪問它,也可以通過下標來訪問它。如果通過下標來訪問的話,要注意的一點是下標從0開始,就像陣列一樣。

一旦得到了Sheet,我們就可以通過它來訪問Excel Cell(術語:單元格)。參考下面的程式碼片段:

//獲取第一行,第一列的值
Cell c00 = rs.getCell(0, 0);
String strc00 = c00.getContents();
//獲取第一行,第二列的值
Cell c10 = rs.getCell(1, 0);
String strc10 = c10.getContents();
//獲取第二行,第二列的值
Cell c11 = rs.getCell(1, 1);
String strc11 = c11.getContents();
System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " +
c00.getType());
System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " +
c10.getType());
System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " +
c11.getType());


如果僅僅是取得Cell的值,我們可以方便地通過getContents()方法,它可以將任何型別的Cell值都作為一個字串返回。示例程式碼中Cell(0, 0)是文字型,Cell(1, 0)是數字型,Cell(1,1)是日期型,通過getContents(),三種類型的返回值都是字元型。

如果有需要知道Cell內容的確切型別,API
也提供了一系列的方法。參考下面的程式碼片段:

String strc00 = null;
double strc10 = 0.00;
Date strc11 = null;
Cell c00 = rs.getCell(0, 0);
Cell c10 = rs.getCell(1, 0);
Cell c11 = rs.getCell(1, 1);
if(c00.getType() == CellType.LABEL)
{
LabelCell labelc00 = (LabelCell)c00;
strc00 = labelc00.getString();
}
if(c10.getType() == CellType.NUMBER)
{
NmberCell numc10 = (NumberCell)c10;
strc10 = numc10.getValue();
}
if(c11.getType() == CellType.DATE)
{
DateCell datec11 = (DateCell)c11;
strc11 = datec11.getDate();
}
System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " +
c00.getType());
System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " +
c10.getType());
System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " +
c11.getType());


在得到Cell物件後,通過getType()方法可以獲得該單元格的型別,然後與API提供的基本型別相匹配,強制轉換成相應的型別,最後呼叫相應的取值方法getXXX(),就可以得到確定型別的值。API提供了以下基本型別,與Excel的資料格式相對應,如下圖所示:



每種型別的具體意義,請參見Java Excel API Document。

當你完成對Excel電子表格資料的處理後,一定要使用close()方法來關閉先前建立的物件,以釋放讀取資料表的過程中所佔用的記憶體空間,在讀取大量資料時顯得尤為重要。參考如下程式碼片段:

//操作完成時,關閉物件,釋放佔用的記憶體空間
rwb.close();


Java Excel API提供了許多訪問Excel資料表的方法,在這裡我只簡要地介紹幾個常用的方法,其它的方法請參考附錄中的Java Excel API Document。

· Workbook類提供的方法

1. int getNumberOfSheets()

獲得工作薄(Workbook)中工作表(Sheet)的個數,示例:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
int sheets = rwb.getNumberOfSheets();


2. Sheet[] getSheets()

返回工作薄(Workbook)中工作表(Sheet)物件陣列,示例:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
Sheet[] sheets = rwb.getSheets();


3. String getVersion()

返回正在使用的API的版本號,好像是沒什麼太大的作用。

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
String apiVersion = rwb.getVersion();


· Sheet介面提供的方法

1. String getName()

獲取Sheet的名稱,示例:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
String sheetName = rs.getName();


2. int getColumns()

獲取Sheet表中所包含的總列數,示例:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
int rsColumns = rs.getColumns();


3. Cell[] getColumn(int column)

獲取某一列的所有單元格,返回的是單元格物件陣列,示例:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell[] cell = rs.getColumn(0);


4. int getRows()

獲取Sheet表中所包含的總行數,示例:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
int rsRows = rs.getRows();


5. Cell[] getRow(int row)

獲取某一行的所有單元格,返回的是單元格物件陣列,示例子:

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell[] cell = rs.getRow(0);


6. Cell getCell(int column, int row)

獲取指定單元格的物件引用,需要注意的是它的兩個引數,第一個是列數,第二個是行數,這與通常的行、列組合有些不同。

jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
jxl.Sheet rs = rwb.getSheet(0);
Cell cell = rs.getCell(0, 0);


生成新的Excel工作薄

下面的程式碼主要是向大家介紹如何生成簡單的Excel工作表,在這裡單元格的內容是不帶任何修飾的(如:字型,顏色等等),所有的內容都作為字串寫入。(完整程式碼見ExcelWriting.java)

與讀取Excel工作表相似,首先要使用Workbook類的工廠方法建立一個可寫入的工作薄(Workbook)物件,這裡要注意的是,只能通過API提供的工廠方法來建立Workbook,而不能使用WritableWorkbook的建構函式,因為類WritableWorkbook的建構函式為protected型別。示例程式碼片段如下:

import java.io.*;
import jxl.*;
import jxl.write.*;
… … … …
try
{
//構建Workbook物件, 只讀Workbook物件
//Method 1:建立可寫入的Excel工作薄
jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile));
//Method 2:將WritableWorkbook直接寫入到輸出流
/*
    OutputStream os = new FileOutputStream(targetfile);
    jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(os);
*/
}
catch (Exception e)
{
e.printStackTrace();
}


API提供了兩種方式來處理可寫入的輸出流,一種是直接生成本地檔案,如果檔名不帶全路徑的話,預設的檔案會定位在當前目錄,如果檔名帶有全路徑的話,則生成的Excel檔案則會定位在相應的目錄;另外一種是將Excel物件直接寫入到輸出流,例如:使用者通過瀏覽器來訪問Web伺服器,如果HTTP頭設定正確的話,瀏覽器自動呼叫客戶端的Excel應用程式,來顯示動態生成的Excel電子表格。

接下來就是要建立工作表,建立工作表的方法與建立工作薄的方法幾乎一樣,同樣是通過工廠模式方法獲得相應的物件,該方法需要兩個引數,一個是工作表的名稱,另一個是工作表在工作薄中的位置,參考下面的程式碼片段:

//建立Excel工作表
jxl.write.WritableSheet ws = wwb.createSheet("Test Sheet 1", 0);


"這鍋也支好了,材料也準備齊全了,可以開始下鍋了!",現在要做的只是例項化API所提供的Excel基本資料型別,並將它們新增到工作表中就可以了,參考下面的程式碼片段:

//1.新增Label物件
jxl.write.Label labelC = new jxl.write.Label(0, 0, "This is a Label cell");
ws.addCell(labelC);
//新增帶有字型Formatting的物件
jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES, 18,
WritableFont.BOLD, true);
jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);
jxl.write.Label labelCF = new jxl.write.Label(1, 0, "This is a Label Cell",
wcfF);
ws.addCell(labelCF);
//新增帶有字型顏色Formatting的物件
jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL, 10,
WritableFont.NO_BOLD, false,
UnderlineStyle.NO_UNDERLINE, jxl.format.Colour.RED);
jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);
jxl.write.Label labelCFC = new jxl.write.Label(1, 0, "This is a Label Cell",
wcfFC);
ws.addCell(labelCF);
//2.新增Number物件
jxl.write.Number labelN = new jxl.write.Number(0, 1, 3.1415926);
ws.addCell(labelN);
//新增帶有formatting的Number物件
jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");
jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);
jxl.write.Number labelNF = new jxl.write.Number(1, 1, 3.1415926, wcfN);
ws.addCell(labelNF);
//3.新增Boolean物件
jxl.write.Boolean labelB = new jxl.write.Boolean(0, 2, false);
ws.addCell(labelB);
//4.新增DateTime物件
jxl.write.DateTime labelDT = new jxl.write.DateTime(0, 3, new java.util.Date());
ws.addCell(labelDT);
//新增帶有formatting的DateFormat物件
jxl.write.DateFormat df = new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");
jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);
jxl.write.DateTime labelDTF = new jxl.write.DateTime(1, 3, new java.util.Date(),
wcfDF);
ws.addCell(labelDTF);


這裡有兩點大家要引起大家的注意。第一點,在構造單元格時,單元格在工作表中的位置就已經確定了。一旦建立後,單元格的位置是不能夠變更的,儘管單元格的內容是可以改變的。第二點,單元格的定位是按照下面這樣的規律(column, row),而且下標都是從0開始,例如,A1被儲存在(0, 0),B1被儲存在(1, 0)。

最後,不要忘記關閉開啟的Excel工作薄物件,以釋放佔用的記憶體,參見下面的程式碼片段:

//寫入Exel工作表
wwb.write();
//關閉Excel工作薄物件
wwb.close();


這可能與讀取Excel檔案的操作有少少不同,在關閉Excel物件之前,你必須要先呼叫write()方法,因為先前的操作都是儲存在快取中的,所以要通過該方法將操作的內容儲存在檔案中。如果你先關閉了Excel物件,那麼只能得到一張空的工作薄了。

拷貝、更新Excel工作薄

接下來簡要介紹一下如何更新一個已經存在的工作薄,主要是下面二步操作,第一步是構造只讀的Excel工作薄,第二步是利用已經建立的Excel工作薄建立新的可寫入的Excel工作薄,參考下面的程式碼片段:(完整程式碼見ExcelModifying.java)

//建立只讀的Excel工作薄的物件
jxl.Workbook rw = jxl.Workbook.getWorkbook(new File(sourcefile));
//建立可寫入的Excel工作薄物件
jxl.write.WritableWorkbook  wwb = Workbook.createWorkbook(new File(targetfile),
rw);
//讀取第一張工作表
jxl.write.WritableSheet ws = wwb.getSheet(0);
//獲得第一個單元格物件
jxl.write.WritableCell wc = ws.getWritableCell(0, 0);
//判斷單元格的型別, 做出相應的轉化
if(wc.getType() == CellType.LABEL)
{
Label l = (Label)wc;
    l.setString("The value has been modified.");
}
//寫入Excel物件
wwb.write();
//關閉可寫入的Excel物件
wwb.close();
//關閉只讀的Excel物件
rw.close();


之所以使用這種方式構建Excel物件,完全是因為效率的原因,因為上面的示例才是API的主要應用。為了提高效能,在讀取工作表時,與資料相關的一些輸出資訊,所有的格式資訊,如:字型、顏色等等,是不被處理的,因為我們的目的是獲得行資料的值,既使沒有了修飾,也不會對行資料的值產生什麼影響。唯一的不利之處就是,在記憶體中會同時儲存兩個同樣的工作表,這樣當工作表體積比較大時,會佔用相當大的記憶體,但現在好像記憶體的大小並不是什麼關鍵因素了。

一旦獲得了可寫入的工作表物件,我們就可以對單元格物件進行更新的操作了,在這裡我們不必呼叫API提供的add()方法,因為單元格已經於工作表當中,所以我們只需要呼叫相應的setXXX()方法,就可以完成更新的操作了。

盡單元格原有的格式化修飾是不能去掉的,我們還是可以將新的單元格修飾加上去,以使單元格的內容以不同的形式表現。

新生成的工作表物件是可寫入的,我們除了更新原有的單元格外,還可以新增新的單元格到工作表中,這與示例2的操作是完全一樣的。

最後,不要忘記呼叫write()方法,將更新的內容寫入到檔案中,然後關閉工作薄物件,這裡有兩個工作薄物件要關閉,一個是隻讀的,另外一個是可寫入的。


小結
本文只是對Java Excel API中常用的方法作了介紹,要想更詳盡地瞭解API,請大家參考API文件,或原始碼。Java Excel API是一個開放原始碼專案,請大家關注它的最新進展,有興趣的朋友也可以申請加入這個專案,或者是提出寶貴的意見。

參考資料

Java Excel API 文件