1. 程式人生 > >C:檔案操作

C:檔案操作

檔案
檔案的基本概念
  所謂“檔案”是指一組相關資料的有序集合。 這個資料集有一個名稱,叫做檔名。 實際上在前面的各章中我們已經多次使用了檔案,例如源程式檔案、目標檔案、可執行檔案、庫檔案 (標頭檔案)等。檔案通常是駐留在外部介質(如磁碟等)上的, 在使用時才調入記憶體中來。從不同的角度可對檔案作不同的分類。從使用者的角度看,檔案可分為普通檔案和裝置檔案兩種。

  普通檔案是指駐留在磁碟或其它外部介質上的一個有序資料集,可以是原始檔、目標檔案、可執行程式; 也可以是一組待輸入處理的原始資料,或者是一組輸出的結果。對於原始檔、目標檔案、可執行程式可以稱作程式檔案,對輸入輸出資料可稱作資料檔案。

  裝置檔案是指與主機相聯的各種外部裝置,如顯示器、印表機、鍵盤等。在作業系統中,把外部裝置也看作是一個檔案來進行管理,把它們的輸入、輸出等同於對磁碟檔案的讀和寫。通常把顯示器定義為標準輸出檔案, 一般情況下在螢幕上顯示有關資訊就是向標準輸出檔案輸出。如前面經常使用的printf,putchar 函式就是這類輸出。鍵盤通常被指定標準的輸入檔案, 從鍵盤上輸入就意味著從標準輸入檔案上輸入資料。scanf,getchar函式就屬於這類輸入。 

  從檔案編碼的方式來看,檔案可分為ASCII碼檔案和二進位制碼檔案兩種。

  ASCII檔案也稱為文字檔案,這種檔案在磁碟中存放時每個字元對應一個位元組,用於存放對應的ASCII碼。例如,數5678的儲存形式為:
ASC碼:  00110101 00110110 00110111 00111000
     ↓     ↓    ↓    ↓
十進位制碼: 5     6    7    8 共佔用4個位元組。ASCII碼檔案可在螢幕上按字元顯示, 例如源程式檔案就是ASCII檔案,用DOS命令TYPE可顯示檔案的內容。 由於是按字元顯示,因此能讀懂檔案內容。

  二進位制檔案是按二進位制的編碼方式來存放檔案的。 例如, 數5678的儲存形式為: 00010110 00101110只佔二個位元組。二進位制檔案雖然也可在螢幕上顯示, 但其內容無法讀懂。C系統在處理這些檔案時,並不區分型別,都看成是字元流,按位元組進行處理。 輸入輸出字元流的開始和結束只由程式控制而不受物理符號(如回車符)的控制。 因此也把這種檔案稱作“流式檔案”。

  本章討論流式檔案的開啟、關閉、讀、寫、 定位等各種操作。檔案指標在C語言中用一個指標變數指向一個檔案, 這個指標稱為檔案指標。通過檔案指標就可對它所指的檔案進行各種操作。定義說明檔案指標的一般形式為: FILE* 指標變數識別符號; 其中FILE應為大寫,它實際上是由系統定義的一個結構,該結構中含有檔名、檔案狀態和檔案當前位置等資訊。 在編寫源程式時不必關心FILE結構的細節。例如:FILE *fp; 表示fp是指向FILE結構的指標變數,通過fp 即可找存放某個檔案資訊的結構變數,然後按結構變數提供的資訊找到該檔案, 實施對檔案的操作。習慣上也籠統地把fp稱為指向一個檔案的指標。檔案的開啟與關閉檔案在進行讀寫操作之前要先開啟,使用完畢要關閉。 所謂開啟檔案,實際上是建立檔案的各種有關資訊,並使檔案指標指向該檔案,以便進行其它操作。關閉檔案則斷開指標與檔案之間的聯絡,也就禁止再對該檔案進行操作。

  在C語言中,檔案操作都是由庫函式來完成的。 在本章內將介紹主要的檔案操作函式。

檔案開啟函式fopen

  fopen函式用來開啟一個檔案,其呼叫的一般形式為:檔案指標名=fopen(檔名,使用檔案方式) 其中,“檔案指標名”必須是被說明為FILE 型別的指標變數,“檔名”是被開啟檔案的檔名。 “使用檔案方式”是指檔案的型別和操作要求。“檔名”是字串常量或字串陣列。例如: 
FILE *fp;
fp=("file a","r");
其意義是在當前目錄下開啟檔案file a,只允許進行“讀”操作,並使fp指向該檔案。
又如:
FILE *fphzk
fphzk=("c:\\hzk16',"rb")
其意義是開啟C驅動器磁碟的根目錄下的檔案hzk16, 這是一個二進位制檔案,只允許按二進位制方式進行讀操作。兩個反斜線“\\ ”中的第一個表示轉義字元,第二個表示根目錄。使用檔案的方式共有12種,下面給出了它們的符號和意義。 
檔案使用方式        意 義
“rt”      只讀開啟一個文字檔案,只允許讀資料 
“wt”      只寫開啟或建立一個文字檔案,只允許寫資料
“at”      追加開啟一個文字檔案,並在檔案末尾寫資料
“rb”      只讀開啟一個二進位制檔案,只允許讀資料
“wb”       只寫開啟或建立一個二進位制檔案,只允許寫資料
“ab”       追加開啟一個二進位制檔案,並在檔案末尾寫資料
“rt+”      讀寫開啟一個文字檔案,允許讀和寫
“wt+”      讀寫開啟或建立一個文字檔案,允許讀寫
“at+”      讀寫開啟一個文字檔案,允許讀,或在檔案末追加數 據
“rb+”      讀寫開啟一個二進位制檔案,允許讀和寫 
“wb+”      讀寫開啟或建立一個二進位制檔案,允許讀和寫
“ab+”      讀寫開啟一個二進位制檔案,允許讀,或在檔案末追加資料

對於檔案使用方式有以下幾點說明:
1. 檔案使用方式由r,w,a,t,b,+六個字元拼成,各字元的含義是:
r(read): 讀
w(write): 寫
a(append): 追加
t(text): 文字檔案,可省略不寫
b(banary): 二進位制檔案
+: 讀和寫

2. 凡用“r”開啟一個檔案時,該檔案必須已經存在, 且只能從該檔案讀出。

3. 用“w”開啟的檔案只能向該檔案寫入。 若開啟的檔案不存在,則以指定的檔名建立該檔案,若開啟的檔案已經存在,則將該檔案刪去,重建一個新檔案。

4. 若要向一個已存在的檔案追加新的資訊,只能用“a ”方式開啟檔案。但此時該檔案必須是存在的,否則將會出錯。

5. 在開啟一個檔案時,如果出錯,fopen將返回一個空指標值NULL。在程式中可以用這一資訊來判別是否完成開啟檔案的工作,並作相應的處理。因此常用以下程式段開啟檔案:
if((fp=fopen("c:\\hzk16","rb")==NULL)
{
printf("\nerror on open c:\\hzk16 file!");
getch();
exit(1);
}
  這段程式的意義是,如果返回的指標為空,表示不能開啟C盤根目錄下的hzk16檔案,則給出提示資訊“error on open c:\ hzk16file!”,下一行getch()的功能是從鍵盤輸入一個字元,但不在螢幕上顯示。在這裡,該行的作用是等待,只有當用戶從鍵盤敲任一鍵時,程式才繼續執行, 因此使用者可利用這個等待時間閱讀出錯提示。敲鍵後執行exit(1)退出程式。

6. 把一個文字檔案讀入記憶體時,要將ASCII碼轉換成二進位制碼, 而把檔案以文字方式寫入磁碟時,也要把二進位制碼轉換成ASCII碼,因此文字檔案的讀寫要花費較多的轉換時間。對二進位制檔案的讀寫不存在這種轉換。

7. 標準輸入檔案(鍵盤),標準輸出檔案(顯示器 ),標準出錯輸出(出錯資訊)是由系統開啟的,可直接使用。檔案關閉函式fclose檔案一旦使用完畢,應用關閉檔案函式把檔案關閉, 以避免檔案的資料丟失等錯誤。

fclose函式

呼叫的一般形式是: fclose(檔案指標); 例如:
fclose(fp); 正常完成關閉檔案操作時,fclose函式返回值為0。如返回非零值則表示有錯誤發生。檔案的讀寫對檔案的讀和寫是最常用的檔案操作。 

在C語言中提供了多種檔案讀寫的函式: 
·字元讀寫函式 :fgetc和fputc
·字串讀寫函式:fgets和fputs
·資料塊讀寫函式:freed和fwrite
·格式化讀寫函式:fscanf和fprinf

  下面分別予以介紹。使用以上函式都要求包含標頭檔案stdio.h。字元讀寫函式fgetc和fputc字元讀寫函式是以字元(位元組)為單位的讀寫函式。 每次可從檔案讀出或向檔案寫入一個字元。

一、讀字元函式fgetc

  fgetc函式的功能是從指定的檔案中讀一個字元,函式呼叫的形式為:字元變數=fgetc(檔案指標); 例如:ch=fgetc(fp);其意義是從開啟的檔案fp中讀取一個字元並送入ch中。

  對於fgetc函式的使用有以下幾點說明:
1. 在fgetc函式呼叫中,讀取的檔案必須是以讀或讀寫方式開啟的。

2. 讀取字元的結果也可以不向字元變數賦值,例如:fgetc(fp);但是讀出的字元不能儲存。

3. 在檔案內部有一個位置指標。用來指向檔案的當前讀寫位元組。在檔案開啟時,該指標總是指向檔案的第一個位元組。使用fgetc 函式後, 該位置指標將向後移動一個位元組。 因此可連續多次使用fgetc函式,讀取多個字元。 應注意檔案指標和檔案內部的位置指標不是一回事。檔案指標是指向整個檔案的,須在程式中定義說明,只要不重新賦值,檔案指標的值是不變的。檔案內部的位置指標用以指示檔案內部的當前讀寫位置,每讀寫一次,該指標均向後移動,它不需在程式中定義說明,而是由系統自動設定的。

[例10.1]讀入檔案e10-1.c,在螢幕上輸出。
#include<stdio.h>
main()
{
FILE *fp;
char ch;
if((fp=fopen("e10_1.c","rt"))==NULL)
{
printf("Cannot open file strike any key exit!");
getch();
exit(1);
}
ch=fgetc(fp);
while (ch!=EOF)
{
putchar(ch);
ch=fgetc(fp);
}
fclose(fp);
}
  本例程式的功能是從檔案中逐個讀取字元,在螢幕上顯示。 程式定義了檔案指標fp,以讀文字檔案方式開啟檔案“e10_1.c”, 並使fp指向該檔案。如開啟檔案出錯, 給出提示並退出程式。程式第12行先讀出一個字元,然後進入迴圈,只要讀出的字元不是檔案結束標誌(每個檔案末有一結束標誌EOF)就把該字元顯示在螢幕上,再讀入下一字元。每讀一次,檔案內部的位置指標向後移動一個字元,檔案結束時,該指標指向EOF。執行本程式將顯示整個檔案。

二、寫字元函式fputc

  fputc函式的功能是把一個字元寫入指定的檔案中,函式呼叫的形式為: fputc(字元量,檔案指標); 其中,待寫入的字元量可以是字元常量或變數,例如:fputc('a',fp);其意義是把字元a寫入fp所指向的檔案中。

  對於fputc函式的使用也要說明幾點:
1. 被寫入的檔案可以用、寫、讀寫,追加方式開啟,用寫或讀寫方式開啟一個已存在的檔案時將清除原有的檔案內容,寫入字元從檔案首開始。如需保留原有檔案內容,希望寫入的字元以檔案末開始存放,必須以追加方式開啟檔案。被寫入的檔案若不存在,則建立該檔案。

2. 每寫入一個字元,檔案內部位置指標向後移動一個位元組。

3. fputc函式有一個返回值,如寫入成功則返回寫入的字元, 否則返回一個EOF。可用此來判斷寫入是否成功。

[例10.2]從鍵盤輸入一行字元,寫入一個檔案, 再把該檔案內容讀出顯示在螢幕上。
#include<stdio.h>
main()
{
FILE *fp;
char ch;
if((fp=fopen("string","wt+"))==NULL)
{
printf("Cannot open file strike any key exit!");
getch();
exit(1);
}
printf("input a string:\n");
ch=getchar();
while (ch!='\n')
{
fputc(ch,fp);
ch=getchar();
}
rewind(fp);
ch=fgetc(fp);
while(ch!=EOF)
{
putchar(ch);
ch=fgetc(fp);
}
printf("\n");
fclose(fp);
}
  程式中第6行以讀寫文字檔案方式開啟檔案string。程式第13行從鍵盤讀入一個字元後進入迴圈,當讀入字元不為回車符時,則把該字元寫入檔案之中,然後繼續從鍵盤讀入下一字元。 每輸入一個字元,檔案內部位置指標向後移動一個位元組。寫入完畢, 該指標已指向檔案末。如要把檔案從頭讀出,須把指標移向檔案頭,程式第19行rewind函式用於把fp所指檔案的內部位置指標移到檔案頭。 第20至25行用於讀出檔案中的一行內容。

[例10.3]把命令列引數中的前一個檔名標識的檔案, 複製到後一個檔名標識的檔案中, 如命令列中只有一個檔名則把該檔案寫到標準輸出檔案(顯示器)中。
#include<stdio.h>
main(int argc,char *argv[])
{
FILE *fp1,*fp2;
char ch;
if(argc==1)
{
printf("have not enter file name strike any key exit");
getch();
exit(0);
}
if((fp1=fopen(argv[1],"rt"))==NULL)
{
printf("Cannot open %s\n",argv[1]);
getch();
exit(1);
}
if(argc==2) fp2=stdout;
else if((fp2=fopen(argv[2],"wt+"))==NULL)
{
printf("Cannot open %s\n",argv[1]);
getch();
exit(1);
}
while((ch=fgetc(fp1))!=EOF)
fputc(ch,fp2);
fclose(fp1);
fclose(fp2);
}
  本程式為帶參的main函式。程式中定義了兩個檔案指標 fp1 和fp2,分別指向命令列引數中給出的檔案。如命令列引數中沒有給出檔名,則給出提示資訊。程式第18行表示如果只給出一個檔名,則使fp2指向標準輸出檔案(即顯示器)。程式第25行至28行用迴圈語句逐個讀出檔案1中的字元再送到檔案2中。再次執行時,給出了一個檔名(由例10.2所建立的檔案), 故輸出給標準輸出檔案stdout,即在顯示器上顯示檔案內容。第三次執行,給出了二個檔名,因此把string中的內容讀出,寫入到OK之中。可用DOS命令type顯示OK的內容:字串讀寫函式fgets和fputs

一、讀字串函式fgets函式的功能是從指定的檔案中讀一個字串到字元陣列中,函式呼叫的形式為: fgets(字元陣列名,n,檔案指標);其中的n是一個正整數。表示從檔案中讀出的字串不超過 n-1個字元。在讀入的最後一個字元後加上串結束標誌'\0'。例如:fgets(str,n,fp);的意義是從fp所指的檔案中讀出n-1個字元送入字元陣列str中。
[例10.4]從e10_1.c檔案中讀入一個含10個字元的字串。
#include<stdio.h>
main()
{
FILE *fp;
char str[11];
if((fp=fopen("e10_1.c","rt"))==NULL)
{
printf("Cannot open file strike any key exit!");
getch();
exit(1);
}
fgets(str,11,fp);
printf("%s",str);
fclose(fp);
}
  本例定義了一個字元陣列str共11個位元組,在以讀文字檔案方式開啟檔案e101.c後,從中讀出10個字元送入str陣列,在陣列最後一個單元內將加上'\0',然後在螢幕上顯示輸出str陣列。輸出的十個字元正是例10.1程式的前十個字元。

  對fgets函式有兩點說明:
1. 在讀出n-1個字元之前,如遇到了換行符或EOF,則讀出結束。
2. fgets函式也有返回值,其返回值是字元陣列的首地址。

二、寫字串函式fputs

fputs函式的功能是向指定的檔案寫入一個字串,其呼叫形式為: fputs(字串,檔案指標) 其中字串可以是字串常量,也可以是字元陣列名,或指標 變數,例如:
fputs(“abcd“,fp);
其意義是把字串“abcd”寫入fp所指的檔案之中。[例10.5]在例10.2中建立的檔案string中追加一個字串。
#include<stdio.h>
main()
{
FILE *fp;
char ch,st[20];
if((fp=fopen("string","at+"))==NULL)
{
printf("Cannot open file strike any key exit!");
getch();
exit(1);
}
printf("input a string:\n");
scanf("%s",st);
fputs(st,fp);
rewind(fp);
ch=fgetc(fp);
while(ch!=EOF)
{
putchar(ch);
ch=fgetc(fp);
}
printf("\n");
fclose(fp);
}
  本例要求在string檔案末加寫字串,因此,在程式第6行以追加讀寫文字檔案的方式開啟檔案string 。 然後輸入字串, 並用fputs函式把該串寫入檔案string。在程式15行用rewind函式把檔案內部位置指標移到檔案首。 再進入迴圈逐個顯示當前檔案中的全部內容。

資料塊讀寫函式fread和fwrite

  C語言還提供了用於整塊資料的讀寫函式。 可用來讀寫一組資料,如一個數組元素,一個結構變數的值等。讀資料塊函式呼叫的一般形式為: fread(buffer,size,count,fp); 寫資料塊函式呼叫的一般形式為: fwrite(buffer,size,count,fp); 其中buffer是一個指標,在fread函式中,它表示存放輸入資料的首地址。在fwrite函式中,它表示存放輸出資料的首地址。 size 表示資料塊的位元組數。count 表示要讀寫的資料塊塊數。fp 表示檔案指標。
例如:
fread(fa,4,5,fp); 其意義是從fp所指的檔案中,每次讀4個位元組(一個實數)送入實陣列fa中,連續讀5次,即讀5個實數到fa中。
[例10.6]從鍵盤輸入兩個學生資料,寫入一個檔案中, 再讀出這兩個學生的資料顯示在螢幕上。
#include<stdio.h>
struct stu
{
char name[10];
int num;
int age;
char addr[15];
}boya[2],boyb[2],*pp,*qq;
main()
{
FILE *fp;
char ch;
int i;
pp=boya;
qq=boyb;
if((fp=fopen("stu_list","wb+"))==NULL)
{
printf("Cannot open file strike any key exit!");
getch();
exit(1);
}
printf("\ninput data\n");
for(i=0;i<2;i++,pp++)
scanf("%s%d%d%s",pp->name,&pp->num,&pp->age,pp->addr);
pp=boya;
fwrite(pp,sizeof(struct stu),2,fp);
rewind(fp);
fread(qq,sizeof(struct stu),2,fp);
printf("\n\nname\tnumber age addr\n");
for(i=0;i<2;i++,qq++)
printf("%s\t%5d%7d%s\n",qq->name,qq->num,qq->age,qq->addr);
fclose(fp);
}
  本例程式定義了一個結構stu,說明了兩個結構陣列boya和 boyb以及兩個結構指標變數pp和qq。pp指向boya,qq指向boyb。程式第16行以讀寫方式開啟二進位制檔案“stu_list”,輸入二個學生資料之後,寫入該檔案中, 然後把檔案內部位置指標移到檔案首,讀出兩塊學生資料後,在螢幕上顯示。

格式化讀寫函式fscanf和fprintf

fscanf函式,fprintf函式與前面使用的scanf和printf 函式的功能相似,都是格式化讀寫函式。 兩者的區別在於 fscanf 函式和fprintf函式的讀寫物件不是鍵盤和顯示器,而是磁碟檔案。這兩個函式的呼叫格式為: fscanf(檔案指標,格式字串,輸入表列); fprintf(檔案指標,格式字串,輸出表列); 例如:
fscanf(fp,"%d%s",&i,s);
fprintf(fp,"%d%c",j,ch); 
用fscanf和fprintf函式也可以完成例10.6的問題。修改後的程式如例10.7所示。
[例10.7]
#include<stdio.h>
struct stu
{
char name[10];
int num;
int age;
char addr[15];
}boya[2],boyb[2],*pp,*qq;
main()
{
FILE *fp;
char ch;
int i;
pp=boya;
qq=boyb;
if((fp=fopen("stu_list","wb+"))==NULL)
{
printf("Cannot open file strike any key exit!");
getch();
exit(1);
}
printf("\ninput data\n");
for(i=0;i<2;i++,pp++)
scanf("%s%d%d%s",pp->name,&pp->num,&pp->age,pp->addr);
pp=boya;
for(i=0;i<2;i++,pp++)
fprintf(fp,"%s %d %d %s\n",pp->name,pp->num,pp->age,pp->
addr);
rewind(fp);
for(i=0;i<2;i++,qq++)
fscanf(fp,"%s %d %d %s\n",qq->name,&qq->num,&qq->age,qq->addr);
printf("\n\nname\tnumber age addr\n");
qq=boyb;
for(i=0;i<2;i++,qq++)
printf("%s\t%5d %7d %s\n",qq->name,qq->num, qq->age,
qq->addr);
fclose(fp);
}
  與例10.6相比,本程式中fscanf和fprintf函式每次只能讀寫一個結構陣列元素,因此採用了迴圈語句來讀寫全部陣列元素。還要注意指標變數pp,qq由於迴圈改變了它們的值,因此在程式的25和32行分別對它們重新賦予了陣列的首地址。