C語言變長陣列data[0]總結
C語言變長陣列data[0]
1、前言
今天在看程式碼中遇到一個結構中包含char data[0],第一次見到時感覺很奇怪,陣列的長度怎麼可以為零呢?於是上網搜尋一下這樣的用法的目的,發現在linux核心中,結構體中經常用到data[0]。這樣設計的目的是讓陣列長度是可變的,根據需要進行分配。方便操作,節省空間。
2、data[0]結構
經常遇到的結構形狀如下:
struct buffer { int data_len; //長度 char data[0]; //起始地址 };
在這個結構中,data是一個數組名;但該陣列沒有元素;該陣列的真實地址緊隨結構體buffer之後,而這個地址就是結構體後面資料的地址(如果給這個結構體分配的內容大於這個結構體實際大小,後面多餘的部分就是這個data的內容);這種宣告方法可以巧妙的實現C語言裡的陣列擴充套件。
寫個程式對比char data[0],char *data, char data[],如下所示:
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <string.h> 4 #include <stdint.h> 5 6 typedef struct 7 { 8 int data_len; 9 char data[0]; 10 }buff_st_1; 11 12 typedef struct 13 { 14 int data_len; 15 char *data; 16 }buff_st_2; 17 18 typedef struct 19 { 20 int data_len; 21 char data[]; 22 }buff_st_3; 23 24 int main() 25 { 26 printf("sizeof(buff_st_1)=%u\n", sizeof(buff_st_1)); 27 printf("sizeof(buff_st_2)=%u\n", sizeof(buff_st_2)); 28 printf("sizeof(buff_st_3)=%u\n", sizeof(buff_st_3)); 29 30 buff_st_1 buff1; 31 buff_st_2 buff2; 32 buff_st_3 buff3; 33 34 printf("buff1 address:%p,buff1.data_len address:%p,buff1.data address:%p\n", 35 &buff1, &(buff1.data_len), buff1.data); 36 37 printf("buff2 address:%p,buff2.data_len address:%p,buff2.data address:%p\n", 38 &buff2, &(buff2.data_len), buff2.data); 39 40 printf("buff3 address:%p,buff3.data_len address:%p,buff3.data address:%p\n", 41 &buff3, &(buff3.data_len), buff3.data); 42 43 return 0; 44 }
從結果可以看出data[0]和data[]不佔用空間,且地址緊跟在結構後面,而char *data作為指標,佔用4個位元組,地址不在結構之後。
3、實際當中的用法
在實際程式中,資料的長度很多是未知的,這樣通過變長的陣列可以方便的節省空間。對指標操作,方便資料型別的轉換。測試程式如下:
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <string.h> 4 #include <stdint.h> 5 6 typedef struct 7 { 8 int data_len; 9 char data[0]; 10 }buff_st_1; 11 12 typedef struct 13 { 14 int data_len; 15 char *data; 16 }buff_st_2; 17 18 typedef struct 19 { 20 int data_len; 21 char data[]; 22 }buff_st_3; 23 24 typedef struct 25 { 26 uint32_t id; 27 uint32_t age; 28 }student_st; 29 30 31 void print_stu(const student_st *stu) 32 { 33 printf("id:%u,age:%u\n", stu->id, stu->age); 34 } 35 36 int main() 37 { 38 student_st *stu = (student_st *)malloc(sizeof(student_st)); 39 stu->id = 100; 40 stu->age = 23; 41 42 student_st *tmp = NULL; 43 44 buff_st_1 *buff1 = (buff_st_1 *)malloc(sizeof(buff_st_1) + sizeof(student_st)); 45 buff1->data_len = sizeof(student_st); 46 memcpy(buff1->data, stu, buff1->data_len); 47 printf("buff1 address:%p,buff1->data_len address:%p,buff1->data address:%p\n", 48 buff1, &(buff1->data_len), buff1->data); 49 50 tmp = (student_st*)buff1->data; 51 print_stu(tmp); 52 53 buff_st_2 *buff2 = (buff_st_2 *)malloc(sizeof(buff_st_2)); 54 buff2->data_len = sizeof(student_st); 55 buff2->data = (char *)malloc(buff2->data_len); 56 memcpy(buff2->data, stu, buff2->data_len); 57 printf("buff2 address:%p,buff2->data_len address:%p,buff2->data address:%p\n", 58 buff2, &(buff2->data_len), buff2->data); 59 60 tmp = (student_st *)buff2->data; 61 print_stu(tmp); 62 63 buff_st_3 *buff3 = (buff_st_3 *)malloc(sizeof(buff_st_3) + sizeof(student_st)); 64 buff3->data_len = sizeof(student_st); 65 memcpy(buff3->data, stu, buff3->data_len); 66 printf("buff3 address:%p,buff3->data_len address:%p,buff3->data address:%p\n", 67 buff3, &(buff3->data_len), buff3->data); 68 69 tmp = (student_st*)buff1->data; 70 print_stu(tmp); 71 72 free(buff1); 73 74 free(buff2->data); 75 free(buff2); 76 77 free(buff3); 78 free(stu); 79 return 0; 80 }
程式執行結果如下:
採用char *data,需要進行二次分配,操作比較麻煩,很容易造成記憶體洩漏。而直接採用變長的陣列,只需要分配一次,然後進行取值即可以。
GCC 中零長陣列
GCC 中允許使用零長陣列,把它作為結構體的最後一個元素非常有用,下面例子出自 gcc 官方文件。
struct line {
int length; char contents[0]; }; struct line *thisline = (struct line *) malloc (sizeof (struct line) + this_length); thisline->length = this_length;
從上例就可以看出,零長陣列在有固定頭部的可變物件上非常適用,我們可以根據物件的大小動態地去分配結構體的大小。
在 Linux 核心中也有這種應用,例如由於 PID 名稱空間的存在,每個程序 PID 需要對映到所有能看到其的名稱空間上,但該程序所在的名稱空間在開始並不確定(但至少為 init 名稱空間),需要在執行是根據 level 的值來確定,所以在該結構體後面增加了一個長度為 1 的陣列(因為至少在一個init名稱空間上),使得該結構體 pid 是個可變長的結構體,在執行時根據程序所處的名稱空間的 level 來決定 numbers 分配多大。(注:雖然不是零長度的陣列,但用法是一樣的)
struct pid
{
atomic_t count; unsigned int level; /* lists of tasks that use this pid */ struct hlist_head tasks[PIDTYPE_MAX]; struct rcu_head rcu; struct upid numbers[1]; };