1. 程式人生 > >C語言變長陣列data[0]總結

C語言變長陣列data[0]總結

C語言變長陣列data[0]

1、前言

  今天在看程式碼中遇到一個結構中包含char data[0],第一次見到時感覺很奇怪,陣列的長度怎麼可以為零呢?於是上網搜尋一下這樣的用法的目的,發現在linux核心中,結構體中經常用到data[0]。這樣設計的目的是讓陣列長度是可變的,根據需要進行分配。方便操作,節省空間。

2、data[0]結構

經常遇到的結構形狀如下:

struct buffer
{
    int data_len;   //長度
    char data[0];  //起始地址
};

  在這個結構中,data是一個數組名;但該陣列沒有元素;該陣列的真實地址緊隨結構體buffer之後,而這個地址就是結構體後面資料的地址(如果給這個結構體分配的內容大於這個結構體實際大小,後面多餘的部分就是這個data的內容);這種宣告方法可以巧妙的實現C語言裡的陣列擴充套件。

  寫個程式對比char data[0],char *data, char data[],如下所示:

複製程式碼
 1 #include <stdio.h>
 2 #include <stdlib.h>
 3 #include <string.h>
 4 #include <stdint.h>
 5 
 6 typedef struct
 7 {
 8     int data_len;
 9     char data[0];
10 }buff_st_1;
11 
12 typedef struct
13 {
14     int data_len;
15     char *data;
16 }buff_st_2;
17 
18 typedef struct 
19 {
20     int data_len;
21     char data[];
22 }buff_st_3;
23 
24 int main()
25 {
26     printf("sizeof(buff_st_1)=%u\n", sizeof(buff_st_1));
27     printf("sizeof(buff_st_2)=%u\n", sizeof(buff_st_2));
28     printf("sizeof(buff_st_3)=%u\n", sizeof(buff_st_3));
29 
30     buff_st_1 buff1;
31     buff_st_2 buff2;
32     buff_st_3 buff3;
33 
34     printf("buff1 address:%p,buff1.data_len address:%p,buff1.data address:%p\n",
35         &buff1, &(buff1.data_len), buff1.data);
36 
37     printf("buff2 address:%p,buff2.data_len address:%p,buff2.data address:%p\n",
38         &buff2, &(buff2.data_len), buff2.data);
39 
40     printf("buff3 address:%p,buff3.data_len address:%p,buff3.data address:%p\n",
41         &buff3, &(buff3.data_len), buff3.data);
42 
43     return 0;
44 }
複製程式碼

從結果可以看出data[0]和data[]不佔用空間,且地址緊跟在結構後面,而char *data作為指標,佔用4個位元組,地址不在結構之後。

3、實際當中的用法

     在實際程式中,資料的長度很多是未知的,這樣通過變長的陣列可以方便的節省空間。對指標操作,方便資料型別的轉換。測試程式如下:

複製程式碼
 1 #include <stdio.h>
 2 #include <stdlib.h>
 3 #include <string.h>
 4 #include <stdint.h>
 5 
 6 typedef struct
 7 {
 8     int data_len;
 9     char data[0];
10 }buff_st_1;
11 
12 typedef struct
13 {
14     int data_len;
15     char *data;
16 }buff_st_2;
17 
18 typedef struct 
19 {
20     int data_len;
21     char data[];
22 }buff_st_3;
23 
24 typedef struct 
25 {
26     uint32_t id;
27     uint32_t age;
28 }student_st;
29 
30 
31 void print_stu(const student_st *stu)
32 {
33     printf("id:%u,age:%u\n", stu->id, stu->age);
34 }
35 
36 int main()
37 {
38     student_st *stu = (student_st *)malloc(sizeof(student_st));
39     stu->id = 100;
40     stu->age = 23;
41 
42     student_st *tmp = NULL;
43 
44     buff_st_1 *buff1 = (buff_st_1 *)malloc(sizeof(buff_st_1) + sizeof(student_st));
45     buff1->data_len = sizeof(student_st);
46     memcpy(buff1->data, stu, buff1->data_len);
47     printf("buff1 address:%p,buff1->data_len address:%p,buff1->data address:%p\n",
48         buff1, &(buff1->data_len), buff1->data);
49 
50     tmp = (student_st*)buff1->data;
51     print_stu(tmp);
52 
53     buff_st_2 *buff2 = (buff_st_2 *)malloc(sizeof(buff_st_2));
54     buff2->data_len = sizeof(student_st);
55     buff2->data = (char *)malloc(buff2->data_len);
56     memcpy(buff2->data, stu, buff2->data_len);
57     printf("buff2 address:%p,buff2->data_len address:%p,buff2->data address:%p\n",
58         buff2, &(buff2->data_len), buff2->data);
59 
60     tmp = (student_st *)buff2->data;
61     print_stu(tmp);
62 
63     buff_st_3 *buff3 = (buff_st_3 *)malloc(sizeof(buff_st_3) + sizeof(student_st));
64     buff3->data_len = sizeof(student_st);
65     memcpy(buff3->data, stu, buff3->data_len);
66     printf("buff3 address:%p,buff3->data_len address:%p,buff3->data address:%p\n",
67         buff3, &(buff3->data_len), buff3->data);
68 
69     tmp = (student_st*)buff1->data;
70     print_stu(tmp);
71 
72     free(buff1);
73 
74     free(buff2->data);
75     free(buff2);
76 
77     free(buff3);
78     free(stu);
79     return 0;
80 }
複製程式碼

程式執行結果如下:
  採用char *data,需要進行二次分配,操作比較麻煩,很容易造成記憶體洩漏。而直接採用變長的陣列,只需要分配一次,然後進行取值即可以。

 

GCC 中零長陣列

GCC 中允許使用零長陣列,把它作為結構體的最後一個元素非常有用,下面例子出自 gcc 官方文件

struct line {
    int length; char contents[0]; }; struct line *thisline = (struct line *) malloc (sizeof (struct line) + this_length); thisline->length = this_length; 

從上例就可以看出,零長陣列在有固定頭部的可變物件上非常適用,我們可以根據物件的大小動態地去分配結構體的大小。

在 Linux 核心中也有這種應用,例如由於 PID 名稱空間的存在,每個程序 PID 需要對映到所有能看到其的名稱空間上,但該程序所在的名稱空間在開始並不確定(但至少為 init 名稱空間),需要在執行是根據 level 的值來確定,所以在該結構體後面增加了一個長度為 1 的陣列(因為至少在一個init名稱空間上),使得該結構體 pid 是個可變長的結構體,在執行時根據程序所處的名稱空間的 level 來決定 numbers 分配多大。(注:雖然不是零長度的陣列,但用法是一樣的

struct pid
{
    atomic_t count; unsigned int level; /* lists of tasks that use this pid */ struct hlist_head tasks[PIDTYPE_MAX]; struct rcu_head rcu; struct upid numbers[1]; };