結構體深度剖析(記憶體對齊,對齊引數,偏移量)
一、瞭解結構體
1
在C語言中,除了最常見用資料型別,字元型別(char)、整數型別(short、int、long )、實型(float、double),,,,,,最常見也是最經典的還有一種資料型別,那就是結構體。
二、結構體經典面試題:
(1)、什麼是結構體?
(2)、一般在什麼情況下用到結構體?
(3)、什麼是結構體記憶體對齊?為什麼要對齊?怎樣對齊?
(4)、對齊引數如何設定?可以設定為按照任意位元組數對齊嗎?
(5)、如何知道結構體某個成員相對於結構體起始位置的偏移量?
三、 下面,我們圍繞以上提出的6個問題來解釋結構體。
(1)、什麼是結構體?
定義:結構體是一系列資料的集合這些資料可能描述了一個物體,也可能是對一個問題的抽象。舉個栗子,簡單的說,對於人,人有名字,性別,年齡,身高,體重等個人資訊,那麼,我們在定義這種個體的時候,就不能說它能用一個字元或整型變數來定義。 這時候,就需要結構體閃亮登場了。
for example 1:
struct people
{
char name[20];
int age;
char gender[3];
float height;
};
(2)、一般在什麼情況下用到結構體?
a、一般當內建記憶體無法滿足使用者需要,沒有合適型別對應物件時,需要封裝特定的型別
b、當函式有多個引數時,返回值過多,需要封裝特定型別,將引數打包返回。
(3)、什麼是結構體記憶體對齊?為什麼要對齊?怎樣對齊?
結構體記憶體對齊:元素是按照定義順序一個一個放到記憶體中去的,但並不是緊密排列的。從結構體儲存的首地址開始,每個元素放置到記憶體中時,它都會認為記憶體是按照自己的大小來劃分的,因此元素放置的位置一定會在自己寬度的整數倍上開始。
for example2:
struct A
{
int a;
char b;
double c;
char d;
};
解析:
在windows系統32位平臺上:
int佔4個位元組
char佔1個位元組
float佔4個位元組
double佔8個位元組
int a從0偏移開始,佔四個位元組,即佔用0,1,2,3,現在可用偏移為4偏移,接下來存char b; 由於4是1的倍數,故而,b佔用4偏移,接下來可用偏移為5偏移,接下來該存double c; 由於5不是8的倍數,所以向後偏移5,6,7,都不是8的倍數,偏移到8時,8是8的倍數,故而c從8處開始儲存,佔用8,9,10,11,12,13,14,15偏移,現在可用偏移為16偏移,最後該存char d ;因為16是1的倍數,故d佔用16偏移,接下來在整體向後偏移一位,現處於17偏移,min(預設對齊引數,型別最大位元組數)=8;因為17不是8的倍數,所以繼續向後偏移18…23都不是8的倍數,到24偏移處時,24為8的整數倍,故而,該結構體大小為24個位元組。
方法總結:
a、從零偏移處開始,按位元組大小計算,判斷此偏移地址是否為該成員變數和對齊引數兩者之間的最小值,即min(對齊引數,sizeof()成員);
b、若是,則從此處開始佔用記憶體,大小為該型別所佔位元組數值,若不是,則記憶體向後偏移到最小值整數倍處,再開始佔用空間。
c、按a、b、兩步驟算出結構體實際所佔記憶體時,為了方便後面型別的儲存,再向後偏移一位,然後判斷該地址是否是預設對齊數與該結構體中最大型別所佔位元組數的最小值 ,即:min(預設對齊引數,型別最大位元組數)的整數倍,若是,則當前偏移地址的位元組數便是結構體大小,若不是,繼續向後偏移,直至為最小值整數倍為止。
(4)、對齊引數如何設定?可以設定為按照任意位元組數對齊嗎?
解析:在windows中,VS編譯器下,預設對齊數為8;
在Linux中,預設對齊數為4
設定對齊引數可在結構體struct之前加上#pragma pack(對齊數),在struct之後加上#pragma pack;便可以設定對齊引數。
for example3:
#pragma pack(4)
struct A
{
int a;
char b;
double c;
char d;
};
#pragma pack;
對齊引數不能任意設定,只能是內建型別已有的位元組數,如:char(1)、short(2),int(4),double(8)…不能是3,5…任意數。
(5)、如何知道結構體某個成員相對於結構體起始位置的偏移量?
使用offsetof巨集來判斷結構體中成員的偏移地址。使用offsetof巨集需要包含stddef.h標頭檔案,該巨集定義如下:
#define offsetof(type,menber) (size_t)&(((type*)0)->member)
巧妙之處在於將地址0強制轉換為type型別的指標,從而定位到member在結構體中偏移位置,編譯器認為0是一個有效的地址,從而認為0是type指標的起始地址。
到了這裡,本文已接近尾聲了,下篇部落格將更新位段、聯合以及大小端的相關知識詳盡剖析,敬請期待。