1. 程式人生 > >淺談 .NET 中的對象引用、非托管指針和托管指針

淺談 .NET 中的對象引用、非托管指針和托管指針

deb 這樣的 str lds 應該 運算 dst 調用 讀取

目錄

  • 前言
  • 一、對象引用
  • 二、值傳遞和引用傳遞
  • 三、初識托管指針和非托管指針
  • 四、非托管指針
    • 1、非托管指針不能指向對象引用
    • 2、類成員指針
  • 五、托管指針

前言

本文主要是以 C# 為例介紹 .NET 中的三種指針類型(本文不包含對於函數指針的介紹):對象引用非托管指針托管指針

學習是一個不斷深化理解的過程,借此博客,把自己關於 .NET 中指針相關的理解和大家一起討論一下,若有表述不清楚,理解不正確之處,還請大家批評指正。

開始話題之前,我們不妨先對一些概念作出定義。

變量:給存儲單元指定名稱、即定義內存單元的名稱或者說是標識。

指針:一種特殊的變量、其存儲的是值的地址而不是值本身。

一、對象引用

對於對象引用,大家都不會陌生。

與值類型變量直接包含值不同,引用類型變量存儲的是數據的存儲位置(托管堆內存地址)。

對象引用是在托管堆上分配的對象的開始位置指針。訪問數據時,運行時要先從變量中讀取內存位置(隱式間接尋址),再跳轉到包含數據的內存位置,這一切都是隱藏在CLR背後發生的事情,我們在使用引用類型的時候,並不需要關心其背後的實現。

二、值傳遞和引用傳遞

很多朋友,包括我,在初期學習的時候,可能都會有這麽一個認知誤區:"對象在C#中是按引用傳遞的"。

對於引用傳遞,借鑒《深入理解C#》中話,我們需要記住這一點:

假如以引用傳遞的方式來傳送一個變量,那麽調用的方法可以通過更改其參數值,來改變調用者的變量值。

例如下面這麽一個例子:

static  void Main(string[] args)
{
    Foo foo = new Foo
    {
        Name = "A"
    };

    Test(foo);

    Console.WriteLine(foo.Name); // 輸出B
}

static void Test(Foo obj)
{
    obj.Name = "B";
    obj = new Foo
    {
        Name = "C"
    };
}

按照引用傳遞的定義,上述代碼的結果應該是 C,但實際輸出的是 B。

因為 C# 默認是按值傳遞的,在將Main函數中的 foo 變量傳入Test函數時,會將它所包含的值(對象引用)復制給變量obj。所以可以通過obj變量修改原來的實例成員,這僅僅是由於引用類型的特性導致的,並不是所謂的引用傳遞。因為如果將obj變量指向一個新的實例,並不會影響到foo變量,它們兩者是完全獨立的。

技術分享圖片

只要對上述代碼做一個小修改,就能順利地打印出 C,也就是通過大家習慣的 ref 關鍵詞。

static void Main(string[] args)
{
    Foo foo = new Foo
    {
        Name = "A"
    };

    Test(ref foo);

    Console.WriteLine(foo.Name); // 輸出C
}

static void Test(ref Foo obj)
{
    obj.Name = "B";
    obj = new Foo
    {
        Name = "C"
    };
}

技術分享圖片

三、初識托管指針和非托管指針

在C#中,如果我們想要定義一個引用傳遞的方法,我們需要通過給方法參數加上 ref 或者 out 關鍵詞。

同時C#也允許我們通過 unsafe 關鍵詞編寫不安全的代碼。那麽這兩者到底有什麽區別呢。

以以下C#代碼為例:

static unsafe void Main(string[] args)
{
    int a, b;
    Method1(&a); // 使用非托管指針
    Method2(out b); // 使用out關鍵詞

    Console.WriteLine($"a:{a},b:{b}"); // a:1,b:2
}

static unsafe void Method1(int* num)
{
    *num = 1;
}

static void Method2(out int b)
{
    b = 2;
}

接下來,我們通過查看生成的IL的代碼來分析一下這兩者之間的區別。

.assembly extern mscorlib {}
.assembly ‘App‘ {}

.class private auto ansi beforefieldinit
  PointerDemo.Program
    extends [mscorlib]System.Object
{

  .method private hidebysig static void
    Main(
      string[] args
    ) cil managed
  {
    .entrypoint
    .maxstack 3
    .locals init (
      [0] int32 a,
      [1] int32 b
    )

    // [8 9 - 8 10]
    IL_0000: nop

    // [10 13 - 10 25]
    IL_0001: ldloca.s     a
    IL_0003: conv.u
    IL_0004: call         void PointerDemo.Program::Method1(int32*)
    IL_0009: nop

    // [11 13 - 11 28]
    IL_000a: ldloca.s     b
    IL_000c: call         void PointerDemo.Program::Method2(int32&)
    IL_0011: nop

    // [13 13 - 13 47]
    IL_0012: ldstr        "a:{0},b:{1}"
    IL_0017: ldloc.0      // a
    IL_0018: box          [mscorlib]System.Int32
    IL_001d: ldloc.1      // b
    IL_001e: box          [mscorlib]System.Int32
    IL_0023: call         string [mscorlib]System.String::Format(string, object, object)
    IL_0028: call         void [mscorlib]System.Console::WriteLine(string)
    IL_002d: nop

    // [14 9 - 14 10]
    IL_002e: ret

  } // end of method Program::Main

  .method private hidebysig static void
    Method1(
      int32* num
    ) cil managed
  {
    .maxstack 8

    // [17 9 - 17 10]
    IL_0000: nop

    // [18 13 - 18 22]
    IL_0001: ldarg.0      // num
    IL_0002: ldc.i4.1
    IL_0003: stind.i4

    // [19 9 - 19 10]
    IL_0004: ret

  } // end of method Program::Method1

  .method private hidebysig static void
    Method2(
      [out] int32& b
    ) cil managed
  {
    .maxstack 8

    // [22 9 - 22 10]
    IL_0000: nop

    // [23 13 - 23 19]
    IL_0001: ldarg.0      // b
    IL_0002: ldc.i4.2
    IL_0003: stind.i4

    // [24 9 - 24 10]
    IL_0004: ret

  } // end of method Program::Method2

  .method public hidebysig specialname rtspecialname instance void
    .ctor() cil managed
  {
    .maxstack 8

    IL_0000: ldarg.0      // this
    IL_0001: call         instance void [mscorlib]System.Object::.ctor()
    IL_0006: nop
    IL_0007: ret

  } // end of method Program::.ctor
} // end of class PointerDemo.Program

可以看到

靜態方法Method1中的參數對應的IL代碼 int32* num。

靜態方法Method2中的參數對應的IL代碼是 [out] int32& b,其中[out]即使去除也不影響代碼的運行,上述代碼是可通過ilasm編譯的完整代碼,有興趣的朋友可以自己做嘗試。

通過學習《.NET探秘:MSIL權威指南》這本書,我們可以了解到很多相關的知識。

在CLR中可以定義兩種類型的指針:

ILAsm符號 說明
type* 指向type的非托管指針
type& 指向type的托管指針

也就是說用out/ref定義的指針類型其實對應的就是CLR中的托管指針

四、非托管指針

非托管指針的使用主要包括

尋址運算符 &

間接尋址運算符 *

用於結構指針的成員訪問運算符 ->

非托管指針的用法和C/C++基本一致,這邊不一一列出,下面主要列出幾個.net 中非托管指針的註意點。

1、非托管指針不能指向對象引用

我們知道一個引用類型的變量,它所存儲的是托管堆上的實例的內存地址。這個內存地址記錄本身也是保存在內存的某個位置。類似於我們用記事本記下了某人的聯系方式,同時這條聯系方式記錄本身也占據了我們記事本上一定的空間,被我們寫在了記事本的某個位置。

我們可以創建指向值類型變量的非托管指針,也可以創建多級非托管指針,但是不能創建指向引用類型變量(對象引用)的非托管指針

static unsafe void Main(string[] args)
{
    int num = 2;
    object obj = new object();
    int* pNum = # // 指向值類型變量的非托管指針,編譯通過
    int** ppNum = &pNum; // 二級指針,編譯通過
    object* pObj = &obj; // 指向引用類型變量的非托管指針,編譯不通過
}

2、類成員指針

如果我們想要創建一個對象的值類型成員變量的指針,按下方的代碼是無法編譯通過的。

class Foo
{
    public int Bar;
}

static unsafe void Main(string[] args)
{
    Foo foo = new Foo();

    int* p = &foo.Bar; // 編譯不通過
}

因為對於生存在托管堆上的引用類型的實例而言,在一次 GC 之後,其內存位置可能會發生變動(GC的compact階段),包含在實例內的成員變量也就隨之發生了位置的移動。對於標識內存位置的指針而言,顯然這樣的情況是不能夠被允許的。

但是我們可以通過 fixed 關鍵詞避免 GC 時實例內存位置的移動來實現這種類型的指針的創建,如下面代碼所示。

static unsafe void Main(string[] args)
{
    Foo foo = new Foo();

    fixed (int* p = &foo.Bar) // 編譯通過
    {
        Console.WriteLine((int)p); // 打印內存地址
        Console.WriteLine(*p); // 打印值
    }
}

同理,我們也可以利用 fixed 關鍵詞創建指向值類型數組的指針(數組是引用類型,這裏指數組的元素是值類型)。

static unsafe void Main(string[] args)
{
    int[] arr = { 1, 2 };

    // 除去 fixed 關鍵詞外,指向數組的非托管指針聲明方式與 C/C++ 類似
    fixed (int* p = arr)
    {
        // 指針保存的是第一個元素的內存地址
        Console.WriteLine(*p); // 輸出1
        // 通過 +1 可以獲取到第二個元素的內存地址
        Console.WriteLine(*(p + 1)); // 輸出2
    }
}

五、托管指針

在上文我們已經提到,我們在使用引用傳遞的時候使用的 ref/out 關鍵詞其實就是創建了托管指針。

C#7 之前,我們只能在方法參數上見到托管指針的身影,C#7 進一步開放了托管指針的功能,使得我們能夠在更多的場景下使用它們。例如和非托管指針一樣,用於方法的返回值,

托管指針完全受 CLR 管理,與非托管指針相比,在 C# 中(IL對於托管指針的限制會更少)托管指針存在以下幾個特點:

  • 只能引用已經存在的項,例如字段、局部變量或者方法參數,並不支持和非托管指針一樣的單獨聲明。
  • 不支持多級托管指針,但是托管指針能夠指向對象引用。
  • 不能夠打印內存地址的值。
  • 不能夠執行指針算法。
  • 不需要顯示的間接尋址(生成的IL代碼中執行了間接尋址 通過 ldind.i4、ldind.ref 等指令 )。
static void Main(string[] args)
{
    var foo = new Foo{Bar = 1};

    // 創建指向引用類型變量(對象引用)的托管指針
    ref Foo p = ref foo;

    // IL代碼中通過 ldind.ref 指令間接尋址找到對象引用
    Console.WriteLine(p.Bar); // 輸出1
}

淺談 .NET 中的對象引用、非托管指針和托管指針