1. 程式人生 > >Unity 協程運行時的監控和優化

Unity 協程運行時的監控和優化

eset 喚醒 end execution iat 分享 部分 handle block

我是快樂的搬運工: http://gulu-dev.com/post/perf_assist/2016-12-20-unity-coroutine-optimizing#toc_0

------------------------------------------------------------------------ 分割線 ----------------------------------------------------------------------------

目錄:

Warm up: 從復用 Yield 對象說起
  Coroutine 的工作原理
  接管和監控 Coroutine 的行為 ? 問題描述
  中間層 TrackedCoroutine
  啟動函數 InvokeStart()
  監控 Plugins 內的協程

PerfAssist 組件 - CoroutineTracker (on GitHub) ? 功能介紹
  常見問題調查

技術分享圖片

協程 (Coroutine) 是大部分現代編程環境都提供的一個非常有用的機制。它允許我們把不同時刻發生的行為,在代碼中以線性的方式聚合起來。與基於事件與回調的系統相比,以協程方式組織的業務邏輯,可讀性相對好一些。

Unity 內的協程實現是傳統協程的簡化——在主線程內每一幀給定的時間點上,引擎通過一定的調度機制來喚醒和執行滿足條件的協程,以實際上的分時串行化執行回避了協程之間的通信問題。但由於種種因素,協程的執行情況對程序員而言相對不那麽透明,可以通過一些簡單的機制來對其進行監控和優化。

Warm up: 從復用 Yield 對象說起

先從一個最簡單而直接的改進開始吧。下面一個在每幀結束時執行的協程的例子:

void Start()
{
    StartCoroutine(OnEndOfFrame());
}

IEnumerator OnEndOfFrame()
{
    yield return null;

    while (true)
    {
        //Debug.LogFormat("Called on EndOfFrame.");
        yield return new WaitForEndOfFrame();
    }
}

在 Profiler 內可以看到,上面的代碼會導致 WaitForEndOfFrame 對象的每幀分配,給 GC 增加負擔。假設遊戲內有 10 個活躍協程,運行在 60 fps,那麽每秒鐘的 GC 增量負擔是 10 60

16 = 9.6 KB/s

我們可以簡單地通過復用一個全局的 WaitForEndOfFrame 對象來優化掉這個開銷:

static WaitForEndOfFrame _endOfFrame = new WaitForEndOfFrame();

在合適的地方創建一個全局共享的 _endOfFrame 之後,只需要把上面的代碼改為:

    ...
    yield return _endOfFrame;
    ...

上面的 9.6 KB/s 的 GC 開銷就被完全避免了,而邏輯上與優化前完全沒有任何區別。

實際上,所有繼承自 YieldInstruction 的用於掛起協程的指令類型,都可以使用全局緩存來避免不必要的 GC 負擔。常見的有:

    ?WaitForSeconds 
    ?WaitForFixedUpdate 
    ?WaitForEndOfFrame 

Yielders.cs 這個文件裏,集中地創建了上面這些類型的靜態對象,使用時可以直接這樣:

    ...
    yield return Yielders.GetWaitForSeconds(1.0f);  // wait for one second
    ...

Coroutine 的工作原理

觀察調用鏈可知,Unity Coroutine 的調用約定靠返回的 IEnumerator 對象來維系。我們知道 IEnumerator 的核心功能函數是:

bool MoveNext();

這個函數在每次被 Unity 協程調度函數 (通常是協程所在類的 SetupCoroutine()) 喚醒時調用,用於驅動對應的協程由上一次 yield 語句開始執行下面的代碼段,直到下一條 yield 語句 (對應返回 true) 或函數退出 (對應返回 false)。

下圖是一次典型的協程調用:

技術分享圖片

圖中的綠色實心方塊是協程實際的活躍執行時間。可以看出,一個協程的完整生命周期是“在整個生命周期內對其內部所有代碼段的一個遍歷並依次執行”的過程。

接管和監控 Coroutine 的行為

問題描述

由於以下幾點問題的存在,協程的執行情況對開發者而言並不透明,很容易在開發過程中引入性能問題。

  1. 協程 (除了首次執行) 不是在用戶的函數內觸發,而是在單獨的 SetupCoroutine() 內被激活並執行
  2. 協程的每次活躍執行,在代碼上以單次 yield 為界限。對於具有復雜分支的業務邏輯,尤其是“本來在主流程內,後來被協程化”的代碼,很難看出每一段 yield 的潛在執行量
  3. 實踐中,如果同時激活的協程較多,就可能會出現多個高開銷的協程擠在同一幀執行導致的卡幀。這一類卡頓難以復現和調查。

中間層 TrackedCoroutine

針對這些情況,我們可以在主流程和協程之間添加一層 Wrapper,來接管和監控實際協程的執行情況。具體地說,可以實現一個純轉發的 IEnumerator,如下的縮減版所示:

public class TrackedCoroutine : IEnumerator
{
    IEnumerator _routine;

    public TrackedCoroutine(IEnumerator routine)
    {
        _routine = routine;
        
        // 在這裏標記協程的創建
    }

    object IEnumerator.Current
    {
        get
        {
            return _routine.Current;
        }
    }

    public bool MoveNext()
    {
        // 在這裏可以:
        //     1. 標記協程的執行
        //     2. 記錄協程本次執行的時間

        bool next = _routine.MoveNext();

        if (next)
        {
            // 一次普通的執行
        }
        else
        {
            // 協程運行到末尾,已結束
        }

        return next;
    }

    public void Reset()
    {
        _routine.Reset();
    }
}

完整版的代碼見 TrackedCoroutine 類的實現。

有了這樣一個 TrackedCoroutine 之後,我們就可以把正常的

abc.StartCoroutine(xxx());

替換為

abc.StartCoroutine(new TrackedCoroutine(xxx()));

啟動函數 InvokeStart()

RuntimeCoroutineTracker 類中,可以看到以下兩個接口,針對以 IEnumeratorstring,及可選的單參形式等三種形式的協程啟動的封裝。

public class RuntimeCoroutineTracker
{
    public static Coroutine InvokeStart(MonoBehaviour initiator, IEnumerator routine);
    public static Coroutine InvokeStart(MonoBehaviour initiator, string methodName, object arg = null);
}

上面的外部調用就可以替換為:

RuntimeCoroutineTracker.InvokeStart(abc, xxx());

至此,藉由一個中間層 TrackedCoroutine,我們得以接管和監控所有協程的單次運行過程。

監控 Plugins 內的協程

由於 Plugins 目錄單獨編譯,無法直接調用外部的功能,這裏我們為所有的插件提供一個轉發機制,用於把插件內啟動協程的請求轉發到上面的啟動函數。

首先定義兩個委托:

public delegate Coroutine CoroutineStartHandler_IEnumerator(MonoBehaviour initiator, IEnumerator routine);
public delegate Coroutine CoroutineStartHandler_String(MonoBehaviour initiator, string methodName, object arg = null);

然後把實際的協程請求轉發給這兩個委托:

public class CoroutinePluginForwarder
{
    ...

    public static Coroutine InvokeStart(MonoBehaviour initiator, IEnumerator routine)
    {
        return InvokeStart_IEnumerator(initiator, routine);
    }

    public static Coroutine InvokeStart(MonoBehaviour initiator, string methodName, object arg = null)
    {
        return InvokeStart_String(initiator, methodName, arg);
    }

    ...
}

最後在運行時註冊兩個委托即可:

CoroutinePluginForwarder.InvokeStart_IEnumerator = RuntimeCoroutineTracker.InvokeStart;
CoroutinePluginForwarder.InvokeStart_String = RuntimeCoroutineTracker.InvokeStart;

完整的代碼實現見 CoroutinePluginForwarder 類。

PerfAssist 組件 - CoroutineTracker (on GitHub)

在上面這些實現的基礎上,前段時間我實現了一個編輯器內的工具面板 CoroutineTracker ,用於幫助開發者監控和分析系統內協程的運行情況。

https://github.com/PerfAssist/PA_CoroutineTracker

技術分享圖片

功能介紹

左邊的四列是程序運行時所有被追蹤協程的實時的啟動次數,結束次數,執行次數和執行時間。

技術分享圖片

當點擊圖形上任何一個位置時,選中該時間點(秒為單位),在圖形上是綠色豎條。

此時右邊的數據報表刷新為在這一秒中活動的所有協程的列表,如下圖所示:

技術分享圖片

註意,該表中的數據依次為:

  • 協程的完整修飾名 (mangled name)
  • 在選定時間段內的執行次數 (selected execution count)
  • 在選定時間段內的執行時間 (selected execution time)
  • 到該選中時間為止時總的執行次數 (summed execution count)
  • 到該選中時間為止時總的執行時間 (summed execution time)

可以通過表頭對每一列的數據進行排序。

當選中列表中某一個協程時,面板的右下角會顯示該協程的詳細信息,如下圖所示:

技術分享圖片

這裏有下面的信息:

  • 該協程的序列 ID (sequence ID)
  • 啟動時間 (creation time)
  • 結束時間 (termination time)
  • 啟動時堆棧 (creation stacktrace)

向下滾動,可看到該協程的完整執行流程信息,如下圖所示:

技術分享圖片

常見問題調查

使用這個工具,我們可以更方便地調查下面的問題:

  • yield 過於頻繁的
  • 單次運行時間太久的
  • 總時間開銷太高的
  • 進入死循環,始終未能正確結束掉的
  • 遞歸 yield 產生過深執行層次的

Unity 協程運行時的監控和優化