Unity 協程運行時的監控和優化

阿新 • • 發佈：2018-01-02

eset 喚醒 end execution iat 分享部分 handle block

我是快樂的搬運工： http://gulu-dev.com/post/perf_assist/2016-12-20-unity-coroutine-optimizing#toc_0

------------------------------------------------------------------------ 分割線 ----------------------------------------------------------------------------

目錄：

Warm up: 從復用 Yield 對象說起
　　Coroutine 的工作原理
　　接管和監控 Coroutine 的行為 ? 問題描述
　　中間層 TrackedCoroutine
　　啟動函數 InvokeStart()
　　監控 Plugins 內的協程

PerfAssist 組件 - CoroutineTracker (on GitHub) ? 功能介紹
　　常見問題調查

技術分享圖片

協程 (Coroutine) 是大部分現代編程環境都提供的一個非常有用的機制。它允許我們把不同時刻發生的行為，在代碼中以線性的方式聚合起來。與基於事件與回調的系統相比，以協程方式組織的業務邏輯，可讀性相對好一些。

Unity 內的協程實現是傳統協程的簡化——在主線程內每一幀給定的時間點上，引擎通過一定的調度機制來喚醒和執行滿足條件的協程，以實際上的分時串行化執行回避了協程之間的通信問題。但由於種種因素，協程的執行情況對程序員而言相對不那麽透明，可以通過一些簡單的機制來對其進行監控和優化。

Warm up: 從復用 Yield 對象說起

先從一個最簡單而直接的改進開始吧。下面一個在每幀結束時執行的協程的例子：

void Start()
{
    StartCoroutine(OnEndOfFrame());
}

IEnumerator OnEndOfFrame()
{
    yield return null;

    while (true)
    {
        //Debug.LogFormat("Called on EndOfFrame.");
        yield return new WaitForEndOfFrame();
    }
}

在 Profiler 內可以看到，上面的代碼會導致 WaitForEndOfFrame 對象的每幀分配，給 GC 增加負擔。假設遊戲內有 10 個活躍協程，運行在 60 fps，那麽每秒鐘的 GC 增量負擔是 10 60

16 = 9.6 KB/s。

我們可以簡單地通過復用一個全局的 WaitForEndOfFrame 對象來優化掉這個開銷：

static WaitForEndOfFrame _endOfFrame = new WaitForEndOfFrame();

在合適的地方創建一個全局共享的 _endOfFrame 之後，只需要把上面的代碼改為：

    ...
    yield return _endOfFrame;
    ...

上面的 9.6 KB/s 的 GC 開銷就被完全避免了，而邏輯上與優化前完全沒有任何區別。

實際上，所有繼承自 YieldInstruction 的用於掛起協程的指令類型，都可以使用全局緩存來避免不必要的 GC 負擔。常見的有：

    ?WaitForSeconds 
    ?WaitForFixedUpdate 
    ?WaitForEndOfFrame

在 Yielders.cs 這個文件裏，集中地創建了上面這些類型的靜態對象，使用時可以直接這樣：

    ...
    yield return Yielders.GetWaitForSeconds(1.0f);  // wait for one second
    ...

Coroutine 的工作原理

觀察調用鏈可知，Unity Coroutine 的調用約定靠返回的 IEnumerator 對象來維系。我們知道 IEnumerator 的核心功能函數是：

bool MoveNext();

這個函數在每次被 Unity 協程調度函數 (通常是協程所在類的 SetupCoroutine()) 喚醒時調用，用於驅動對應的協程由上一次 yield 語句開始執行下面的代碼段，直到下一條 yield 語句 (對應返回 true) 或函數退出 (對應返回 false)。

下圖是一次典型的協程調用：

技術分享圖片

圖中的綠色實心方塊是協程實際的活躍執行時間。可以看出，一個協程的完整生命周期是“在整個生命周期內對其內部所有代碼段的一個遍歷並依次執行”的過程。

接管和監控 Coroutine 的行為

問題描述

由於以下幾點問題的存在，協程的執行情況對開發者而言並不透明，很容易在開發過程中引入性能問題。

協程 (除了首次執行) 不是在用戶的函數內觸發，而是在單獨的 SetupCoroutine() 內被激活並執行
協程的每次活躍執行，在代碼上以單次 yield 為界限。對於具有復雜分支的業務邏輯，尤其是“本來在主流程內，後來被協程化”的代碼，很難看出每一段 yield 的潛在執行量
實踐中，如果同時激活的協程較多，就可能會出現多個高開銷的協程擠在同一幀執行導致的卡幀。這一類卡頓難以復現和調查。

中間層 TrackedCoroutine

針對這些情況，我們可以在主流程和協程之間添加一層 Wrapper，來接管和監控實際協程的執行情況。具體地說，可以實現一個純轉發的 IEnumerator，如下的縮減版所示：

public class TrackedCoroutine : IEnumerator
{
    IEnumerator _routine;

    public TrackedCoroutine(IEnumerator routine)
    {
        _routine = routine;
        
        // 在這裏標記協程的創建
    }

    object IEnumerator.Current
    {
        get
        {
            return _routine.Current;
        }
    }

    public bool MoveNext()
    {
        // 在這裏可以：
        //     1. 標記協程的執行
        //     2. 記錄協程本次執行的時間

        bool next = _routine.MoveNext();

        if (next)
        {
            // 一次普通的執行
        }
        else
        {
            // 協程運行到末尾，已結束
        }

        return next;
    }

    public void Reset()
    {
        _routine.Reset();
    }
}

完整版的代碼見 TrackedCoroutine 類的實現。

有了這樣一個 TrackedCoroutine 之後，我們就可以把正常的

abc.StartCoroutine(xxx());

替換為

abc.StartCoroutine(new TrackedCoroutine(xxx()));

啟動函數 InvokeStart()

在 RuntimeCoroutineTracker 類中，可以看到以下兩個接口，針對以 IEnumerator，string，及可選的單參形式等三種形式的協程啟動的封裝。

public class RuntimeCoroutineTracker
{
    public static Coroutine InvokeStart(MonoBehaviour initiator, IEnumerator routine);
    public static Coroutine InvokeStart(MonoBehaviour initiator, string methodName, object arg = null);
}

上面的外部調用就可以替換為：

RuntimeCoroutineTracker.InvokeStart(abc, xxx());

至此，藉由一個中間層 TrackedCoroutine，我們得以接管和監控所有協程的單次運行過程。

監控 Plugins 內的協程

由於 Plugins 目錄單獨編譯，無法直接調用外部的功能，這裏我們為所有的插件提供一個轉發機制，用於把插件內啟動協程的請求轉發到上面的啟動函數。

首先定義兩個委托：

public delegate Coroutine CoroutineStartHandler_IEnumerator(MonoBehaviour initiator, IEnumerator routine);
public delegate Coroutine CoroutineStartHandler_String(MonoBehaviour initiator, string methodName, object arg = null);

然後把實際的協程請求轉發給這兩個委托：

public class CoroutinePluginForwarder
{
    ...

    public static Coroutine InvokeStart(MonoBehaviour initiator, IEnumerator routine)
    {
        return InvokeStart_IEnumerator(initiator, routine);
    }

    public static Coroutine InvokeStart(MonoBehaviour initiator, string methodName, object arg = null)
    {
        return InvokeStart_String(initiator, methodName, arg);
    }

    ...
}

最後在運行時註冊兩個委托即可：

CoroutinePluginForwarder.InvokeStart_IEnumerator = RuntimeCoroutineTracker.InvokeStart;
CoroutinePluginForwarder.InvokeStart_String = RuntimeCoroutineTracker.InvokeStart;

完整的代碼實現見 CoroutinePluginForwarder 類。

PerfAssist 組件 - CoroutineTracker (on GitHub)

在上面這些實現的基礎上，前段時間我實現了一個編輯器內的工具面板 CoroutineTracker ，用於幫助開發者監控和分析系統內協程的運行情況。

https://github.com/PerfAssist/PA_CoroutineTracker

技術分享圖片

功能介紹

左邊的四列是程序運行時所有被追蹤協程的實時的啟動次數，結束次數，執行次數和執行時間。

技術分享圖片

當點擊圖形上任何一個位置時，選中該時間點（秒為單位），在圖形上是綠色豎條。

此時右邊的數據報表刷新為在這一秒中活動的所有協程的列表，如下圖所示：

技術分享圖片

註意，該表中的數據依次為：

協程的完整修飾名 (mangled name)
在選定時間段內的執行次數 (selected execution count)
在選定時間段內的執行時間 (selected execution time)
到該選中時間為止時總的執行次數 (summed execution count)
到該選中時間為止時總的執行時間 (summed execution time)

可以通過表頭對每一列的數據進行排序。

當選中列表中某一個協程時，面板的右下角會顯示該協程的詳細信息，如下圖所示：

技術分享圖片

這裏有下面的信息：

該協程的序列 ID (sequence ID)
啟動時間 (creation time)
結束時間 (termination time)
啟動時堆棧 (creation stacktrace)

向下滾動，可看到該協程的完整執行流程信息，如下圖所示：

技術分享圖片

常見問題調查

使用這個工具，我們可以更方便地調查下面的問題：

yield 過於頻繁的
單次運行時間太久的
總時間開銷太高的
進入死循環，始終未能正確結束掉的
遞歸 yield 產生過深執行層次的

Unity 協程運行時的監控和優化

eset 喚醒 end execution iat 分享部分 handle block 我是快樂的搬運工： http://gulu-dev.com/post/perf_assist/2016-12-20-unity-coroutine-optimizing#toc_0 -

Unity 協程運行時的監控和優化

Unity 協程運行時的監控和優化

Java運行時異常和非運行時異常

java中exception和error有什麽區別，運行時異常和一般異常有什麽區別

協程運行原理猜測

面向 Unity* 軟件和虛擬現實的優化：運行時生成內容

AIX查看系統安裝時間和運行時長

通過編寫c語言程序，運行時實現打印另一個程序的源代碼和行號

單線程、高並發的運行時環境

背水一戰 Windows 10 (76) - 控件（控件基類）: Control - 基礎知識, 焦點相關, 運行時獲取 ControlTemplate 和 DataTemplate 中的元素

使用FreeRTOS進行性能和運行時分析

利用jmap和MAT等工具查看JVM運行時堆內存

commonJs的運行時加載和es6的編譯時加載

編譯系統和運行時的系統

golang 並發運算時主線程先運行完，子線程運行沒結束的問題記錄

通過GCEASY 和 jfr 發現運行時問題

[轉]C和C++運行時庫

解讀JavaScript 之引擎、運行時和堆棧調用

JVM運行時內存組成分為一些線程私

在linux中安裝protobuf編譯器和運行時環境

程序運行時遇到的鏈接問題

Unity 協程運行時的監控和優化

相關推薦