CUDA

量化深度學習模型在CUDA平臺的自動優化

深度學習已經成功地在各種任務中得到應用。模型的推斷速度在無人駕駛等實時的場景下尤為關鍵。網路量化是加速深度學習模型一種有效的方法。在量化的模型中,我們使用 int8、float16 等低精度的資料型別表

BiLSTM介紹及程式碼實現

一、介紹 1.1 文章組織 本文簡要介紹了BiLSTM的基本原理,並以句子級情感分類任務為例介紹為什麼需要使用LSTM或BiLSTM進行建模。在文章的最後,我們給出在PyTorch下BiLSTM的實現

1715124298.3487