pytorch實現self-attention機制，並可視化

阿新 • • 發佈：2018-11-29

pytorch 實現 self attention 並可視化

python 3
pytorch 0.4.0

請閱讀原文。

模型

class SelfAttention(nn.Module):
    def __init__(self, hidden_dim):
        super().__init__()
        self.hidden_dim = hidden_dim
        self.projection = nn.Sequential(
            nn.Linear(hidden_dim, 64),
            nn.ReLU(True 
),
            nn.Linear(64, 1)
        )

    def forward(self, encoder_outputs):
        # (B, L, H) -> (B , L, 1)
        energy = self.projection(encoder_outputs)
        weights = F.softmax(energy.squeeze(-1), dim=1)
        # (B, L, H) * (B, L, 1) -> (B, H)
        outputs = (encoder_outputs * weights.unsqueeze(-1 
)).sum(dim=1)
        return outputs, weights

class AttnClassifier(nn.Module):
    def __init__(self, input_dim, embedding_dim, hidden_dim):
        super().__init__()
        self.input_dim = input_dim
        self.embedding_dim = embedding_dim
        self.hidden_dim = hidden_dim
        self.embedding = nn.Embedding(input_dim, embedding_dim)
        self.lstm = nn.LSTM(embedding_dim, hidden_dim, bidirectional=True 
)
        self.attention = SelfAttention(hidden_dim)
        self.fc = nn.Linear(hidden_dim, 1)

    def set_embedding(self, vectors):
        self.embedding.weight.data.copy_(vectors)

    def forward(self, inputs, lengths):
        batch_size = inputs.size(1)
        # (L, B)
        embedded = self.embedding(inputs)
        # (L, B, E)
        packed_emb = nn.utils.rnn.pack_padded_sequence(embedded, lengths)
        out, hidden = self.lstm(packed_emb)
        out = nn.utils.rnn.pad_packed_sequence(out)[0]
        out = out[:, :, :self.hidden_dim] + out[:, :, self.hidden_dim:]
        # (L, B, H)
        embedding, attn_weights = self.attention(out.transpose(0, 1))
        # (B, HOP, H)
        outputs = self.fc(embedding.view(batch_size, -1))
        # (B, 1)
        return outputs, attn_weights

視覺化

效果如下：
這裡寫圖片描述
完整程式碼，HERE。

pytorch實現self-attention機制，並可視化

pytorch 實現 self attention 並可視化 python 3 pytorch 0.4.0 請閱讀原文。模型 class SelfAttention(nn.Module): def __init__(self, hidden

Keras實現LeNet-5網路，並可視化網路結構圖

模型源自Yann LeCun(1998)的論文《Gradient-Based Learning Applied to Document Recognition》，用於MNIST資料集。模型輸入為32X32的灰度影象，第一層為6個5X5卷積核，不擴充套件邊界；

利用統計方法求π（PI），並可視化顯示求解過程（C++&&OpenCV）

統計方法求π的方式：如果在正方形區域內隨機產生大量的均勻分佈的點，那麼落入內切圓和正方形中的隨機點個數的比值等於它們的面積之比。該比值乘以4，即為PI值。這就是統計方法求π的過程。視覺化求解過程是指：把產生隨機點的過程在影象中顯示,視覺化過程用到了opencv庫，

Python+ITchart實現微信中男女比例，城市分佈統計並可視化顯示

直接上程式碼：　 import itchat import os import csv import pandas as pd from pyecharts import Bar,Pie,Geo import shutil as sh # 根據index列印朋友的資訊 def print_I

Pandas 批量提取Excel檔案，分析並可視化顯示

Topic 本文主要是使用Pandas批量處理Excel檔案，使用read_excel函式獲取指定列的資料，然後使用concat功能把所有檔案合併，合併完成的資料使用groupby函式按兩個Key分組求取平均值，最後視覺化畫圖； 1. 匯入使用到的模組 Num

演算法研究（1）python實現經典排序演算法並可視化分析複雜度

排序演算法在演算法界是一個怎麼樣的存在？就好像在學術界中數學的地位，說直接用好像用不上，可是不會做起事情來總會捉襟見肘，左支右絀。找工作的時候，有的面試官甚至會讓我們手寫排序演算法。既然排序演算法如此重要，就讓我們一起去夯實基礎，切切實實得掌握它吧。前言

學習TensorFlow，TensorBoard可視化網絡結構和參數

pla code ext world hold 技巧 n) sample 化工在學習深度網絡框架的過程中，我們發現一個問題，就是如何輸出各層網絡參數，用於更好地理解，調試和優化網絡？針對這個問題，TensorFlow開發了一個特別有用的可視化工具包：TensorBoard

TensorFlow(九)：卷積神經網絡實現手寫數字識別以及可視化

writer orm true 交叉 lar write 執行 one 界面上代碼： import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist =

如何利用mysql+pyecharts儲存資料並可視化

目標爬取紅嶺創投(https://www.my089.com/)日投資發標記錄,儲存在mysql資料庫中, 並將資料視覺化以便分析. 行動爬取資料通過selenium+FIrefox的無頭模式將需要的資料爬取出來,程式碼實現不在贅述,詳細步驟可檢視我的上一篇圖文(如何

Octave 繪圖並可視化資料

Octave繪圖並可視化資料目錄 Octave繪圖並可視化資料繪製圖像儲存生成的影象為影象進行標號 subplot 設定影象的軸刻度視覺化矩陣繪製圖像 (此時產生的餘弦影象將覆蓋之前產

Caffe：檢視並可視化 LMDB 檔案

LMDB 檔案的全稱是 Lightning Memory-Mapped Database，也就是閃電記憶體對映資料庫，用這種資料可以省去大量讀取小檔案的時間花費和 IO 花費，可以提高訓練的速度。如果你好奇 LMDB 檔案裡面儲存了什麼東西，這篇部落格會帶你一起看看裡面的內容。

TensorFlow載入VGG並可視化每層

一、簡介 VGG網路在2014年的 ILSVRC localization and classification 兩個問題上分別取得了第一名和第二名。VGG網路非常深，通常有16－19層，如果自己訓練網路模型的話很浪費時間和計算資源。因此這裡採用一種方法獲取VGG19模型的

【Visual Studio 擴展工具】使用 ComponentOne迷你圖控件，進行可視化數據趨勢分析

eva lex 擴展工具連續 cti 支持人物論壇安全　　概述　　　　迷你圖 —— Sparklines是迷你的輕量級圖表，有助於快速可視化數據。它們是由數據可視化傳奇人物Edward Tufte發明的，他將其描述為“數據密集，設計簡單，字節大小的圖形。”雖然迷

TensorFlow——Mnist手寫數字識別並可視化實戰教程（一）

要點：該教程為深度學習tensorflow框架mnist手寫數字識別。實戰教程分為（一）（二）（三）分別從tensorflow和MATLAB雙角度來實現。筆者資訊：Next_Legend Q

Python爬取拉勾網招聘資訊並可視化分析

需求: 1:獲取指定崗位的招聘資訊 2:對公司地區,公司待遇,學歷情況,工作經驗進行簡單分析並可視化展示視覺化分析: 公司地區:柱狀圖,地圖公司待遇:雲圖公司-學歷情況:餅圖公司工作經

caffe cnn提取各層特徵並可視化結果（Python介面）

親測有用，之前參考的薛開宇的學習筆記，部分程式碼需要修改，自己修改後的版本如下： </p> #caffe特徵的視覺化 import numpy as np import matplotlib.pyplot as plt import matplotlib.im

TensorFlow 梯度下降線性迴歸並可視化

import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D lr = 0.1 real_params = [1.2, 2.5] # 真

如何對prototxt檔案繪製網路的結構圖並可視化

# Load the module import caffe import caffe.draw from caffe.proto import caffe_pb2 from google.protobuf import text_format # Set the parameters input_net_

geowave+geoserver+hbase安裝部署匯入shapefile並可視化

本文參考了：https://www.linkedin.com/pulse/testing-big-spatial-data-software-hadoop-hbase-geowave-alvaro-huarte/以及geowave的官方文件。併成功在geoserver釋出了地

Java可視化日歷（Date類、DATe Format類、Calendar類綜合運用），開發可視化日歷小程序

nextline inf 表示輸入日期 static lin print void 日期 Java時間日期類綜合運用，開發可視化日歷小程序由鍵盤輸入指定格式的日期，打印這個月的日歷 1、代碼 import java.text.DateFormat; import jav

pytorch實現self-attention機制，並可視化

pytorch 實現 self attention 並可視化

模型

視覺化

相關推薦