多層LSTM的坑：如何定義多層LSTM？

阿新 • • 發佈：2018-11-10

多層LSTM定義的兩種方式，其中方式2是正確的，方式1揮出現錯誤：

多層LSTM需要每次都定義一個新的BasicCell, 而不是定義一個BasicCell之後多次呼叫。

def lstm_model(X,Y,is_training):
    ###方式1：錯誤！！
    #cell_unit = tf.nn.rnn_cell.BasicLSTMCell(HIDDEN_SIZE)
    #cell = tf.nn.rnn_cell.MultiRNNCell([
    #    cell_unit for _ in range(NUM_LAYERS)])
    ###方式2：正確
    cell = tf.nn.rnn_cell.MultiRNNCell([
        tf.nn.rnn_cell.BasicLSTMCell(HIDDEN_SIZE)
           for _ in range(NUM_LAYERS)])




    outputs, _ = tf.nn.dynamic_rnn(cell, X, dtype=tf.float32)

    output = outputs[:,-1,:]

    predictions = tf.contrib.layers.fully_connected(
        output,1,activation_fn=None )
    if not is_training:
        return predictions,None,None

    loss = tf.losses.mean_squared_error(labels=Y,predictions=predictions)

    train_op = tf.contrib.layers.optimize_loss(
        loss,tf.train.get_global_step(),
        optimizer = 'Adagrad',learning_rate = 0.1)

    return predictions,loss,train_op

完整示例程式的程式碼：

#-*-coding:utf-8-*-
import numpy as np
import tensorflow as tf

import matplotlib as mpl
mpl.use('Agg')
from matplotlib import pyplot as plt

HIDDEN_SIZE = 30
NUM_LAYERS = 2

TIME_STEPS = 10
TRAINING_STEPS = 10000
BATCH_SIZE = 32

TRAINING_EXAMPLES=10000
TESTING_EXAMPLES = 1000
SAMPLE_GAP = 0.01

def generate_data(seq):
    X=[]#ninihaoniaho zh
    Y=[]

    for i in range(len(seq)-TIME_STEPS):
        X.append([seq[i:i+TIME_STEPS]])
        Y.append([seq[i+TIME_STEPS]])

    return np.array(X,dtype=np.float32),np.array(Y,dtype=np.float32)

def lstm_model(X,Y,is_training):
    # cell_unit = tf.nn.rnn_cell.BasicLSTMCell(HIDDEN_SIZE)
    cell = tf.nn.rnn_cell.MultiRNNCell([
        tf.nn.rnn_cell.BasicLSTMCell(HIDDEN_SIZE)
           for _ in range(NUM_LAYERS)])
    outputs, _ = tf.nn.dynamic_rnn(cell, X, dtype=tf.float32)

    output = outputs[:,-1,:]

    predictions = tf.contrib.layers.fully_connected(
        output,1,activation_fn=None )
    if not is_training:
        return predictions,None,None

    loss = tf.losses.mean_squared_error(labels=Y,predictions=predictions)

    train_op = tf.contrib.layers.optimize_loss(
        loss,tf.train.get_global_step(),
        optimizer = 'Adagrad',learning_rate = 0.1)

    return predictions,loss,train_op



def train(sess,train_X,train_Y):
    ds=tf.data.Dataset.from_tensor_slices((train_X,train_Y))
    ds = ds.repeat().shuffle(1000).batch(BATCH_SIZE)
    X,Y = ds.make_one_shot_iterator().get_next()

    ### use model get result
    with tf.variable_scope('model'):
        predictions,loss,train_op = lstm_model(X,Y,True)

    sess.run(tf.global_variables_initializer())
    for i in range(TRAINING_STEPS):
        _,l = sess.run([train_op,loss])
        if i%100 ==0:
            print('train step:'+str(i) + ',loss:'+str(l))

def run_eval(sess, test_X, test_y):
    # print('------------runned')
    # 將測試資料以資料集的方式提供給計算圖。
    ds = tf.data.Dataset.from_tensor_slices((test_X, test_y))
    ds = ds.batch(1)
    X, y = ds.make_one_shot_iterator().get_next()

    # 呼叫模型得到計算結果。這裡不需要輸入真實的y值。
    with tf.variable_scope("model", reuse=True):
        prediction, _, _ = lstm_model(X, [0.0], False)

    # 將預測結果存入一個數組。
    predictions = []
    labels = []
    for i in range(TESTING_EXAMPLES):
        p, l = sess.run([prediction, y])
        predictions.append(p)
        labels.append(l)

    # 計算rmse作為評價指標。
    predictions = np.array(predictions).squeeze()
    labels = np.array(labels).squeeze()
    rmse = np.sqrt(((predictions - labels) ** 2).mean(axis=0))
    print("Root Mean Square Error is: %f" % rmse)


    # 對預測的sin函式曲線進行繪圖。
    plt.figure()
    plt.plot(predictions, label='predictions')
    plt.plot(labels, label='real_sin')
    plt.legend()
    plt.show()


test_start = (TRAINING_EXAMPLES+TIME_STEPS)*SAMPLE_GAP
test_end = test_start + (TESTING_EXAMPLES+TIME_STEPS)*SAMPLE_GAP

train_X,train_Y = generate_data(np.sin(np.linspace(
    test_start,test_end,TRAINING_EXAMPLES+TIME_STEPS,dtype=np.float32)))
test_X,test_Y = generate_data(np.sin(np.linspace(
    test_start,test_end,TESTING_EXAMPLES+TIME_STEPS,dtype=np.float32)))

with tf.Session() as sess:
    train(sess,train_X,train_Y)
    run_eval(sess,test_X,test_Y)

Qt多執行緒學習：建立多執行緒

【為什麼要用多執行緒？】傳統的圖形使用者介面應用程式都只有一個執行執行緒，並且一次只執行一個操作。如果使用者從使用者介面中呼叫一個比較耗時的操作，當該操作正在執行時，使用者介面通常會凍結而不再響應。這個問題可以用事件處理和多執行緒來解決。【Linux有執行緒的概念嗎？

Java多執行緒技術：實現多使用者服務端Socket通訊

目錄前言回顧一、多使用者伺服器二、使用執行緒池實現服務端多執行緒 1、單執行緒版本 2、多執行緒版本三、多使用者與服務端通訊演示四、多使用者伺服器完整程式碼最後前言回顧在上一篇《Java多執行緒實現TCP網路Socket程式設計(C/S通訊)》，我們解決了伺服器端在建立連線後，連續傳送多條資

多層LSTM的坑：如何定義多層LSTM？

多層LSTM定義的兩種方式，其中方式2是正確的，方式1揮出現錯誤：多層LSTM需要每次都定義一個新的BasicCell, 而不是定義一個BasicCell之後多次呼叫。 def lstm_model(X,Y,is_training):

Keras多層感知器：印第安糖尿病人診斷

例項中使用的是Pima Indians Diabetes資料集，資料集有八項屬性和對應輸出：（1）懷孕次數（2）2小時口服葡萄糖耐量實驗中血漿葡萄糖濃度（3）舒張壓（4）三頭肌皮褶皺厚度（5）2小時血清胰島素（6）身體質量指數（7）糖尿病譜系功能（8）

Deeplearning4j 實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearning4j進行實現，並且為了方

Gson使用及多層巢狀 json 定義類

問題描述對於簡單的Json資料，其對應的java bean 也比較簡單，尤其用GSON處理的時候。但是如果是多層巢狀的json資料，如果是手工用JSONArray和JSONObject進行解析，還是可以的，雖然會繁瑣一點。但是如果用GSON開源庫解析，有

機器學習筆記(5)：多類邏輯迴歸-手動新增隱藏層

from mxnet import gluon from mxnet import ndarray as nd import matplotlib.pyplot as plt import mxnet as mx from mxnet import autograd def transfo

DAO層介面定義多個入參（Mybatis）

本文將介紹本人接觸過的在DAO層定義多個入參的三種方法：方法一：將入參封裝在一個實體類中。接觸mybatis一般都會接觸工具generator；大部分人也是從自動生成的sql介面來了解DAO層介面的定義。觀察genera

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇部落格中，我們用基於RBM的的Deep AutoEncoder對Mnist資料集進行壓縮，應該說取得了不錯的效果。這裡，我們將神經網路這塊替換成傳統的全連線的前饋神經網路對Mnist資料集進行壓縮，看看兩者的效果有什麼異同。整個程式碼依然是利用Deeplearnin

神經網路/多層感知器（MLP）架構：選擇隱藏層數量和大小的標準

隱藏層個數：一個零隱藏層的模型可以解決線性可分資料。所以除非你早知道你的資料線性不可分，證明它也沒什麼壞處—為什麼使用比任務需求更困難的模型？如果它是線性可分的那麼一個更簡單的技術可以工作，感知器也可以。假設您的資料確實需要通過非線性技術進行分離，則始終

嘔心瀝血的java複雜專案(包括自定義應用層協議、CS多執行緒、多客戶端登入、上下線提醒等等)

首先來看下整個系統的檔案架構圖: 系統是個基於UDP的聊天室，因為不能保持所有使用者和聊天室的持續連線。同時為了保持資料傳輸的可靠性，就需要自定義應用層協議了。程式大概的一個流程如下： 1.啟動伺服器，點選"start service"，之後伺服器及開始監聽指定埠。

深度學習DeepLearning.ai系列課程學習總結：8. 多層神經網路程式碼實戰

轉載過程中，圖片丟失，程式碼顯示錯亂。為了更好的學習內容，請訪問原創版本： http://www.missshi.cn/api/view/blog/59ac0136e519f50d040001a7 Ps：初次訪問由於js檔案較大，請耐心等候（8s左

資料層的多租戶淺談（SAAS多租戶資料庫設計）

在上一篇“淺析多租戶在 Java 平臺和某些 PaaS 上的實現”中我們談到了應用層面的多租戶架構，涉及到 PaaS、JVM、OS 等，與之相應的是資料層也有多租戶的支援。資料層的多租戶綜述多租戶（Multi Tenancy/Tenant）是一種軟體架構，其定義是：在一臺伺服器上執行單個應用例項，

從壹開始前後端分離 [.netCore 填坑 ] 三十四║Swagger：API多版本控制，帶來的思考

前言大家週二好呀，.net core + Vue 這一系列基本就到這裡差不多了，今天我又把整個系列的文章下邊的全部評論看了一下（我是不是很負責哈哈），提到的問題基本都解決了，還有一些問題，已經在QQ群裡討論過了，今天再寫一篇，然後給這個系列畫一個暫時的句號吧，這些天也考慮寫點兒啥，希望看到的小夥伴給點

企業網三層架構的搭建--Cisco多層交換網路

網路拓撲圖：配置要求： 1、R1為ISP 2、紅圈標記介面為3層介面 3、內網地址為172.16.0.0/16 4、HSRP或VRRP、STP、VLAN、 DTP、TRUNK、VTP均使用 5、控制路由表條目數量 6、全網可達 PC DHCP

多執行緒實現檔案在多層目錄中查詢及拷貝到多層目錄

在實現建立多級目錄後，遇到了檔案分類複製的問題。。。左思右想，最後覺得還是寫程式碼實現比較快，畢竟我比較懶。。。不要問我為要寫那麼多find方法來匹配路徑。。。畢竟腦子不夠用。如果是比較重要的檔案，不推薦多執行緒去實現，雖然用了同步，但還是有可能漏掉某個檔案。還是老老實實的

布萌區塊鏈使用指南：內有N多“踏坑”經驗（多圖）

上篇帖子著重介紹了布萌的技術框架和商業邏輯，這篇就講怎麼接入布萌區塊鏈吧，跟其他區塊鏈底層相比，接入布萌難度並不高，但還是有很多細節需要注意的。 ————————————以下是親自跳坑經驗的分割線———————————— 布萌是一個聯盟鏈，但是是一個沒啥門檻的聯盟鏈，只

Blackberry引路蜂地圖開發示例：疊加自定義圖層

在開發應用的過程中，常常需要在地圖上需繪製一點自定義的興趣點或是自定義的幾何圖形。引路蜂地圖包中RasterMap最終提供的基實就是一張圖片。 protected void paint(Graphics g) { map.paint(mapG

Android 開發繞不過的坑：你的 Bitmap 究竟佔多大記憶體？

0、寫在前面本文涉及到螢幕密度的討論，這裡先要搞清楚 DisplayMetrics 的兩個變數，摘錄官方文件的解釋： density：The logical density of the display. This is a scalin

習題 8.5 將本章的例8.4改寫為一個多檔案的程式：1.將類定義放在標頭檔案arraymax.h中；2.將成員函式定義放在原始檔arraymax.cpp中；3.主函式放在原始檔file1.cpp中。

C++程式設計（第三版）譚浩強習題8.5 個人設計習題 8.5 將本章的例8.4改寫為一個多檔案的程式： 1.將類定義放在標頭檔案arraymax.h中； 2.將成員函式定義放在

多層LSTM的坑：如何定義多層LSTM？

相關推薦