Keras---序貫模型

阿新 • • 發佈：2019-01-23

快速開始序貫（Sequential）模型

序貫模型是多個網路層的線性堆疊，也就是“一條路走到黑”。

可以通過向Sequential模型傳遞一個layer的list來構造該模型：

from keras.models import Sequential
from keras.layers import Dense, Activation

model = Sequential([
Dense(32, units=784), # 程式碼感覺有誤，應該是input_shape=(784,)
Activation('relu'),
Dense(10),
Activation('softmax'),
])

也可以通過.add()方法一個個的將layer加入模型中：

model = Sequential()
model.add(Dense(32, input_shape=(784,)))
model.add(Activation('relu'))

指定輸入資料的shape

模型需要知道輸入資料的shape，因此，Sequential的第一層需要接受一個關於輸入資料shape的引數，後面的各個層則可以自動的推匯出中間資料的shape，因此不需要為每個層都指定這個引數。有幾種方法來為第一層指定輸入資料的shape

傳遞一個input_shape的關鍵字引數給第一層，input_shape是一個tuple型別的資料，其中也可以填入

None，如果填入None則表示此位置可能是任何正整數。資料的batch大小不應包含在其中。
有些2D層，如Dense，支援通過指定其輸入維度input_dim來隱含的指定輸入資料shape。一些3D的時域層支援通過引數input_dim和input_length來指定輸入shape。
如果你需要為輸入指定一個固定大小的batch_size（常用於stateful RNN網路），可以傳遞batch_size引數到一個層中，例如你想指定輸入張量的batch大小是32，資料shape是（6，8），則你需要傳遞batch_size=32和input_shape=(6,8)。

model = Sequential()
model.add(Dense(32 
, input_dim=784))

model = Sequential()
model.add(Dense(32, input_shape=784))

編譯

在訓練模型之前，我們需要通過compile來對學習過程進行配置。compile接收三個引數：

優化器optimizer：該引數可指定為已預定義的優化器名，如rmsprop、adagrad，或一個Optimizer類的物件，詳情見optimizers
損失函式loss：該引數為模型試圖最小化的目標函式，它可為預定義的損失函式名，如categorical_crossentropy、mse，也可以為一個損失函式。詳情見losses
指標列表metrics：對分類問題，我們一般將該列表設定為metrics=['accuracy']。指標可以是一個預定義指標的名字,也可以是一個使用者定製的函式.指標函式應該返回單個張量,或一個完成metric_name - > metric_value對映的字典.請參考效能評估

# For a multi-class classification problem
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# For a binary classification problem
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

# For a mean squared error regression problem
model.compile(optimizer='rmsprop',
              loss='mse')

# For custom metrics
import keras.backend as K

def mean_pred(y_true, y_pred):
    return K.mean(y_pred)

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy', mean_pred])

訓練

Keras以Numpy陣列作為輸入資料和標籤的資料型別。訓練模型一般使用fit函式，該函式的詳情見這裡。下面是一些例子。

# For a single-input model with 2 classes (binary classification):

model = Sequential()
model.add(Dense(32, activation='relu', input_dim=100))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])

# Generate dummy data
import numpy as np
data = np.random.random((1000, 100))
labels = np.random.randint(2, size=(1000, 1))

# Train the model, iterating on the data in batches of 32 samples
model.fit(data, labels, epochs=10, batch_size=32)

# For a single-input model with 10 classes (categorical classification):

model = Sequential()
model.add(Dense(32, activation='relu', input_dim=100))
model.add(Dense(10, activation='softmax'))
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Generate dummy data
import numpy as np
data = np.random.random((1000, 100))
labels = np.random.randint(10, size=(1000, 1))

# Convert labels to categorical one-hot encoding
one_hot_labels = keras.utils.to_categorical(labels, num_classes=10)

# Train the model, iterating on the data in batches of 32 samples
model.fit(data, one_hot_labels, epochs=10, batch_size=32)

例子

這裡是一些幫助你開始的例子

在Keras程式碼包的examples資料夾中，你將找到使用真實資料的示例模型：

CIFAR10 小圖片分類：使用CNN和實時資料提升
IMDB 電影評論觀點分類：使用LSTM處理成序列的詞語
Reuters（路透社）新聞主題分類：使用多層感知器（MLP）
MNIST手寫數字識別：使用多層感知器和CNN
字元級文字生成：使用LSTM ...

基於多層感知器的softmax多分類：

from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD

# Generate dummy data
import numpy as np
x_train = np.random.random((1000, 20))
y_train = keras.utils.to_categorical(np.random.randint(10, size=(1000, 1)), num_classes=10)
x_test = np.random.random((100, 20))
y_test = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)

model = Sequential()
# Dense(64) is a fully-connected layer with 64 hidden units.
# in the first layer, you must specify the expected input data shape:
# here, 20-dimensional vectors.
model.add(Dense(64, activation='relu', input_dim=20))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy',
              optimizer=sgd,
              metrics=['accuracy'])

model.fit(x_train, y_train,
          epochs=20,
          batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)

MLP的二分類：

import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Dropout

# Generate dummy data
x_train = np.random.random((1000, 20))
y_train = np.random.randint(2, size=(1000, 1))
x_test = np.random.random((100, 20))
y_test = np.random.randint(2, size=(100, 1))

model = Sequential()
model.add(Dense(64, input_dim=20, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])
model.fit(x_train, y_train,
          epochs=20,
          batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)

類似VGG的卷積神經網路：

import numpy as np
import keras
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras.optimizers import SGD

# Generate dummy data
x_train = np.random.random((100, 100, 100, 3))
y_train = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)
x_test = np.random.random((20, 100, 100, 3))
y_test = keras.utils.to_categorical(np.random.randint(10, size=(20, 1)), num_classes=10)

model = Sequential()
# input: 100x100 images with 3 channels -> (100, 100, 3) tensors.
# this applies 32 convolution filters of size 3x3 each.
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(100, 100, 3)))
model.add(Conv2D(32, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy', optimizer=sgd)

model.fit(x_train, y_train, batch_size=32, epochs=10)
score = model.evaluate(x_test, y_test, batch_size=32)

使用LSTM的序列分類

from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.layers import Embedding
from keras.layers import LSTM

model = Sequential()
model.add(Embedding(max_features, output_dim=256))
model.add(LSTM(128))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=16, epochs=10)
score = model.evaluate(x_test, y_test, batch_size=16)

使用1D卷積的序列分類

from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.layers import Embedding
from keras.layers import Conv1D, GlobalAveragePooling1D, MaxPooling1D

model = Sequential()
model.add(Conv1D(64, 3, activation='relu', input_shape=(seq_length, 100)))
model.add(Conv1D(64, 3, activation='relu'))
model.add(MaxPooling1D(3))
model.add(Conv1D(128, 3, activation='relu'))
model.add(Conv1D(128, 3, activation='relu'))
model.add(GlobalAveragePooling1D())
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=16, epochs=10)
score = model.evaluate(x_test, y_test, batch_size=16)

用於序列分類的棧式LSTM

在該模型中，我們將三個LSTM堆疊在一起，是該模型能夠學習更高層次的時域特徵表示。

開始的兩層LSTM返回其全部輸出序列，而第三層LSTM只返回其輸出序列的最後一步結果，從而其時域維度降低（即將輸入序列轉換為單個向量）

regular_stacked_lstm

from keras.models import Sequential
from keras.layers import LSTM, Dense
import numpy as np

data_dim = 16
timesteps = 8
num_classes = 10

# expected input data shape: (batch_size, timesteps, data_dim)
model = Sequential()
model.add(LSTM(32, return_sequences=True,
               input_shape=(timesteps, data_dim)))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32, return_sequences=True))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32))  # return a single vector of dimension 32
model.add(Dense(10, activation='softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

# Generate dummy training data
x_train = np.random.random((1000, timesteps, data_dim))
y_train = np.random.random((1000, num_classes))

# Generate dummy validation data
x_val = np.random.random((100, timesteps, data_dim))
y_val = np.random.random((100, num_classes))

model.fit(x_train, y_train,
          batch_size=64, epochs=5,
          validation_data=(x_val, y_val))

採用stateful LSTM的相同模型

stateful LSTM的特點是，在處理過一個batch的訓練資料後，其內部狀態（記憶）會被作為下一個batch的訓練資料的初始狀態。狀態LSTM使得我們可以在合理的計算複雜度內處理較長序列

from keras.models import Sequential
from keras.layers import LSTM, Dense
import numpy as np

data_dim = 16
timesteps = 8
num_classes = 10
batch_size = 32

# Expected input batch shape: (batch_size, timesteps, data_dim)
# Note that we have to provide the full batch_input_shape since the network is stateful.
# the sample of index i in batch k is the follow-up for the sample i in batch k-1.
model = Sequential()
model.add(LSTM(32, return_sequences=True, stateful=True,
               batch_input_shape=(batch_size, timesteps, data_dim)))
model.add(LSTM(32, return_sequences=True, stateful=True))
model.add(LSTM(32, stateful=True))
model.add(Dense(10, activation='softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

# Generate dummy training data
x_train = np.random.random((batch_size * 10, timesteps, data_dim))
y_train = np.random.random((batch_size * 10, num_classes))

# Generate dummy validation data
x_val = np.random.random((batch_size * 3, timesteps, data_dim))
y_val = np.random.random((batch_size * 3, num_classes))

model.fit(x_train, y_train,
          batch_size=batch_size, epochs=5, shuffle=False,
          validation_data=(x_val, y_val))

Keras---序貫模型

快速開始序貫（Sequential）模型序貫模型是多個網路層的線性堆疊，也就是“一條路走到黑”。可以通過向Sequential模型傳遞一個layer的list來構造該模型： from keras.models import Sequential from kera

Keras —— 序貫模型和函式式模型

序貫模型序貫模型是多個網路層的線性堆疊，是函式式模型的簡略版，為最簡單的線性、從頭到尾的結構順序，不發生分叉。 1、應用序貫模型的基本步驟 model.add，新增層； model.compile,模型訓練的BP模式設定； model.fit，模型

keras 序貫（Sequential）模型常見設置

tail 情感 href http optimizer .net square hyper 預測最近看了一些例子，keras在預測方面，Sequential 常見搭配如下情感分析 embedding -> lstm -> dense embedding 主

keras函式式模型和序貫模型的使用

文章目錄函式式模型和序貫模型序貫模型例項函式式模型例項混合模型例項官方例項函式式模型和序貫模型在 Keras 中有兩類主要的模型：Sequential 順序模型和使用函式式 API

Python機器學習筆記：深入理解Keras中序貫模型和函式模型

　先從sklearn說起吧，如果學習了sklearn的話，那麼學習Keras相對來說比較容易。為什麼這樣說呢？　　我們首先比較一下sklearn的機器學習大致使用流程和Keras的大致使用流程： sklearn的機器學習使用流程： 1 2 3 4

序貫模型

模型搭建舉一個最簡單的MLP例子，這下面我們新增的都是全連線層 from keras.models import Sequential from keras.layers import Dense, Activation model = Sequential()&nb

【Keras入門日誌（3)】Keras中的序貫（Sequential）模型與函式式（Functional）模型

【時間】2018.10.31 【Keras入門日誌（3)】Keras中的序貫（Sequential）模型與函式式（Functional）模型概述本文主要介紹了Keras中的序貫（Sequential）模型與函式式（Functional）模型的基本使用方法，並在各部分的最後提供了一些具

keras 保存模型

tle 例如 class 配置信息配置 on() 不包含會同不同的轉自：https://blog.csdn.net/u010159842/article/details/54407745，感謝分享！我們不推薦使用pickle或cPickle來保存Keras模型

keras實現多個模型融合（非keras自帶模型，這裡以3個自己的模型為例）

該程式碼可以實現類似圖片的效果，多個模型採用第一個輸入。圖片來源：https://github.com/keras-team/keras/issues/4205 step 1:重新定義模型(這是我自己的模型，你們可以用你們自己的)，與預訓練不一樣，這裡定義模型inp

tensorflow使用tf.keras.Mode寫模型並使用tf.data.Dataset作為資料輸入

單輸入,單輸出的model使用tf.data.Dataset作為資料輸入很方便,定義好資料的input和對應的label,組成一個tf.data.Dataset型別的變數,直接傳入由tf.keras.Model構成的模型進行model.fit即可,例如: a = tf.keras.l

將keras的h5模型轉換為tensorflow的pb模型

背景：目前keras框架使用簡單，很容易上手，深得廣大演算法工程師的喜愛，但是當部署到客戶端時，可能會出現各種各樣的bug，甚至不支援使用keras，本文來解決的是將keras的h5模型轉換為客戶端常用的tensorflow的pb模型並使用tensorflow載入pb模型。 h5_to_pb.p

【AI】Keras使用VGG16模型預測自己的圖片

Keras使用VGG16模型預測自己的圖片環境 Win10 Miniconda3 Pycharm2018.02 程式碼如下 from keras.applications.vgg16 import VGG16 from keras.preproce

深入學習keras中Sequential模型及方法

Sequential 序貫模型　　序貫模型是函式式模型的簡略版，為最簡單的線性、從頭到尾的結構順序，不分叉，是多個網路層的線性堆疊。　　Keras實現了很多層，包括core核心層，Convolution卷積層、Pooling池化層等非常豐富有趣的網路結構。我們可以通過將層的列表傳遞給Sequential

keras儲存的模型用來做預測

from keras.models import load_model from keras.preprocessing import image import numpy as np file_path='4d.jpg' ##隨便啥圖都可以. img=image.load_img(file_

keras 預訓練模型finetune,多模型ensemble，修改loss函式，調節學習率

keras 預訓練模型finetune,多模型ensemble，修改loss函式，調節學習率載入預訓練模型並finetune 修改loss函式兩個網路做ensemble，進行網路訓練，調節learning rate 載入預訓練模型並fi

關於 keras.callbacks設定模型儲存策略

keras.callbacks.ModelCheckpoint(self.checkpoint_path, verbose=0, save_weights_only=True,mode="max",save_best_only=True

將keras或tensorflow模型遷移到android端（AndroidStudio）

經歷了多次採坑，終於是現實了將keras模型遷移到android端上。網上的一些教程實在太少，而且我也是走了很多彎路，有很多是使用Bazel工具把TensoFlow編譯成.so庫檔案和jar包，再進行Android配置，實現模型移植。但是。。。我可能太笨了沒成功。。放棄了

Keras —— 基於Vgg16模型（含全連線層）的圖片識別

一、載入並顯示圖片 img_path = 'elephant.jpg' img = image.load_img(img_path, target_size=(224, 224)) plt.ims

Keras框架訓練模型儲存及再載入

實驗資料MNIST 初次訓練模型並儲存 import numpy as np from keras.datasets import mnist from keras.utils import n

Keras —— 基於InceptionV3模型（不含全連線層）的遷移學習應用

一、ImageDataGenerator def image_preprocess(): # 　訓練集的圖片生成器，通過引數的設定進行資料擴增 train_datagen = ImageDataGenerator( prep

Keras---序貫模型

快速開始序貫（Sequential）模型

指定輸入資料的shape

編譯

訓練

例子

基於多層感知器的softmax多分類：

MLP的二分類：

類似VGG的卷積神經網路：

使用LSTM的序列分類

使用1D卷積的序列分類

用於序列分類的棧式LSTM

採用stateful LSTM的相同模型

相關推薦