keras快速上手-基於python的深度學習實踐-基於索引的深度學習對話模型-源代碼

阿新 • • 發佈：2019-01-15

spro pic ram 分析 pyplot 格式批量 repr odi

該章的源代碼已經調通，如下，先記錄下來，再慢慢理解


#!/usr/bin/env python
# coding: utf-8

# In[1]:

import pandas as pd
import numpy as np
import pickle

import keras
from keras.models import Sequential, Model
from keras.layers import Input, Dense, Activation, Dropout, Embedding, Reshape, Dot, Concatenate, Multiply, Merge
from keras.layers import LSTM
from keras.optimizers import RMSprop
from keras.utils.data_utils import get_file
from keras.preprocessing.sequence import pad_sequences
from keras.models import model_from_json

import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
import jieba
plt.rcParams[‘figure.figsize‘]=(20, 10)

# 讀入數據

# In[2]: 文件下載地址：http://dataset.cs.mcgill.ca/ubuntu-corpus-1.0/ubuntu_blobs.tgz

with open("dataset.pkl", "rb") as f:
    data = pickle.load(f)

# In[3]:

print("size ======= %s" % len(data))

# In[4]:

import gc
gc.collect()

# 看看數據裏都是什麽

# In[5]:

for j in range(len(data)):
    print("======= %s" % j)
    for i, k in enumerate(data[j]):
        print(k)

# 這裏分析最長的句子的長度

# In[6]:

# 這裏分析最長的句子的長度
length=map(len, data[0][‘c‘])
res=list(length)
context_length=np.max(res[:])
print(context_length)

length=map(len, data[0][‘r‘])
res=list(length)
response_length=np.max(res[:])
print(response_length)

# 這裏分析整個詞典的大小

# In[7]:

context_size = np.max(list(map(lambda x:  max(x) if len(x)>0 else 0, data[0][‘c‘])))
print(context_size)
response_size = max(list(map(lambda x:  max(x) if len(x)>0 else 0, data[0][‘r‘])))
print(response_size)"

# In[8]:

max(data[0][‘r‘][1])

# In[9]:

embedding_dim=64
lstm_dim=64

context_length=np.max(list(map(len, data[0][‘c‘])))
#print(context_length)
response_length=np.max(list( map(len, data[0][‘r‘])))
#print(response_length)

Y = data[0][‘r‘]

print(‘Begin Modeling...‘)

context_size = np.max(list(map(lambda x:  max(x) if len(x)>0 else 0, data[0][‘c‘])))
response_size = max(list(map(lambda x:  max(x) if len(x)>0 else 0, data[0][‘r‘])))
volcabulary_size=max(context_size, response_size)

context_length=120

# 對上下文部分進行嵌入和建模
context=Input(shape=((context_length,)), dtype=‘Int32‘, name=‘context_input‘)
context_embedded=Embedding(input_length=context_length, output_dim=embedding_dim, input_dim=volcabulary_size)(context)
context_lstm=LSTM(lstm_dim)(context_embedded)

# 對回應部分進行嵌入和建模
response_length=120
response=Input(shape=((response_length,)), dtype=‘Int32‘, name=‘response_input‘)
response_embedded=Embedding(input_length=response_length, output_dim=embedding_dim, input_dim=volcabulary_size)(response)
response_lstm=LSTM(lstm_dim)(response_embedded)

print(response_lstm.outputs)

x = Dot([1, 1])([context_lstm, response_lstm])
#x = Multiply()([context_lstm, response_lstm])
yhat = Dense(2, activation=‘softmax‘)(x)

model = Model(inputs=[context, response], outputs=yhat)
model.compile(optimizer=‘rmsprop‘,
              loss=‘binary_crossentropy‘,
              metrics=[‘accuracy‘])
print(‘Finish compiling...‘)
model.summary()

# In[10]:

# 針對該數據定制的generator。一般應該將三個部分分離以後再編制generator

def data_gen(data, batch_size=100):    
    contextRaw = data[‘c‘]
    responseRaw = data[‘r‘]
    yRaw = data[‘y‘]

    number_of_batches = len(contextRaw) // batch_size
    counter=0

    context_length=np.max(list(map(len, contextRaw)))//3    
    response_length=np.max(list( map(len, responseRaw)))//3

    context_length=120
    response_length=120

    while 1:        
        lowerBound = batch_size*counter
        upperBound = batch_size*(counter+1)
        Ctemp = contextRaw[lowerBound : upperBound]
        C_batch = pad_sequences(Ctemp, maxlen=context_length, padding=‘post‘)
        C_res = np.zeros((batch_size, context_length), dtype=np.int)

        Rtemp = responseRaw[lowerBound : upperBound]
        R_batch = pad_sequences(Rtemp, maxlen=response_length, padding=‘post‘)
        R_res = np.zeros((batch_size, response_length), dtype=np.int)
        for k in np.arange(batch_size):
            C_res[k, :] = C_batch[k, :]
            R_res[k, :] = R_batch[k, :]
        y_res= keras.utils.to_categorical(yRaw[lowerBound : upperBound])
        counter += 1
        yield([C_res.astype(‘float32‘), R_res.astype(‘float32‘)], y_res.astype(‘float32‘))
        if (counter < number_of_batches):            
            counter=0            

# 下面訓練這個模型。在6GB顯存的GTX 1060上，小批量的大小不能超過200。讀者有時間可以試試多次叠代，看看效果。

# In[11]:

#Y = keras.utils.to_categorical(data[0][‘y‘], num_classes=2)
batch_size=168
model.fit_generator(data_gen(data[0], batch_size=batch_size), 
                    steps_per_epoch=len(data[0][‘c‘])//batch_size,
                    validation_data = data_gen(data[1]),
                    validation_steps = len(data[1][‘c‘])//batch_size,
                    epochs=1)

# 下面我們將模型存入磁盤。我們也可以在擬合過程中使用checkponit選項將每一步的結果都分別存入一個磁盤文件中。

# In[12]:

# 將模型結構存為JSON格式
model_json = model.to_json()
with open("dual_lstm_model.json", "w") as json_file:
    json_file.write(model_json)
# 將模型擬合得到的權重存入HDF5文件中
model.save_weights("dual_lstm_model.h5")
print("模型已經寫入磁盤")

# In[13]:

# 如果要調用已有模型，可以通過如下方法

# 從磁盤載入模型結構
json_file = open(‘dual_lstm_model.json‘, ‘r‘)
loaded_model_json = json_file.read()
json_file.close()
model = model_from_json(loaded_model_json)
# 從磁盤讀入模型權重
model.load_weights("dual_lstm_model.h5")
print("載入模型完畢")
model.compile(optimizer=‘rmsprop‘,
              loss=‘binary_crossentropy‘,
              metrics=[‘accuracy‘])
print(‘模型編譯完畢...‘)

# 下面進行預測。輸入數據的組織形式應該遵循data generator裏面的數據處理和輸出組織形式，但是我們可以通過predict_generator方法直接引用現有的data generator，只是用在測試集，而不是訓練集上。

# In[14]:

batch_size=256
ypred = model.predict_generator( data_gen(data[2], batch_size=batch_size), steps=(len(data[2][‘c‘])//batch_size), verbose=1)

# In[15]:

yTest = data[1][‘y‘]

ypred2=(2-(ypred[:,0]>ypred[:,1]))-1
z = [str(ypred2[i])==yTest[i] for i in range(len(ypred2))]
np.mean(z)

spro pic ram 分析 pyplot 格式批量 repr odi 該章的源代碼已經調通，如下，先記錄下來，再慢慢理解 #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas as pd im

《深度學習入門：基於Python的理論與實現》高清中文版PDF+源代碼

mark 原理 col 外部 tps follow src term RoCE 下載：https://pan.baidu.com/s/1nk1IHMUYbcuk1_8tj6ymog 《深度學習入門：基於Python的理論與實現》高清中文版PDF+源代碼高清中文版PDF，3

分享《Keras快速上手：基於Python的深度學習實戰(謝梁等)》PDF版+源代碼+mobi版

href img 復制粘貼推薦 term python 技術 roc 自然下載：https://pan.baidu.com/s/1u0gYCTbT1I2rq88AFDV3Mg 更多資料：http://blog.51cto.com/14050756 PDF版，531頁，帶

《Python機器學習》高清英文版PDF+中文版PDF+源代碼及數據集

img roc 學習 ges src ref term watermark 下載下載：https://pan.baidu.com/s/1I-Kd5KhmkggOVTppo3ysTQ 《Python機器學習》高清英文版PDF+中文版PDF+源代碼及數據集中文和英文兩版對比

分享《Python機器學習》高清英文版PDF+中文版PDF+源代碼及數據集

ado mar 技術 nag 分享圖片 proc follow 下載 shadow 下載：https://pan.baidu.com/s/1I-Kd5KhmkggOVTppo3ysTQ 更多資料分享：http://blog.51cto.com/4820691 《Python

《神經網絡與深度學習(美)MichaelNielsen著》中英文版PDF+源代碼+吳岸城版PDF

pan size mic 深度學習 tex wap sha 方案深度資源鏈接：https://pan.baidu.com/s/1-v89VftxGHdzd4WAp2n6xQ《神經網絡與深度學習（美）Michael Nielsen 著》中文版PDF+英文版PDF+源代碼以

分享《TensorFlow深度學習》高清中文版PDF+英文版PDF+源代碼

表現文本書籍 tensor ado 源代碼更多 col mar 下載：https://pan.baidu.com/s/1Z5xJw4WWbJmJJlF4zvSXlA 更多資料：http://blog.51cto.com/14050756 《TensorFlow深度學習

分享《TensorFlow學習指南：深度學習系統構建詳解》英文PDF+源代碼+部分中文PDF

size 分布式部署模型 -o 卷積神經網絡 ref ima 源代碼下載：https://pan.baidu.com/s/1v4B-Jp-lQClBWiCfDd1_dw 更多分享：http://blog.51cto.com/14050756 《TensorFlow學習

《Python金融大數據分析》中文版PDF+英文版PDF+源代碼

pdf RoCE 書籍中英文 shadow Python金融 text ofo process 下載：https://pan.baidu.com/s/1ymQo0qlb79G9kgQEbTo9Fg 《Python金融大數據分析》中文版PDF+高清英文版PDF+源代碼中英

分享《Python神經網絡編程》中文版PDF+英文版PDF+源代碼

源代碼 com size nag cto 文字 type -o 彩色下載：https://pan.baidu.com/s/1JGUInQlae5D7sGsrbeX7aw 《Python神經網絡編程》中文版PDF+英文版PDF+源代碼彩色配圖，文字可以復制粘貼，配套源代碼。

《TensorFlow機器學習實戰指南》中文版PDF+英文版PDF+源代碼

源代碼配套 log shadow pdf ges https 機器學習實戰 ffffff 下載：https://pan.baidu.com/s/1Oeho172yfw1J6mCiXozQig 《TensorFlow機器學習實戰指南》中文版PDF+英文版PDF+源代碼高清

分享《Python 3網絡爬蟲開發實戰》中文PDF+源代碼

col alt roc 下載 water pytho aid http 圖片下載：https://pan.baidu.com/s/1S9PAGO0123_7Csz14z-e2g 更多資料分享：http://blog.51cto.com/3215120 《Python 3網

分享《深入淺出強化學習：原理入門》高清PDF+源代碼

深入傳統源代碼分享 tex img 下載 watermark 易懂下載：https://pan.baidu.com/s/1RQvGYYbIkc3ob3jB6AAu0Q 更多資料分享：http://blog.51cto.com/3215120 《深入淺出強化學習：原理

分享《Python Web開發實戰(董偉明)》中文PDF+源代碼

分享開發 ofo 技術分享 web開發 follow pytho 資料 ESS 下載：https://pan.baidu.com/s/19APvGHguDOhognthTSw9JQ更多資料：http://blog.51cto.com/14050756 《Python We

Tariq Rashid+《Python神經網絡編程》中文PDF英文PDF源代碼+Make Your Own Neural Network

bubuko 彩色簡單 ofo 簡單的適合識別代碼思想《Python神經網絡編程》揭示神經網絡背後的概念，並介紹如何通過Python實現神經網絡。下載：https://pan.baidu.com/s/1UTwTGYnxWquxjMueIcaNwQ 《P

keras快速上手-基於python的深度學習實踐_第8章_文字生成原始碼

原始碼如下，但質量較差 # -*- coding: utf-8 -*- #!/usr/bin/env python # coding: utf-8 # # 序列模型 # In[1]: import pandas as pd import numpy as np import gc import ke

keras快速上手-基於python的深度學習實踐_第8章_文字生成源代碼

app 取出武俠小說 ica 內存 helper per charset bat 源代碼如下，但質量較差 # -*- coding: utf-8 -*- #!/usr/bin/env python # coding: utf-8 # # 序列模型 # In[1]:

分享《Keras快速上手：基於Python的深度學習實戰》+PDF+謝樑

下載：https://pan.baidu.com/s/1AssHJf6RTWF2EjUlV6hTyw 更多資料分享：http://blog.51cto.com/14087171 《Keras快速上手：基於Python的深度學習實戰》高清PDF，531頁，帶書籤目錄，文字可以複製。這是一本少見的深入淺出

分享《Keras快速上手：基於Python的深度學習實戰》+PDF+謝梁

深度學習 oss 抽象 image 高清 ddc 參考 ESS img 下載：https://pan.baidu.com/s/1AssHJf6RTWF2EjUlV6hTyw 更多資料分享：http://blog.51cto.com/14087171 《Keras快速上手：基

分享《Keras快速上手：基於Python的深度學習實戰(謝樑等)》PDF版+原始碼+mobi版

下載：https://pan.baidu.com/s/1u0gYCTbT1I2rq88AFDV3Mg 更多資料：http://blog.51cto.com/14050756 PDF版，531頁，帶書籤目錄，彩色配圖，文字可以複製貼上。配套原始碼和資料。系統地講解了深度學習的基本知識、建模過程和應用，並

keras快速上手-基於python的深度學習實踐-基於索引的深度學習對話模型-源代碼

相關推薦