AI-040: Python深度學習3 - 三個Karas例項-2

阿新 • • 發佈：2018-12-30

例項2：

通過路透社資料集來將文字區分46個不同主題

這裡與上一個例項不同的地方：這是個多元分類問題，因此最終輸出是46維向量

載入資料

from keras.datasets import reuters
(train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)

預處理資料：

將樣本對映到單詞詞典，轉化為相同長度的向量

import numpy as np

def vectorize_sequences(sequences, dimension=10000):
    results = np.zeros((len(sequences), dimension))
    for i, sequence in enumerate(sequences):
        results[i, sequence] = 1.
    return results


# Our vectorized training data
x_train = vectorize_sequences(train_data)
# Our vectorized test data
x_test = vectorize_sequences(test_data)

將標籤轉換為one-hot編碼，就是這樣的向量[0,0,0,1,0,0,...]，這個例子表示樣本屬於第四類主題。

def to_one_hot(labels, dimension=46):
    results = np.zeros((len(labels), dimension))
    for i, label in enumerate(labels):
        results[i, label] = 1.
    return results


# Our vectorized training labels
one_hot_train_labels = to_one_hot(train_labels)
# Our vectorized test labels
one_hot_test_labels = to_one_hot(test_labels)

構建網路：

這裡因為輸出是46維，為了防止資訊瓶頸，每層的元素要多一些，這裡先選取為64

輸出層的啟用函式選取softmax，這樣可以求取每個取值的概率，這裡一共46個概率且和為1。

from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(64, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(46, activation='softmax'))

設定模型的損失函式、優化器、評估標準

由於是多元分類，這裡選取分類交叉熵作為損失函式，他將網路輸出的概率分佈與目標的真實分佈之間的距離最小化。

model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

訓練模型

x_val = x_train[:1000]
partial_x_train = x_train[1000:]

y_val = one_hot_train_labels[:1000]
partial_y_train = one_hot_train_labels[1000:]

history = model.fit(partial_x_train,
                    partial_y_train,
                    # epochs=15,
                    epochs=20,  # 從繪製的圖形分析出，8輪次後出現過耦合現象，可以停止
                    batch_size=512,
                    validation_data=(x_val, y_val))

可以通過繪製損失和經度在訓練集、校驗集上的圖形來調整超引數：

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()

plt.clf()   # clear figure

acc = history.history['acc']
val_acc = history.history['val_acc']

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()

通過圖形可以看到在訓練到第八輪時達到最優，再訓練就過耦合了。可以調整輪次為9。

預測資料：

概率最大的就是最有可能的分類

predictions = model.predict(x_test)
print(predictions[1].shape)
print(np.sum(predictions[1]))
print(predictions[1])
print(np.argmax(predictions[1]))

第二個測試樣本屬於第十一類主題（0是第一類），可能性達到95%

AI-040: Python深度學習3 - 三個Karas例項-2

例項2：通過路透社資料集來將文字區分46個不同主題這裡與上一個例項不同的地方：這是個多元分類問題，因此最終輸出是46維向量載入資料 from keras.datasets import reuters (train_data, train_labels), (test_data

AI-041: Python深度學習3 - 三個Karas例項-3

例項3：通過波士頓的房屋資料預測房價這是一個迴歸問題，因為最終輸出的房價是一個連續值。載入資料： from keras.datasets import boston_housing (train_data, train_targets), (test_data, test_t

python學習第三個坑

cat 自定義函數 min 類型一個默認參數變長參數是個分隔 ##########################python 第三章 ################################這一章呢,主要是文件的操作,還有涉及到函數的一部分. PS:整理

20個有趣的Python深度學習應用程式

1.頂級Python深度學習應用程式在這個使用Python的深度學習中，我們將看到使用Python進行深度學習的應用程式。在本文中，我們將討論Python深度學習的20個主要應用程式。到目前為止，我們已經看到了深度學習是什麼以及如何實現它。現在讓我們通過使用Python在現實世界中的應用程式

聽說Python深度學習薪資已超過30K了？20個最牛逼的Python庫送你

核心庫與統計 NumPy 我們從科學應用程式庫開始說起，NumPy是該領域的主要軟體包之一。它旨在處理大型多維陣列和矩陣，並且廣泛的高階數學函式和實現的方法集合，使得可以使用這些物件執行各種操作。在這一年中，NumPy有很多更新。除了錯誤修復和相容性問題之外，關鍵更新還包括NumP

《Python深度學習》——第三章神經網路入門

主要內容：神經網路核心元件 Keras簡介建立深度學習工作站——Jupter 使用深度學習解決二分類，多分類和迴歸問題 3.1 神經網路剖析層，多層構成網路輸入函式和目標損失函式優化器 3.1.1 層：基本元件權重 2D張量，用密集連

《Python深度學習》——第三章神經網路入門

主要內容：神經網路核心元件 Keras簡介建立深度學習工作站——Jupter 使用深度學習解決二分類，多分類和迴歸問題 3.1 神經網路剖析層，多層構成網路輸入函式和目標損失函式優化器 3.1.

python 深度學習（3） -- 模型優化準則

（一）啟用函式的選擇在前面我們提到的啟用函式是 sigmoid 函式，但 sigmoid 函式有一個很大的侷限性，就是當 x 增大或減少時，它的梯度變得越來也小。如果使用梯度下降或類似的方法，就存在問題。也就是梯度消失問題。因為大的負數變為 0 ，大的整數變成 1 這意味

Deeplearning.ai吳恩達筆記之神經網路和深度學習3

Shallow Neural Network Neural Networks Overview 同樣，反向傳播過程也分成兩層。第一層是輸出層到隱藏層，第二層是隱藏層到輸入層。其細節部分我們之後再來討論。 Neural Network Representation

吳裕雄 python深度學習與實踐（3）

strftime print sleep .com 實踐 info str def col import threading, time def doWaiting(): print(‘start waiting:‘, time.strftime(‘%S‘))

機器學習--如何將NLP應用到深度學習(3)

關系 http 命令構建 time 原理最簡 gcc 復雜數據收集以後，我們下面接著要幹的事情是如何將文本轉換為神經網絡能夠識別的東西。詞向量作為自然語言，只有被數學化才能夠被計算機認識和計算。數學化的方法有很多，最簡單的方法是為每個詞分配一個編號，這種

Python globals() locals() vars() 三個內建函數的區別

https 聲明 usr object index 函數 targe outer ref 首先參考官方文檔對這三個函數的介紹： 2. Built-in Functions – Python3.5 1、globals() 返回當前全局符號表, 通常是返回當前模塊下的全局符號表

Python Tkinter學習（三）

extent list ide 分享圖片 destroy 字符串 log point 值範圍 Python初學——窗口視窗Tkinter 1.1 什麽是 Tkinter Python自帶的可編輯的GUI界面，是一個圖像窗口。 Tkinter是使用

Python基礎學習篇章三

inf ins 獲取嵌套 fin 們的 img upper 序列一. Python對象類型 1. 對象是Python最基本的概念，一個Python程序可以分解為模塊、語句、表達式、和對象。它們的關系如下：（1）程序由模塊構成（2）模塊包含語句（3）語句包含表達式

python中反射的三個方法hasattr，getattr，setattr

pythonhasattr(obj,attr) getattr(obj,attr) setattr(obj,attr,val) class People: def eat(self): print(‘eat‘) def drink(self): print(‘

python基礎學習3-文件讀寫、集合、json、函數

subset 使用單引號 trunc else 思路統一數據 test 1 文件讀寫補充文件修改方法1：簡單粗暴直接： 1、先獲取到文件裏面的所有內容 2、然後修改文件裏面的內容 3、清空原來文件裏面的內容 4、重新寫入 f = o

圖像識別VPU——易用的嵌入式AI支持深度學習平臺介紹

dem 解碼控制令行好的測距輕松分析 ada 公司玩了大半年的嵌入式AI平臺，現在產品進入量產模式，也接觸了很多嵌入式方案，有了一些心得體會，本人不才，在這裏介紹一下一款簡單易用的嵌入式AI方案——Movidius Myriad 2 VPU(MA2450) 和

《Python深度學習》高清中文版pdf+高清英文版pdf+源代碼

-o 圖片分享 http 能夠更多彩色 pro vpd 下載：https://pan.baidu.com/s/1fngyDdcld6rA5qoho1dQCw 更多最新的資料：http://blog.51cto.com/3215120 《Python深度學習》【中文版和

2018《Python 深度學習》教程

2018《Python 深度學習》教程。連結: https://pan.baidu.com/s/1d37K39Z-5a6FNIK1tpU2BA 提取碼: enqw 教程將近180個視訊，講解詳細透徹。將近4個月的視訊課程學習，為了能得到提升，大家可以給自己制定一個計劃，比如每天看1個

Python深度學習案例1--電影評論分類(二分類問題)

我覺得把課本上的案例先自己抄一遍，然後將書看一遍。最後再寫一篇部落格記錄自己所學過程的感悟。雖然與課本有很多相似之處。但自己寫一遍感悟會更深電影評論分類(二分類問題) 本節使用的是IMDB資料集，使用Jupyter作為編譯器。這是我剛開始使用Jupyter，不得不說它的自動補全真的不咋地（以前一直用py

AI-040: Python深度學習3 - 三個Karas例項-2

相關推薦