使用遞迴神經網路識別垃圾簡訊

阿新 • • 發佈：2018-12-24

1.測試資料準備

首先匯入本地準備的spam檔案

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from keras.models import Model
from keras.layers import LSTM, Activation, Dense, Dropout, Input, Embedding
from keras.optimizers import RMSprop
from keras.preprocessing.text import Tokenizer
from keras.preprocessing import sequence
from keras.utils import to_categorical
from keras.callbacks import EarlyStopping
%matplotlib inline

df = pd.read_csv('spam.csv', delimiter=',', encoding='latin-1')
df.head()

列印結果如下
在這裡插入圖片描述
能觀察到Unnamed:2~4幾列，有空多空資料，所以我們需要將這幾列刪除

df.drop(['Unnamed: 2', 'Unnamed: 3', 'Unnamed: 4'], axis=1, inplace=True)

再次列印

我們可以用seaborn觀察一下資料集label的分佈

sns.countplot(df.v1)
plt.xlabel('Label')
plt.title('Number of ham and spam messages')

在這裡插入圖片描述
然後我們將v2值存入X，將v1存入Y，因為v1值都是ham和spam，所以我們用LabelEncoder將其全部轉為0或1的整數陣列

X = df.v2
Y = df.v1
le = LabelEncoder()
Y = le.fit_transform(Y)
Y = Y.reshape(-1,1)

將測試資料集分成訓練資料和測試資料

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.15)

2.搭建測試模型

首先我們先確定詞庫的最大長度（1000），以及每條簡訊的最大長度（150），然後使用Tokenizer將簡訊拆成單詞

max_words = 1000
max_len = 150
tok = Tokenizer(num_words=max_words)
tok.fit_on_texts(X_train)
sequences = tok.texts_to_sequences(X_train)
sequences_matrix = sequence.pad_sequences(sequences, maxlen=max_len)

定義網路模型

def RNN():
    inputs = Input(shape=[max_len])
    layer = Embedding(max_words, 50, input_length=max_len)(inputs)
    layer = LSTM(64)(layer)
    layer = Dense(256)(layer)
    layer = Activation('relu')(layer)
    layer = Dropout(0.5)(layer)
    layer = Dense(1)(layer)
    layer = Activation('sigmoid')(layer)
    model = Model(inputs=inputs, outputs=layer)
    return model

生成網路

model = RNN()
model.summary()

我們可以觀察一下網路結構
在這裡插入圖片描述

3.模型訓練

model.compile(loss='binary_crossentropy', optimizer=RMSprop(), metrics=['accuracy'])
model.fit(sequences_matrix, Y_train, batch_size=128, epochs=10, validation_split=0.2, callbacks=[EarlyStopping(monitor='val_loss', min_delta=0.0001)])

可以看到，由於我們設定了EarlyStopping，模型在迴圈2次後，val_loss就開始增大，所以模型停止了訓練。
在這裡插入圖片描述
我們可以在測試資料集上看一下模型的準確率

test_sequences = tok.texts_to_sequences(X_test)
test_sequences = sequence.pad_sequences(test_sequences, maxlen=max_len)
accr = model.evaluate(test_sequences, Y_test)
print('Test set\n Loss: {:0.3f}\n Accuracy: {:0.3f}'.format(accr[0], accr[1]))

可以看到在測試資料上loss為0.043，準確率已經達到了99.0%
在這裡插入圖片描述
最後我們可以自己寫一條簡訊進行測試:hi, call me back when you have time.

text = 'hi, call me back when you have time.'
seq = tok.texts_to_sequences([text])
seq_matrix = sequence.pad_sequences(seq, maxlen=max_len)
pred = model.predict(seq_matrix)

可以看到，這條簡訊是垃圾簡訊的概率只有0.08%
在這裡插入圖片描述

到這裡，垃圾簡訊識別的功能就全部實現了。
所有程式碼及測試資料已上傳至git，點選這裡可直接檢視，有疑問的同學請在部落格下方留言或提Issuees，謝謝！

使用遞迴神經網路識別垃圾簡訊

1.測試資料準備首先匯入本地準備的spam檔案 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selec

【深度學習】6：RNN遞迴神經網路原理、與MNIST資料集實現數字識別

前言：自己學習研究完CNN卷積神經網路後，很久的一段時間因為要完成自己的畢業設計就把更新部落格給耽擱了。瞎忙了這麼久，還是要把之前留的補上來。因為“種一棵樹最好的時間是在十年前，其次就是現在！” –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—

PyTorch--雙向遞迴神經網路(B-RNN)概念，原始碼分析

　　關於概念：　　BRNN連線兩個相反的隱藏層到同一個輸出．基於生成性深度學習，輸出層能夠同時的從前向和後向接收資訊．該架構是1997年被Schuster和Paliwal提出的．引入BRNNS是為了增加網路所用的輸入資訊量．例如，多層感知機（MLPS）和延時神經網路(TDNNS)在輸入資料的靈活性方面是非

遞迴神經網路(RNN)隨記

基本概念想法：在之後的輸入要把之前的資訊利用起來。W3就相當於對中間資訊進行一個保留。 X和U組合成一個特徵圖，A表示一個記憶單元。 V矩陣相當於對St進行一個全連線的操作。最終的輸出需要通過softmax將向量轉化成概率的形式。RNN最適合做自然語言處理

Tensorflow學習筆記（第四天）—遞迴神經網路

一、首先下載來源於 Tomas Mikolov 網站上的 PTB 資料集 http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz 二、需要的程式碼：這裡只簡單的放了一些程式碼

（轉載）深度學習基礎（7）——遞迴神經網路

原文地址：https://zybuluo.com/hanbingtao/note/626300 轉載在此的目的是自己做個筆記，日後好複習，如侵權請聯絡我！！　　在前面的文章中，我們介紹了迴圈神經網路，它可以用來處理包含序列結構的資訊。然而，除此之外，資訊往往還存在著諸如樹結構、圖結構等更復雜的結構。對於

[譯]使用遞迴神經網路（LSTMs）對時序資料進行預測

原文地址：A Guide For Time Series Prediction Using Recurrent Neural Networks (LSTMs) 原文作者：Neelabh Pant 譯文出自：掘金翻譯計劃本文永久連結：github.com/xitu/gold-m

NeuralTalk：一種基於Python+numpy使用語句描述影象的多模態遞迴神經網路的例程

NeuralTalk工程的流程如下： The pipeline for the project looks as follows: 輸入資料使用Amazon Mechanical Turk收集的影象和5組語句描述的資料集。 The input is a dataset of im

長短期記憶（LSTM）系列_2.1~2.3、用遞迴神經網路簡要介紹序列預測模型

前置課程 https://machinelearningmastery.com/sequence-prediction/ https://machinelearningmastery.com/gentle-introduction-long-short-term-memory-network

遞迴神經網路RNN網路 LSTM

前言: 根據我本人學習 TensorFlow 實現 LSTM 的經歷，發現網上雖然也有不少教程，其中很多都是根據官方給出的例子，用多層 LSTM 來實現 PTBModel 語言模型，比如： tensorflow筆記：多層LSTM程式碼分析但是感覺這些例子還是

遞迴神經網路

遞迴神經網路序列。根據您的背景，您可能想知道：什麼使Recurrent Networks如此特別？Vanilla神經網路（以及卷積網路）的一個明顯侷限是它們的API太受約束：它們接受固定大小的向量作為輸入（例如影象）併產生固定大小的向量作為輸出（例如不同類別的概率））。不僅如此：這些模型使用固定數量的計

cs224d 作業 problem set3 (一) 實現Recursive Nerual Net Work 遞迴神經網路

''' Created on 2017年10月5日 @author: weizhen ''' # 一個簡單的遞迴神經網路的實現，有著一個ReLU層和一個softmax層 # TODO : 必須要更新前向和後向傳遞函式 # 你可以通過執行 python rnn.py 方法來執行一個梯度檢驗 # 插入pdb.

系統學習深度學習（五） --遞迴神經網路原理，實現及應用

但是大神們說，標準的RNN在實際使用中效果不是很好，真正起到作用的是LSTM，因此RNN只做簡單學習，不上原始碼（轉載了兩篇，第一個是簡單推導，第二個是應用介紹）。下面是簡單推導，轉自：http://blog.csdn.net/aws3217150/article/details/5076

Recurrent Layers——介紹（遞迴神經網路原理介紹）

作者：YJango 連結：https://zhuanlan.zhihu.com/p/24720659 來源：知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。大家貌似都叫Recurrent Neural Networks為迴圈神經網路。我之前是查維基百科的緣故，所以一直叫它遞迴網路。

RNN遞迴神經網路的詳細推導及C++實現

//讓程式自己學會是否需要進位，從而學會加法 #include "iostream" #include "math.h" #include "stdlib.h" #include "time.h" #include "vector" #incl

每個人都能徒手寫遞迴神經網路–手把手教你寫一個RNN

總結：我總是從迷你程式中學到很多。這個教程用python寫了一個很簡單迷你程式講解遞迴神經網路。遞迴神經網路即RNN和一般神經網路有什麼不同？出門左轉我們一篇部落格已經講過了傳統的神經網路不能夠基於前面的已分類場景來推斷接下來的場景分類，但是RNN確有一定記

吳恩達Coursera深度學習（5-1）遞迴神經網路 RNN

Class 5：序列模型 Sequence Models Week 1：迴圈神經網路 RNN（Recurrent）目錄本課程將教你如何建立自然語言，音訊和其他序列資料的模型。由於深入的學習，序列演算法的執行速度遠遠超過兩年前，這

結構遞迴神經網路: 時空領域影象中的深度學習--CVPR2016最佳論文詳解

聯合編譯：陳圳、章敏、Blake 摘要雖然相當適合用來進行序列建模，但深度遞迴神經網路體系結構缺乏直觀的高階時空架構。計算機視覺領域的許多問題都固有存在高階架構，所以我們思考從這方面進行提高。在解決現實世界中的高階直覺計算方面，時空領域影象是一個相當流行的工具。在本

基於Keras/Python的深度學習：遞迴神經網路速成大法

正在統治諸如輸入序列等機器學習難題的一種神經網路型別，是遞迴神經網路（Recurrent Neural Networks）。隨著時間的推移，遞迴神經網路已經擁有包含迴圈、增加反饋和記憶網路的連線。記憶可以使這種型別的網路能夠學習和歸納輸入序列而不是單個模式。遞迴

二十六、圖解遞迴神經網路(RNN)

聊天機器人是需要智慧的，而如果他記不住任何資訊，就談不上智慧，遞迴神經網路是一種可以儲存記憶的神經網路，LSTM是遞迴神經網路的一種，在NLP領域應用效果不錯，本節我們來介紹RNN和LSTM 遞迴神經網路遞迴神經網路（RNN）是兩種人工神經網路的總稱。一種是時間遞迴神經網路（recurrent n

使用遞迴神經網路識別垃圾簡訊

1.測試資料準備

2.搭建測試模型

3.模型訓練

相關推薦