Spark中基於神經網路的MLPC(多層感知器分類器)的使用

阿新 • • 發佈：2019-01-27

本文首發於我的個人部落格QIMING.INFO，轉載請帶上鍊接及署名。

MLPC(Multilayer Perceptron Classifier)，多層感知器分類器，是一種基於前饋人工神經網路（ANN）的分類器。Spark中目前僅支援此種與神經網路有關的演算法，在org.apache.spark.ml中（並非mllib）。本文通過程式碼來演示用Spark執行MLPC的一個小例子。

演算法簡介

多層感知器是一種多層的前饋神經網路模型。

所謂前饋型神經網路，指其從輸入層開始只接收前一層的輸入，並把計算結果輸出到後一層，並不會給前一層有所反饋，整個過程可以使用有向無環圖來表示。該型別的神經網路由三層組成，分別是輸入層(Input Layer)

，一個或多個隱層(Hidden Layer)，輸出層(Output Layer)，如圖所示：

MLPC採用了BP(反向傳播，Back Propagation) 演算法，BP演算法的學習目的是對網路的連線權值進行調整，使得調整後的網路對任一輸入都能得到所期望的輸出。BP 演算法名稱裡的反向傳播指的是該演算法在訓練網路的過程中逐層反向傳遞誤差，逐一修改神經元間的連線權值，以使網路對輸入資訊經過計算後所得到的輸出能達到期望的誤差。

Spark的多層感知器隱層神經元使用sigmoid函式作為啟用函式，輸出層使用的是softmax函式。

MLPC可調的幾個重要引數:

featuresCol：輸入資料 DataFrame 中指標特徵列的名稱。

labelCol：輸入資料 DataFrame 中標籤列的名稱。
layers：這個引數是一個整型陣列型別，第一個元素需要和特徵向量的維度相等，最後一個元素需要訓練資料的標籤數相等，如 2 分類問題就寫 2。中間的元素有多少個就代表神經網路有多少個隱層，元素的取值代表了該層的神經元的個數。例如val layers = (5,6,5,2)。
maxIter：優化演算法求解的最大迭代次數。預設值是 100。
predictionCol:預測結果的列名稱。

執行步驟

資料說明

MLPC對資料來源有嚴格要求，只能是以下兩種：

DataFrame
使用DataFrame作為資料來源時必須指定DataFrame中的標籤列和特徵列；

LIBSVM格式文字檔案
資料格式為：標籤特徵ID:特徵值特徵ID:特徵值……

本例中採用了LIBSVM格式文字檔案，資料如下：

[[email protected] ML_Data]$ cat input/sample_multiclass_classification_data.txt 
1 1:-0.222222 2:0.5 3:-0.762712 4:-0.833333 
1 1:-0.555556 2:0.25 3:-0.864407 4:-0.916667 
1 1:-0.722222 2:-0.166667 3:-0.864407 4:-0.833333 
1 1:-0.722222 2:0.166667 3:-0.694915 4:-0.916667 
0 1:0.166667 2:-0.416667 3:0.457627 4:0.5 
……
……
……
2 1:-0.388889 2:-0.166667 3:0.186441 4:0.166667 
0 1:-0.222222 2:-0.583333 3:0.355932 4:0.583333 
1 1:-0.611111 2:-0.166667 3:-0.79661 4:-0.916667 
1 1:-0.944444 2:-0.25 3:-0.864407 4:-0.916667 
1 1:-0.388889 2:0.166667 3:-0.830508 4:-0.75

程式碼及說明


import org.apache.spark.ml.classification.MultilayerPerceptronClassifier
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator

import org.apache.spark.sql.SparkSession

object MLPCTest {

  def main(args: Array[String]): Unit = {
    // 構建spark物件
    val spark = SparkSession.builder.appName("MLPCTest").getOrCreate()

    // 讀取以LIBSVM格式儲存的資料
    val data = spark.read.format("libsvm").load("file:///home/xuqm/ML_Data/input/sample_multiclass_classification_data.txt")

    // 拆分成訓練集和測試集
    val splits = data.randomSplit(Array(0.6, 0.4), seed = 1234L)
    val train = splits(0)
    val test = splits(1)

    // 指定神經網路的圖層：
    // 輸入層4個結點(即4個特徵)；兩個隱藏層，隱藏結點數分別為5和4；輸出層3個結點(即分為3類)
    val layers = Array[Int](4, 5, 4, 3)

    // 建立MLPC訓練器並設定引數
    val trainer = new MultilayerPerceptronClassifier().
      setLayers(layers).
      setBlockSize(128).
      setSeed(1234L).
      setMaxIter(100)

    // 訓練模型
    val model = trainer.fit(train)

    // 用訓練好的模型預測測試集的結果
    val result = model.transform(test)
    val predictionAndLabels = result.select("prediction", "label")

    // 計算誤差並輸出
    val evaluator = new MulticlassClassificationEvaluator().setMetricName("accuracy")
    println("Test set accuracy = " + evaluator.evaluate(predictionAndLabels))

    // 輸出結果
    result.show(60,false)
  }
}

結果展示

// 計算誤差並輸出
Test set accuracy = 0.9019607843137255

// 輸出結果
result.show(60,false)
+-----+---------------------------------------------------------+----------+
|label|features                                                 |prediction|
+-----+---------------------------------------------------------+----------+
|0.0  |(4,[0,1,2,3],[-0.666667,-0.583333,0.186441,0.333333])    |2.0       |
|0.0  |(4,[0,1,2,3],[-0.277778,-0.333333,0.322034,0.583333])    |0.0       |
|0.0  |(4,[0,1,2,3],[-0.222222,-0.583333,0.355932,0.583333])    |0.0       |
|0.0  |(4,[0,1,2,3],[-0.0555556,-0.833333,0.355932,0.166667])   |2.0       |
|0.0  |(4,[0,1,2,3],[-0.0555556,-0.166667,0.288136,0.416667])   |2.0       |
|0.0  |(4,[0,1,2,3],[-1.32455E-7,-0.166667,0.322034,0.416667])  |2.0       |
|0.0  |(4,[0,1,2,3],[0.111111,-0.583333,0.355932,0.5])          |0.0       |
|0.0  |(4,[0,1,2,3],[0.222222,-0.166667,0.627119,0.75])         |0.0       |
|0.0  |(4,[0,1,2,3],[0.333333,-0.583333,0.627119,0.416667])     |0.0       |
|0.0  |(4,[0,1,2,3],[0.333333,-0.166667,0.423729,0.833333])     |0.0       |
|0.0  |(4,[0,1,2,3],[0.388889,-0.166667,0.525424,0.666667])     |0.0       |
|0.0  |(4,[0,1,2,3],[0.444444,-0.0833334,0.38983,0.833333])     |0.0       |
|0.0  |(4,[0,1,2,3],[0.555555,-0.166667,0.661017,0.666667])     |0.0       |
|0.0  |(4,[0,1,2,3],[0.722222,-0.333333,0.728813,0.5])          |0.0       |
|0.0  |(4,[0,1,2,3],[0.888889,-0.333333,0.932203,0.583333])     |0.0       |
|0.0  |(4,[0,1,2,3],[1.0,0.5,0.830508,0.583333])                |0.0       |
|0.0  |(4,[0,2,3],[0.166667,0.457627,0.833333])                 |0.0       |
|0.0  |(4,[0,2,3],[0.388889,0.661017,0.833333])                 |0.0       |
|1.0  |(4,[0,1,2,3],[-0.944444,-0.166667,-0.898305,-0.916667])  |1.0       |
|1.0  |(4,[0,1,2,3],[-0.722222,-0.166667,-0.864407,-0.833333])  |1.0       |
|1.0  |(4,[0,1,2,3],[-0.666667,-0.166667,-0.864407,-0.916667])  |1.0       |
|1.0  |(4,[0,1,2,3],[-0.666667,-0.0833334,-0.830508,-1.0])      |1.0       |
|1.0  |(4,[0,1,2,3],[-0.611111,0.166667,-0.79661,-0.75])        |1.0       |
|1.0  |(4,[0,1,2,3],[-0.555556,0.166667,-0.830508,-0.916667])   |1.0       |
|1.0  |(4,[0,1,2,3],[-0.555556,0.5,-0.830508,-0.833333])        |1.0       |
|1.0  |(4,[0,1,2,3],[-0.555556,0.5,-0.79661,-0.916667])         |1.0       |
|1.0  |(4,[0,1,2,3],[-0.5,0.166667,-0.864407,-0.916667])        |1.0       |
|1.0  |(4,[0,1,2,3],[-0.5,0.75,-0.830508,-1.0])                 |1.0       |
|1.0  |(4,[0,1,2,3],[-0.388889,0.166667,-0.830508,-0.75])       |1.0       |
|1.0  |(4,[0,1,2,3],[-0.388889,0.166667,-0.762712,-0.916667])   |1.0       |
|1.0  |(4,[0,1,2,3],[-0.388889,0.583333,-0.898305,-0.75])       |1.0       |
|1.0  |(4,[0,1,2,3],[-0.388889,0.583333,-0.762712,-0.75])       |1.0       |
|1.0  |(4,[0,1,2,3],[-0.333333,0.25,-0.898305,-0.916667])       |1.0       |
|1.0  |(4,[0,1,2,3],[-0.166667,0.666667,-0.932203,-0.916667])   |1.0       |
|1.0  |(4,[0,2,3],[-0.833333,-0.864407,-0.916667])              |1.0       |
|1.0  |(4,[0,2,3],[-0.777778,-0.898305,-0.916667])              |1.0       |
|2.0  |(4,[0,1,2,3],[-0.611111,-1.0,-0.152542,-0.25])           |2.0       |
|2.0  |(4,[0,1,2,3],[-0.555556,-0.583333,-0.322034,-0.166667])  |2.0       |
|2.0  |(4,[0,1,2,3],[-0.388889,-0.166667,0.186441,0.166667])    |2.0       |
|2.0  |(4,[0,1,2,3],[-0.333333,-0.666667,-0.0847458,-0.25])     |2.0       |
|2.0  |(4,[0,1,2,3],[-0.333333,-0.666667,-0.0508475,-0.166667]) |2.0       |
|2.0  |(4,[0,1,2,3],[-0.277778,-0.166667,0.186441,0.166667])    |2.0       |
|2.0  |(4,[0,1,2,3],[-0.222222,-0.5,-0.152542,-0.25])           |2.0       |
|2.0  |(4,[0,1,2,3],[-0.222222,-0.333333,0.0508474,-4.03573E-8])|2.0       |
|2.0  |(4,[0,1,2,3],[-0.111111,-0.166667,0.0847457,0.166667])   |2.0       |
|2.0  |(4,[0,1,2,3],[-0.0555556,-0.25,0.186441,0.166667])       |2.0       |
|2.0  |(4,[0,1,2,3],[-1.32455E-7,-0.25,0.254237,0.0833333])     |2.0       |
|2.0  |(4,[0,1,2,3],[0.0555554,-0.833333,0.186441,0.166667])    |2.0       |
|2.0  |(4,[0,1,2,3],[0.0555554,-0.25,0.118644,-4.03573E-8])     |2.0       |
|2.0  |(4,[0,1,2,3],[0.111111,0.0833333,0.254237,0.25])         |2.0       |
|2.0  |(4,[0,1,2,3],[0.333333,-0.166667,0.355932,0.333333])     |0.0       |
+-----+---------------------------------------------------------+----------+

Spark中基於神經網路的MLPC(多層感知器分類器)的使用

演算法簡介

執行步驟

資料說明

程式碼及說明

結果展示

基於神經網路（多層感知機）識別手寫數字

Spark中基於神經網路的MLPC(多層感知器分類器)的使用

【機器學習筆記21】神經網路（多層感知機)

單層神經網路、多層感知機、深度學習的總結

神經網路之多層感知機MLP的實現（Python+TensorFlow）

基於R中的神經網路包（nnet）做分類(高階篇)

深度學習基礎--不同網路種類--多層感知機MLP

tensorflow 多層感知機分類mnist

keras中使用MLP(多層感知機)神經網路來實現MNIST手寫體識別

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

Deeplearning4j 實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

MLP（多層感知器）神經網路

基於粒子群演算法的概率神經網路實現多分類（PSO_PNN）

深度學習基礎（二）—— 從多層感知機（MLP）到卷積神經網路（CNN）

構建多層感知器神經網路對數字圖片進行文字識別

深度學習Deeplearning4j 入門實戰（5）：基於多層感知機的Mnist壓縮以及在Spark實現

神經網路/多層感知器（MLP）架構：選擇隱藏層數量和大小的標準

MLP多層感知機（人工神經網路）原理及程式碼實現

【Python-ML】神經網路-多層感知器增加梯度檢驗

深度神經網路的多工學習概覽(An Overview of Multi-task Learning in Deep Neural Networks)

Spark中基於神經網路的MLPC(多層感知器分類器)的使用

演算法簡介

執行步驟

資料說明

程式碼及說明

結果展示

相關推薦