sklearn之神經網路模型(有監督)

阿新 • • 發佈：2018-12-16

分類

MLPClassifier

引數說明:

hidden_layer_sizes : 元組形式,長度n_layers-2,預設(100,),第i元素表示第i個神經元的個數
activation: {‘identity’, ‘logistic’, ‘tanh’, ‘relu’},預設"relu"
- ‘identity’: f(x) = x
- ‘logistic’:f(x) = 1 / (1 + exp(-x))
- ‘tanh’ : f(x) = tanh(x)
- ‘relu’ : f(x) = max(0, x)
solver:{‘lbfgs’, ‘sgd’, ‘adam’}, default ‘adam’
- lbfgs：quasi-Newton方法的優化器
- sgd：隨機梯度下降
- adam： Kingma, Diederik, and Jimmy Ba提出的機遇隨機梯度的優化器注意：預設solver ‘adam’在相對較大的資料集上效果比較好（幾千個樣本或者更多），對小資料集來說，lbfgs收斂更快效果也更好
alpha:float,可選的，預設0.0001,正則化項引數
batch_size:int , 可選的，預設‘auto’,隨機優化的minibatches的大小，如果solver是‘lbfgs’，分類器將不使用minibatch，當設定成‘auto’，batch_size=min(200,n_samples)
learning_rate:{‘constant’，‘invscaling’, ‘adaptive’},預設‘constant’，用於權重更新，只有當solver為’sgd‘時使用
- ‘constant’: 有‘learning_rate_init’給定的恆定學習率
- ‘incscaling’：隨著時間t使用’power_t’的逆標度指數不斷降低學習率learning_rate_effective_learning_rate = learning_rate_init / pow(t, power_t)
- ‘adaptive’：只要訓練損耗在下降，就保持學習為’learning_rate_init’不變，當連續兩次不能降低訓練損耗或驗證分數停止升高至少tol時，將當前學習率除以5.
max_iter: int，可選，預設200，最大迭代次數。
random_state:int 或RandomState，可選，預設None，隨機數生成器的狀態或種子
shuffle: bool，可選，預設True,只有當solver=’sgd’或者‘adam’時使用，判斷是否在每次迭代時對樣本進行清洗。
tol：float, 可選，預設1e-4，優化的容忍度
learning_rate_int:double,可選，預設0.001，初始學習率，控制更新權重的補償，只有當solver=’sgd’ 或’adam’時使用。
power_t: double, optional, default 0.5，只有solver=’sgd’時使用，是逆擴充套件學習率的指數.當learning_rate=’invscaling’，用來更新有效學習率。
verbose : bool, optional, default False,是否將過程列印到stdout
warm_start : bool, optional, default False,當設定成True，使用之前的解決方法作為初始擬合，否則釋放之前的解決方法
momentum : float, default 0.9,Momentum(動量） for gradient descent update. Should be between 0 and 1. Only used when solver=’sgd’.
nesterovs_momentum : boolean, default True, Whether to use Nesterov’s momentum. Only used when solver=’sgd’ and momentum > 0
early_stopping : bool, default False,Only effective when solver=’sgd’ or ‘adam’,判斷當驗證效果不再改善的時候是否終止訓練，當為True時，自動選出10%的訓練資料用於驗證並在兩步連續爹迭代改善低於tol時終止訓練
validation_fraction: float, optional, default 0.1,用作早期停止驗證的預留訓練資料集的比例，早0-1之間，只當early_stopping=True有用
beta_1 : float, optional, default 0.9，Only used when solver=’adam’，估計一階矩向量的指數衰減速率，[0,1)之間
beta_2 : float, optional, default 0.999,Only used when solver=’adam’估計二階矩向量的指數衰減速率[0,1)之間
psilon: float, optional, default 1e-8,Only used when solver=’adam’數值穩定值。

屬性說明:

classes_:每個輸出的類標籤
loss_:損失函式計算出來的當前損失值
coefs_:列表中的第i個元素表示i層的權重矩陣
intercepts_:列表中第i個元素代表i+1層的偏差向量
n_iter_：迭代次數
n_layers_:層數
n_outputs_:輸出的個數
out_activation_:輸出啟用函式的名稱。

方法說明：

fit(X,y):擬合
get_params([deep]):獲取引數
predict(X):使用MLP進行預測
predic_log_proba(X):返回對數概率估計
predic_proba(X)：概率估計
score(X,y[,sample_weight]):返回給定測試資料和標籤上的平均準確度
set_params(**params):設定引數。

from sklearn.neural_network import MLPClassifier

X = [[0., 0.], [1., 1.]]
y = [0, 1]
clf = MLPClassifier(solver='lbfgs', alpha=1e-5,
                    hidden_layer_sizes=(5, 2), random_state=1)
clf.fit(X, y)

MLPClassifier(activation='relu', alpha=1e-05, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(5, 2), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=1, shuffle=True,
       solver='lbfgs', tol=0.0001, validation_fraction=0.1, verbose=False,
       warm_start=False)

clf.predict([[2., 2.], [-1., -2.]])

array([1, 0])

clf.predict_proba([[2., 2.], [-1.,- 2.]])

array([[  1.96718015e-004,   9.99803282e-001],
       [  1.00000000e+000,   4.67017947e-144]])

迴歸

from sklearn.neural_network import MLPRegressor

正則化

實用技巧

多層感知器對特徵的縮放是敏感的，所以它強烈建議您歸一化你的資料。例如，將輸入向量 X 的每個屬性放縮到到 [0, 1] 或 [-1，+1] ，或者將其標準化使它具有 0 均值和方差 1。
最好使用 GridSearchCV 找到一個合理的正則化引數 $\alpha$ ，通常範圍是在 $10.0 ** -np.arange(1, 7)$ 。
據經驗可知，我們觀察到 L-BFGS 收斂速度是更快的並且是小資料集上更好的解決方案。對於規模相對比較大的資料集，Adam 是非常魯棒的。它通常會迅速收斂，並得到相當不錯的表現。另一方面，如果學習率調整得正確，使用 momentum 或 nesterov’s momentum 的 SGD 可以比這兩種演算法更好。

sklearn之神經網路模型(有監督)

分類 MLPClassifier 引數說明: hidden_layer_sizes : 元組形式,長度n_layers-2,預設(100,),第i元素表示第i個神經元的個數 activation: {‘identity’, ‘logistic’, ‘ta

scikit-leran學習筆記（3）---神經網路模型（有監督的）

1.Multi-layer Perceptron 多層感知機 MLP是一個監督學習演算法，圖1是帶一個隱藏層的MLP模型左邊層是輸入層，由神經元集合{xi|x1,x2,…,xm},代表輸入特徵，隱藏層的每個神經元將前一層的的值通過線性加權求

sklearn學習筆記之神經網路

# -*- coding: utf-8 -*- import sklearn from sklearn.neural_network import MLPClassifier import matplotlib.pyplot as plt from sklearn.model_selectio

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

　　上一篇部落格先搭建了基礎環境，並熟悉了基礎知識，本節基於此，再進行深一步的學習。　　接下來看看如何基於PyTorch深度學習框架用簡單快捷的方式搭建出複雜的神經網路模型，同時讓模型引數的優化方法趨於高效。如同使用PyTorch中的自動梯度方法一樣，在搭建複雜的神經網路模型的時候，我們也可以使用PyTor

NLP之神經網路語言模型之超級無敵最佳資料

語言模型 Attention Is All You Need（Transformer）原理小結 ELMo解析 OpenAI GPT解析 BERT解析 https://www.cnblogs.com/huangyc/p/9861453.html 從

使用python寫神經網路模型之分類器

最近在嘗試將所有的機器學習與深度學習的模型用Python來實現，大致的學習思路如下：分類器迴歸與預測時間序列所有的模型先用 Python語言實現，然後用Tensorflow的實現。 1 資料集本文開始以UCI中的Iris資料集作為訓練資

【Scikit-Learn 中文文件】神經網路模型（無監督）- 無監督學習

2.13.1.3. 隨機最大似然學習在 BernoulliRBM 函式中實現的學習演算法被稱為隨機最大似然（Stochastic Maximum Likelihood (SML)）或持續對比發散（Persistent Contrastive Divergence (PCD)）。由於資料的似然函式的形

神經網路模型之CNN網路架構

CNN網路架構神經網路架構發展縱覽從1998年開始，近18年來深度神經網路的架構發展情況如下：上圖，橫座標是操作的複雜度，縱座標是精度。模型設計一開始的時候模型權重越

Udacity機器學習進階—監督學習之神經網路迷你專案

1.建立感知 def activate(self,inputs): """ Takes in @param inputs, a list of numbers equal to length of weights.

當前深度神經網路模型壓縮和加速都有哪些方法？

本期推薦的論文筆記來自 PaperWeekly 社群使用者 @yanjoy。本文全面概述了深度神經網路的壓縮方法，主要可分為引數修剪與共享、低秩分解、遷移/壓縮卷積濾波器和知識精煉，論文對每一類方法的效能、相關應用、優勢和缺陷等方面進行了獨到分析。關於作者：小一一，北京大

神經網路模型入門之模型概述

1.前言走在機器學習的路上, 學習之初，參考《Tensor Flow 實戰》，其中很多概念無法理解，敘述不懂其意，理解內容更無從談起。需要回頭學習基礎知識。人工智慧的基礎模型是神經網路，在此基礎上發展出更多複雜的技術，比如機器學習。 2.神經網路結構

Matlab之DNN：基於Matlab利用神經網路模型(epochs=10000000)預測勒布朗詹姆斯的2018年總決賽(騎士VS勇士)第一場得分、籃板、助攻

預測勒布朗詹姆斯的2018年NBA總決賽(騎士VS勇士)第一場得分數(33.6667)預測勒布朗詹姆斯的2018年NBA總決賽(騎士VS勇士)第一場籃板數(8.7333)預測勒布朗詹姆斯的2018年NB

【火爐煉AI】深度學習002-構建並訓練單層神經網路模型

【火爐煉AI】深度學習002-構建並訓練單層神經網路模型 (本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 前面我們介紹了神經網路的基本結構單元-感知器，現在我們再升一級，看看神經網路的基本結構和

【火爐煉AI】深度學習003-構建並訓練深度神經網路模型

【火爐煉AI】深度學習003-構建並訓練深度神經網路模型 (本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 前面我們講解過單層神經網路模型，發現它結構簡單，難以解決一些實際的比較複雜的問題，故而現

27種神經網路模型的簡介

【1】Perceptron§ 感知機感知機是我們知道的最簡單和最古老的神經元模型，它接收一些輸入，然後把它們加總，通過啟用函式並傳遞到輸出層。【2】Feed Forward(FF)前饋神經網路前饋神經網路（FF），這也是一個很古老的方法——這種方法起源

吳恩達深度學習筆記（3）-神經網路如何實現監督學習？

神經網路的監督學習(Supervised Learning with Neural Networks) 關於神經網路也有很多的種類，考慮到它們的使用效果，有些使用起來恰到好處，但事實表明，到目前幾乎所有由神經網路創造的經濟價值，本質上都離不開一種叫做監督學習的機器學習類別，讓我們舉例看看。

神經網路模型

本文轉載自https://www.toutiao.com/i6432188985530909186/ 一文看懂25個神經網路模型引言在深度學習十分火熱的今天，不時會湧現出各種新型的人工神經網路，想要實時瞭解這些新型神經網路的架構還真是不容易。光是知道各式各樣的神

深度學習之神經網路（CNN/RNN/GAN）演算法原理+實戰目前最新

第1章課程介紹深度學習的導學課程，主要介紹了深度學習的應用範疇、人才需求情況和主要演算法。對課程章節、課程安排、適用人群、前提條件以及學習完成後達到的程度進行了介紹，讓同學們對本課程有基本的認識。 1-1 課程導學第2章神經網路入門本次實戰課程的入門課程。對機器學習和深度學習做了引入

TensorFlow之神經網路簡單實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets("MNIST_data",one_hot=True) ba

介紹一個快速確定神經網路模型中各層矩陣維度的方法

深度學習在設計神經網路結構時需要指定每個隱藏層權重矩陣、偏置項的維度，有的時候容易搞混淆，導致執行時產生維度不對的錯誤，特別是對於隱藏層既深又寬的網路，更容易出錯。下面以一個例項來說明怎麼簡單快速確定每一層各個矩陣的維度。假設需要擬合的函式為：y=f(x)=WX+b。損失函式：J(W,b) 其中 X

sklearn之神經網路模型(有監督)

分類

MLPClassifier

引數說明:

屬性說明:

方法說明：

迴歸

正則化

實用技巧

相關推薦