6、神經網路學習總結

阿新 • • 發佈：2019-02-03

package com.jd;

import java.io.BufferedReader;
import java.io.FileReader;
import java.util.ArrayList;
import java.util.List;

//        輸入：
//            訓練集 D = {(x1,y1),(x2,y2),...,(xm,ym)};
//            屬性集 A = {a1,a2,...,ad}.
//        過程：
//            在（0,1）範圍內隨機初始化網路中所有連線權和閾值
//            repeat
//                for all(xk,yk)屬於D do
//                    根據當前引數和式（5.3）計算當前樣本的輸出yk'；
//                    根據式（5.10）計算輸出層神經元的梯度項gj；
//                    根據式（5.15）計算隱層神經元的梯度項eh；
//                    根據式（5.11）-（5.14）更新連線權whj，vih與閾值oj，yh
//                end for
//            until達到停止條件
//
//        輸出：連線權與閾值確定的多層前饋神經網路


public class neural_network {

    static List<Double> L_copy(List<Double> L){
        List<Double> L_new = new ArrayList<Double>();
        for(Double num:L){
            L_new.add(num);
        }
        return L_new;
    }

    static List<List<Double>> LL_copy(List<List<Double>> LL){
        List<List<Double>> LL_new = new ArrayList<List<Double>>();
        for(List<Double> L :LL){
            LL_new.add(L_copy(L));
        }
        return LL_new;
    }

    static class neural_network_parameter{

        public List<List<Double>> LL01;
        public List<Double> cut_off01;
        public List<List<Double>> LL12;
        public List<Double> cut_off12;

        public neural_network_parameter(List<List<Double>> LL01, List<Double> cut_off01,
                                        List<List<Double>> LL12, List<Double> cut_off12){
            this.LL01 = LL_copy(LL01);
            this.LL12 = LL_copy(LL12);
            this.cut_off01 = L_copy(cut_off01);
            this.cut_off12 = L_copy(cut_off12);
        }

    }

    //資料讀入
    static List<play_example> exampleListMapInit(BufferedReader lines) throws Exception{

        List<play_example> exampleList = new ArrayList<play_example>();

        String line = null;

        //空出第一行
        lines.readLine();

        while ((line = lines.readLine())!=null) {

            String[] lineArray = line.split(",");

            exampleList.add(new play_example(lineArray[0],lineArray[1],lineArray[2],lineArray[3],lineArray[4]));

        }

        return exampleList;
    }

    static List<List<Double>> weight_matrix_generation(int num1, int num2){

        List<List<Double>> LL = new ArrayList<List<Double>>();

        for(int i=0; i<num1; i++){
            List<Double> L = new ArrayList<Double>();
            for(int j=0; j<num2; j++){
//                L.add((double)(i+j));
                L.add(Math.random()-0.5);
            }
            LL.add(L);
        }

        return LL;
    }

    static List<Double> cut_off_generation(int num1){

        List<Double> L = new ArrayList<Double>();

        for(int i=0; i<num1; i++){
            L.add(Math.random()-0.5);
        }

        return L;
    }

    static  List<List<Double>> data_pretreatment(List<play_example> exampleList){

        List<List<Double>> data = new ArrayList<List<Double>>();

        for(play_example example: exampleList){
            List<Double> L = new ArrayList<Double>();
            L.add(example.outlook);
            L.add(example.temperature);
            L.add(example.humidity);
            L.add(example.windy);
            L.add(example.is_play);
            data.add(L);
        }

        return data;
    }

    static Double activation(Double cell){
        return 1/(1+Math.exp(-cell));
    }

    static List<List<Double>> spread(List<List<Double>> datai, List<List<Double>> LLi_1, List<Double> cut_offi_1){

        List<List<Double>> datai_1 = new ArrayList<List<Double>>();

        for(int i=0; i<datai.size(); i++){
            List<Double> L = new ArrayList<Double>();
            for(int j=0; j<LLi_1.get(0).size(); j++){
                double cell = 0;
                for(int k=0; k<datai.get(0).size(); k++){
                    cell += datai.get(i).get(k)* LLi_1.get(k).get(j);
                }
                L.add(activation(cell-cut_offi_1.get(j)));
            }
            datai_1.add(L);
        }

        return datai_1;
    }


    static Double error(List<List<Double>> X, List<List<Double>> LL01, List<Double> cut_off01,
                        List<List<Double>> LL12, List<Double> cut_off12, List<Double> Y){

        List<List<Double>> data1 = spread(X,LL01,cut_off01);

        List<List<Double>> data2 = spread(data1,LL12,cut_off12);

        double error = 0;
        for(int i=0; i<Y.size(); i++){
            error += Math.pow(Y.get(i)-data2.get(i).get(0),2);
        }

        return error;
    }

    static void random_gradient_iteration(List<List<Double>> X, List<List<Double>> LL01, List<Double> cut_off01,
                                   List<List<Double>> LL12, List<Double> cut_off12, List<Double> Y, double rate, int idex){

        List<List<Double>> data1 = spread(X,LL01,cut_off01);
        List<List<Double>> data2 = spread(data1,LL12,cut_off12);

        List<List<Double>> dLL01 = new ArrayList<List<Double>>();
        List<List<Double>> dLL12 = new ArrayList<List<Double>>();
        List<Double> dcut_off01 = new ArrayList<Double>();
        List<Double> dcut_off12 = new ArrayList<Double>();

        for(int i=0; i<cut_off12.size(); i++){
            dcut_off12.add(rate*(data2.get(idex).get(0)-Y.get(idex))*data2.get(idex).get(0)*(1-data2.get(idex).get(0)));
        }

        for(int i=0; i<LL12.size(); i++) {
            List<Double> L = new ArrayList<Double>();
            for (int j = 0; j < LL12.get(i).size(); j++) {
                L.add(-dcut_off12.get(j)*data1.get(idex).get(i));
            }
            dLL12.add(L);
        }

        for(int i=0; i<cut_off01.size(); i++){
            double sum = 0;
            for(int j=0; j< LL12.get(i).size(); j++){
                sum += data1.get(idex).get(i)*(1-data1.get(idex).get(i))*cut_off12.get(j)*LL12.get(i).get(j);
            }
            dcut_off01.add(sum);
        }

        for(int i=0; i<LL01.size(); i++){
            List<Double> L = new ArrayList<Double>();
            for(int j=0; j<LL01.get(i).size(); j++){
                L.add(-dcut_off01.get(j)*X.get(idex).get(i));
            }
            dLL01.add(L);
        }

        for(int i=0; i<LL01.size(); i++){
            for(int j=0; j<LL01.get(i).size(); j++){
                LL01.get(i).set(j,LL01.get(i).get(j)+dLL01.get(i).get(j));
            }
        }

        for(int i=0; i<LL12.size(); i++){
            for(int j=0; j<LL12.get(i).size(); j++){
                LL12.get(i).set(j,LL12.get(i).get(j)+dLL12.get(i).get(j));
            }
        }

        for(int i=0; i<cut_off01.size(); i++){
            cut_off01.set(i,cut_off01.get(i)+dcut_off01.get(i));
        }

        for(int i=0; i<cut_off12.size(); i++){
            cut_off12.set(i,cut_off12.get(i)+dcut_off12.get(i));
        }
    }

    static void BP(List<List<Double>> data){

        //這裡為單隱層的神經網路，設定輸入維度，隱層維度，輸出維度
        int d = data.get(0).size()-1;
        int q = 4;
        int l = 1;

        List<List<Double>> X = new ArrayList<List<Double>>();
        List<Double> Y = new ArrayList<Double>();

        for(int i=0; i<data.size(); i++){
            List<Double> L = new ArrayList<Double>();
            for(int j=0; j<data.get(i).size()-1; j++){
                L.add(data.get(i).get(j));
            }
            X.add(L);
            Y.add(data.get(i).get(data.get(i).size()-1));

        }


        //隨機設定初始的權重向量（以後面的數量為準），例如（d，q）就有q組向量，每個向量d維
        //這裡如果想提高效率，可以隨機多組初始值,同時執行
        List<List<Double>> LL01 = weight_matrix_generation(d,q);
        List<Double> cut_off01 = cut_off_generation(q);
        List<List<Double>> LL12 = weight_matrix_generation(q,l);
        List<Double> cut_off12 = cut_off_generation(1);

        neural_network_parameter parameter = new neural_network_parameter(LL01,cut_off01,LL12,cut_off12);
        double error = error(X, LL01, cut_off01, LL12, cut_off12, Y);

        double rate = 0.1;
        for(int idex=0; idex<1000; idex++){
            random_gradient_iteration(X, LL01, cut_off01, LL12, cut_off12, Y, rate, idex%Y.size());
            if(error(X, LL01, cut_off01, LL12, cut_off12, Y)<error){
                error = error(X, LL01, cut_off01, LL12, cut_off12, Y);
                parameter = new neural_network_parameter(LL01,cut_off01,LL12,cut_off12);
                System.out.println(error);
            }
        }

    }


    public static void main(String[] args) throws Exception {

        BufferedReader lines = new BufferedReader(new FileReader(
                "C:\\Users\\zhangchaoyu\\Desktop\\zcy\\java_and_scala\\machine_learning\\src\\main\\resources\\14.csv"));
//        BufferedReader lines = new BufferedReader(new FileReader("D:\\java專案\\machine_learning\\src\\main\\resources\\1.csv"));

        List<play_example> exampleList = exampleListMapInit(lines);

        List<List<Double>> data = data_pretreatment(exampleList);

        BP(data);

    }



}

6、神經網路學習總結

package com.jd; import java.io.BufferedReader; import java.io.FileReader; import java.util.ArrayList; import java.util.List; // 輸

人工智慧、機器學習、深度學習、神經網路概念說明

首先要簡單區別幾個概念：人工智慧，機器學習，深度學習，神經網路。這幾個詞應該是出現的最為頻繁的，但是他們有什麼區別呢？人工智慧：人類通過直覺可以解決的問題，如：自然語言理解，影象識別，語音識別等，計算機很難解決，而人工智慧就是要解決這類問題。機器學習：機器學習是一種能夠賦予機器學習的能力以此讓它完成直

機器學習、神經網路的幾個概念區分

剛接觸機器學習這一塊，對一些基本用語概念比較模糊，比如機器學習、深度學習、人工神經網路這些等等，總是會習慣性混為一談。所以，做一下區分。機器學習(Machine Learning, ML)是一門多領域交叉學科，它是人工智慧的核心，是使計算機具有智慧的根本途徑，其應用遍及人

輕量化神經網路模型總結：SqueezeNet、Xception、MobileNet、ShuffleNet

總結今年來的幾個輕量化模型：SqueezeNet、Xception、MobileNet、ShuffleNet 下面給出時間軸： 2016.02 伯克利&斯坦福提出 SqueezeNet 2016.10 google提出 Xception 2017

專注機器學習、深度學習、神經網路、自然語言處理、演算法、Python體系、分散式爬蟲等

深度整理AI學習資料，長期更新機器學習實戰中文文字版，帶完整書籤，能複製文字出來。還有英文版，中文掃描版，原始碼，讀書筆記等，非常全面；機器學習-實用案例解析，中英文版，帶完整

人工智慧、機器學習、神經網路和深度學習的關係

最近很長的一段時間，人工智慧的熱度都維持在一定的高度。但是大家在關注或研究人工智慧領域的時候，總是會遇到這樣的幾個關鍵詞：深度學習、機器學習、神經網路。那他們之間到底是什麼樣的關係呢？先說人工智慧，人工智慧是在1956年一個叫達特茅斯會議上提出的。更準確的說是1956年學者們在會議上將他們確定

人工智慧、機器學習、神經網路及深度學習關係

前段時間看了不少關於人工智慧方面的書籍部落格和論壇，深深覺得了人工智慧是個大坑，裡面有太多的知識點和學科，要想深入絕非易事，於是萌發了自己寫一些部落格把自己的學習歷程和一些知識點筆記都記錄下來的想法，給自己一個總結收穫，同時監督自己的動力，這樣咱也算是“有監督學習”了：）這裡提到了“有監督學習

AI（1）認知人工智慧、機器學習、神經網路、深度學習。

寬為限緊用功功夫到滯塞通開篇 AI領域是個水很深的新領域，對於非科學研究專業人士來說更是深不可測。選擇自己喜歡的學科，興趣是最好的老師，攻克下去總會有意想不到的收穫。AI時代，我們要更加努力！什麼是人工智慧？以下內容摘自知乎什

AndrewNg機器學習第四周作業：關於使用邏輯迴歸、神經網路訓練資料並應用之的心得

ex3的作業是根據已有的資料集（20*20畫素的圖片，每個畫素是一個feature，總共400個features，400個features作為輸入X，資料集已經包含輸出的y，代表這是什麼數字），去識別手寫數字。首先是使用邏輯迴歸方法來分類10

寫給人類的機器學習四、神經網路和深度學習

四、神經網路和深度學習使用深度學習，我們仍然是習得一個函式f，將輸入X對映為輸出Y，並使測試資料上的損失最小，就像我們之前那樣。回憶一下，在 2.1 節監督學習中，我們的初始“問題陳述”： Y = f(X) + ϵ 訓練：機器從帶標籤的

周志華《Machine Learning》學習筆記（6）--神經網路

上篇主要討論了決策樹演算法。首先從決策樹的基本概念出發，引出決策樹基於樹形結構進行決策，進一步介紹了構造決策樹的遞迴流程以及其遞迴終止條件，在遞迴的過程中，劃分屬性的選擇起到了關鍵作用，因此緊接著討論了三種評估屬性劃分效果的經典演算法，介紹了剪枝策略來解決原生決

機器學習、神經網路計算過程的矩陣化與向量化

為什麼需要矩陣化向量化運算過程？ numpy在實現內部運算的時候，對矩陣運算過程進行了優化，且優化效果特別明顯。如果我們使用的是原始的for迴圈雖然也可以完成任務，但是頻繁的使用for迴圈將會大大的增加計算時間。我們應該儘量把運算向量化，交給numpy去完成。

Tensorflow學習筆記 (基礎-第一篇)------ 搭建神經網路，總結搭建八股

---- 內容 1、基本概念 2、神經網

《構建之法》第八、九章學習總結

快速需求獲取利益相關者軟件需求用戶需求估計 bcd abcd 第八章：需求分析這一章主要講述了軟件需求的類型、利益相關者、獲取用戶需求的常用方法和步驟、競爭性需求分析的框架NABCD、四象限方法、項目計劃和估計的技術。確認軟件需求有以下步驟：1.獲取和引導需

javascript小括號、中括號、大括號學習總結

truct ons 匿名 art eva 定義執行函數自執行 details 作為一名編程人員，和括號打交道是必不可少的。你可知道在不同的上下文中，括號的作用是不一樣的，今天就讓我們簡單總結下javascript小括號、中括號、大括號的用法。總的來說，JavaScri

20165233 Java第二、三章學習總結

符號 int() 編譯運行 while 常量 java color ima 進行 2017-2018-2 《Java程序設計》第二周學習總結教材學習內容總結第二、三章 ch2 標識符與關鍵字基本數據類型：邏輯類型：boolean 整數類型：int、byte、sho

神經網路學習筆記（1）Image Classification

學習網站：資料驅動方法 KNN（例如採用L1曼哈頓距離）程式碼如下： import numpy as np class NearestNeighbor: def train(self,X,y): self.Xtrain=X self

對抗神經網路學習（四）——WGAN+爬蟲生成皮卡丘影象(tensorflow實現)

一、背景 WGAN的全稱為Wasserstein GAN, 是Martin Arjovsky等人於17年1月份提出的一個模型，該文章可以參考[1]。WGAN針對GAN存在的問題進行了有針對性的改進，但WGAN幾乎沒有改變GAN的結構，只是改變了啟用函式和loss函式，以及擷取權重，卻得到了非常好

神經網路學習（4）————自組織特徵對映神經網路（SOM）以及python實現

一、自組織競爭學習神經網路模型（無監督學習）（一）競爭神經網路在競爭神經網路中，一層是輸入層，一層輸出層，輸出層又稱為競爭層或者核心層。在一次輸入中，權值是隨機給定的，在競爭層每個神經元獲勝的概率相同，但是最後會有一個興奮最強的神經元。興奮最強的神經元戰勝了其他神

神經網路學習（3）————BP神經網路以及python實現

一、BP神經網路結構模型 BP演算法的基本思想是，學習過程由訊號的正向傳播和誤差的反向傳播倆個過程組成，輸入從輸入層輸入，經隱層處理以後，傳向輸出層。如果輸出層的實際輸出和期望輸出不符合

6、神經網路學習總結

相關推薦