葡萄酒邏輯迴歸分類（scala實現）

阿新 • • 發佈：2018-12-24

葡萄酒分類（scala實現）

分類方法：邏輯迴歸

其中

0代表壞葡萄酒
1代表好葡萄酒

訓練集中質量評分7.0以上被視為好葡萄酒


	import org.apache.spark.ml.classification.LogisticRegression
	import org.apache.spark.ml.param.ParamMap
	import org.apache.spark.ml.linalg.{Vector, Vectors}
	import org.apache.spark.ml.regression.LinearRegressionModel
	import org.apache.spark.sql.{Row, SparkSession}

	object LogicRegressWineClassifyDemo {
		def main(args: Array[String]): Unit = {
			val sess = SparkSession.builder().appName("ml").master("local[4]").getOrCreate();
			val sc = sess.sparkContext;
			//資料目錄
			val dataDir = "file:///D:/downloads/bigdata/ml/winequality-white.csv"
			//定義樣例類
			case class Wine(FixedAcidity: Double, VolatileAcidity: Double,
							CitricAcid: Double, ResidualSugar: Double, Chlorides: Double,
							FreeSulfurDioxide: Double, TotalSulfurDioxide: Double, Density: Double, PH:
							Double, Sulphates: Double, Alcohol: Double, Quality: Double)

			//變換
			val wineDataRDD = sc.textFile(dataDir).map(_.split(";")).map(w => Wine(w(0).toDouble, w(1).toDouble,
				w(2).toDouble, w(3).toDouble, w(4).toDouble, w(5).toDouble, w(6).toDouble, w(7).toDouble, w(8).toDouble
				, w(9).toDouble, w(10).toDouble, w(11).toDouble))

			import sess.implicits._

			//轉換RDD成DataFrame
			val trainingDF = wineDataRDD.map(w => (if (w.Quality < 7) 0D else 1D,
				Vectors.dense(w.FixedAcidity, w.VolatileAcidity, w.CitricAcid,
					w.ResidualSugar, w.Chlorides, w.FreeSulfurDioxide, w.TotalSulfurDioxide,
					w.Density, w.PH, w.Sulphates, w.Alcohol))).toDF("label", "features")

			//建立線性迴歸物件
			val lr = new LogisticRegression()
			//設定最大迭代次數
			lr.setMaxIter(10).setRegParam(0.01)
			//
			val model = lr.fit(trainingDF)
			//建立測試Dataframe
			val testDF = sess.createDataFrame(Seq((1.0,Vectors.dense(6.1, 0.32, 0.24, 1.5, 0.036, 43, 140, 0.9894, 3.36, 0.64, 10.7)),
				(0.0, Vectors.dense(5.2, 0.44, 0.04, 1.4, 0.036, 38, 124, 0.9898, 3.29, 0.42, 12.4)),
				(0.0,Vectors.dense(7.2, 0.32, 0.47, 5.1, 0.044, 19, 65, 0.9951, 3.38, 0.36, 9)),
				(0.0, Vectors.dense(6.4, 0.595, 0.14, 5.2, 0.058, 15, 97, 0.991, 3.03, 0.41, 12.6)))
			).toDF("label", "features")

			//顯式測試資料
			testDF.show();


			println("========================")
			//預測測試資料(帶標籤),評測模型的質量。
			testDF.createOrReplaceTempView("test")
			val tested = model.transform(testDF).select("features", "label", "prediction")
			tested.show();

			println("========================")
			//預測無標籤的測試資料。
			val predictDF = sess.sql("SELECT features FROM test")
			//預測結果
			val predicted = model.transform(predictDF).select("features", "prediction")
			predicted.show();
		}
	}

葡萄酒邏輯迴歸分類（scala實現）

葡萄酒分類（scala實現）分類方法：邏輯迴歸其中 0代表壞葡萄酒 1代表好葡萄酒訓練集中質量評分7.0以上被視為好葡萄酒 import org.apa

程式碼，邏輯迴歸(logistic_regression)實現mnist分類（TensorFlow實現）

#logistic_regression by ffzhang import os os.environ['TF_CPP_MIN_LOG_LEVEL']='2' os.environ["CUDA_VISIBLE_DEVICES"]='2' import num

機器學習實戰（四）邏輯迴歸LR（Logistic Regression）

目錄 0. 前言 1. Sigmoid 函式 2. 梯度上升與梯度下降 3. 梯度下降法（Gradient descent） 4. 梯度上升法（Gradient ascent） 5. 梯度下降/上升法的數學推導

【LeetCode-演算法】75. 顏色分類（Java實現）

題目給定一個包含紅色、白色和藍色，一共 n 個元素的陣列，原地對它們進行排序，使得相同顏色的元素相鄰，並按照紅色、白色、藍色順序排列。此題中，我們使用整數 0、 1 和 2 分別表示紅色、白色和藍色。注意: 不能使用程式碼庫中的排序函式來解決這道題。示例

樸素貝葉斯演算法——實現新聞分類（Sklearn實現）

1、樸素貝葉斯實現新聞分類的步驟（1）提供文字檔案，即資料集下載（2）準備資料將資料集劃分為訓練集和測試集；使用jieba模組進行分詞，詞頻統計，停用詞過濾，文字特徵提取，將文字資料向量化（3）分析資料：使用matplotlib模組分

邏輯迴歸模型（logistic regression）

邏輯迴歸模型意義邏輯迴歸是機器學習中做分類任務常用的方法，屬於“廣義的線性模型”，即：考慮二分類任務，其輸出標記y∈{0，1},而線性迴歸模型產生的預測值 z = wx+b是實值，於是，需要將實

基於樸素貝葉斯的關於網際網路金融新聞分類（python實現）

中國網際網路金融發展迅速，2014年是中國網際網路金融起步的一年，但在短短的一年時間內，網際網路金融創業者們融資額度一再創高，雨後春筍般湧現出各類網際網路金融產品讓使用者眼花繚亂，隨著創業門檻的降低，在即將到來的2015年，網際網路金融必將在中國掀起熱潮。

SVM+HOG對影象進行分類（MATLAB實現）

網上看到關於用opencv對影象進行分類的不少，這次用MATLAB做了些嘗試，影象資料集為:，其他MATLAB版本http://blog.csdn.net/libin88211/article/details/19968205 ，點選開啟連結，http://blog.csd

樸素貝葉斯案例1：進行文件/評論分類（python實現）

LR 邏輯迴歸程式碼（梯度下降）

這幾天一直在推導邏輯迴歸的公式，就自己寫了個，發現動手寫和公式還是有點區別的。公式推導就不贅述了，反正沒有解析解，就只能梯度下降呢，不過後面會優化成隨機梯度和牛頓法來處理，畢竟批梯度下降對於大資料那就是不行的呢。程式碼如下，這裡稍微參考了下別人的程式碼，主要是關於權重更

邏輯迴歸和樸素貝葉斯演算法實現二值分類（matlab程式碼）

資料簡介：共有306組資料，每組資料有三個屬性(x1,x2,x2)，屬於0類或者1類。資料序號末尾為1的是測試集，有31組；其他的作為訓練集，有275組。 clear clc load('

ml課程：線性迴歸、邏輯迴歸入門（含程式碼實現）

以下是我的學習筆記，以及總結，如有錯誤之處請不吝賜教。本文主要介紹簡單的線性迴歸、邏輯迴歸先關推倒，以及案例程式碼。昨天做專案發現K-means都忘了，想想之前很多基礎都忘了，於是決定重新開始學一遍ml的基礎內容，順便記錄一下，也算是梳理自己的知識體系吧。機器學習：目前包括有監

Python實現邏輯迴歸演算法（一）

本次用Python實現邏輯迴歸演算法，邏輯迴歸是應用非常廣泛的一個分類及其學習演算法，它將資料擬合到一個logit函式中，從而完成對事件發生的概率進行預測。本次學習筆記主要參考了《Python進行資料分析與挖掘實踐》和作者@寒小陽的部落格，地址如下：http://blog.c

二，機器學習演算法之邏輯迴歸（python實現）

邏輯迴歸（Logistic Regression）是目前流行最廣泛的演算法之一。 1. 何為邏輯迴歸：邏輯迴歸主要思想是根據現有的訓練集(資料)進行分類，判斷這些資料屬於哪一個類別，通

用Python開始機器學習（7：邏輯迴歸分類）

在本系列文章中提到過用Python開始機器學習（3：資料擬合與廣義線性迴歸）中提到過迴歸演算法來進行數值預測。邏輯迴歸演算法本質還是迴歸，只是其引入了邏輯函式來幫助其分類。實踐發現，邏輯迴歸在文字分類領域表現的也很優秀。現在讓我們來一探究竟。1、邏輯函式假設資料集有n個獨立的

Logistic迴歸（Python實現）

這篇文章是《機器學習實戰》（Machine Learning in Action）第五章 Logistic迴歸演算法的Python實現程式碼。 1 參考連結機器學習實戰 2 實現程式碼 from numpy import * def loadDataSet():

微信小程式——點選商品分類跳轉到該商品的商品詳情頁面（已實現）

首先，我不得不感慨下，慕課網上“7七月”老師的課真的很強大，此處放連結https://coding.imooc.com/learn/list/75.html。我只是學習到了一半就開

Spark中RDD轉換成DataFrame的兩種方式（分別用Java和scala實現）

一：準備資料來源在專案下新建一個student.txt檔案，裡面的內容為： print? <code class="language-java">1,zhangsan,20 2,lisi,21 3,wanger,1

邏輯迴歸求解（機器學習python）

梯度下降 Logistic regression 目的：分類還是迴歸？它是經典的二分類演算法！機器學習演算法選擇：先邏輯迴歸再用複雜的，能簡單還是用簡單的邏輯迴歸的決策邊界：可以是非線性的 Sigmoid 函式公式：

CNN模型和RNN模型在分類問題中的應用（Tensorflow實現）

在這篇文章中，我們將實現一個卷積神經網路和一個迴圈神經網路語句分類模型。本文提到的模型（rnn和cnn）在一系列文字分類任務（如情緒分析）中實現了良好的分類效能，並且由於模型簡單，方便實現，成為了競賽和實戰中常用的baseline。 cnn-text-classifica

葡萄酒邏輯迴歸分類（scala實現）

葡萄酒分類（scala實現）

相關推薦