資料探勘工具---Spark的使用方法（二）

阿新 • • 發佈：2019-01-02

Spark使用過程中報錯彙總

報錯1： “ValueError: Cannot run multiple SparkContexts at once; existing SparkContext(app=PySparkShell, master=local[*]) ”
原因：出現這個錯誤是因為之前已經啟動了SparkContext
解決方法：檢視程式碼，看是否有多次執行SparkContext例項；也可以先關閉spark（sc.stop() // 關閉spark ），然後再啟動。
報錯2： “AttributeError: ‘PipelinedRDD’ object has no attribute ‘toDF’”
原因：toDF()是執行在Sparksession（1.X版本的Spark中為SQLContext）內部的一個補丁，如果有其他函式用到toDF()，那麼需要先建立SparkSession（）。
解決方法：以IndexedRow()為例，當利用IndexedRow（）產生RDD時，需要

sc=SparkContext()
SparkSession(sc)#利用SparkSession來使sc具有處理PipelinedRDD的能力
indexedRows = sc.parallelize([IndexedRow(0, [1, 2, 3]),IndexedRow(1, [4, 5, 6]),IndexedRow(2, [7, 8, 9]),IndexedRow(3, [10, 11, 12])])

資料探勘工具---Spark的使用方法（二）

Spark使用過程中報錯彙總

【機器學習】資料探勘演算法——關聯規則（二），挖掘過程，Aprioir演算法

資料探勘 | 親和性分析（二）

資料探勘入門系列教程（二）之分類問題OneR演算法

資料探勘工具---Spark的使用方法（二）

資料探勘工具---spark使用練習---ml(二)

資料探勘工具---spark使用練習---ml(一)

資料探勘 | 親和性分析（三）

【機器學習】資料探勘演算法——關聯規則（一），相關概念，評價指標

資料探勘導論學習筆記（一）

資料探勘十大演算法（一）：決策樹演算法 python和sklearn實現

資料探勘十大演算法（九）：樸素貝葉斯 python和sklearn實現

資料探勘十大演算法（五）：EM(Expectation Maximum)演算法原理與Python實現

資料探勘十大演算法（九）：樸素貝葉斯原理、例項與Python實現

資料探勘 | 親和性分析（一）

資料探勘-目錄-特徵處理（feature）

資料探勘入門系列教程（一）之親和性分析

資料探勘入門系列教程（三）之scikit-learn框架基本使用（以K近鄰演算法為例）

資料探勘入門系列教程（四）之基於scikit-lean實現決策樹

資料探勘入門系列教程（五）之Apriori演算法Python實現

資料探勘入門系列教程（六）之資料集特徵選擇

資料探勘工具---Spark的使用方法（二）

Spark使用過程中報錯彙總

相關推薦