1. 程式人生 > >11.6 hdfs讀取json資料,轉成DataFrame儲存到hdfs

11.6 hdfs讀取json資料,轉成DataFrame儲存到hdfs

讀取json或者parquet檔案建立一個DataFrame

DataFrame儲存到某一個路徑下,預設儲存格式是parquet

SaveMode.Overwrite:重寫

SparkConf conf = new SparkConf()

.setAppName("SaveModeTest")

.setMaster("local");

JavaSparkContext sc = new JavaSparkContext(conf);

SQLContext sqlContext = new SQLContext(sc);

//去hdfs讀取檔案,返回DataFrame格式

DataFrame peopleDF = sqlContext.read().json("hdfs://hadoop1:9000/input/people.json");

//儲存儲存到hdfs上,以parquet格式

peopleDF.write().mode(SaveMode.Overwrite).save("hdfs://hadoop1:9000/output/namesAndFavColors_scala");

//驗證是否parquet,就是以該格式讀取顯示

sqlContext.read().format("parquet").load("hdfs://hadoop1:9000/output/namesAndFavColors_scala").show();

// sqlContext.read().parquet("hdfs://hadoop1:9000/output/namesAndFavColors_scala").show();

相關推薦

11.6 hdfs讀取json資料DataFrame儲存hdfs

讀取json或者parquet檔案建立一個DataFrame DataFrame儲存到某一個路徑下,預設儲存格式是parquet SaveMode.Overwrite:重寫 SparkConf conf = new SparkConf() .setAppName("S

python+django讀取json資料同步資料庫

讀取txt檔案中的json #!/usr/bin/python #coding=utf-8 from django.core.management import setup_environ #import sys #sys.path.append('..') from

python讀取json文件excel

dex with index odi 讀取 while cell with open __main__ python處理excel有xlwt,openpyxl等,而xlwt只支持excel2003,也就是最多有256列,而openpyxl則支持excel2007以上,最多6

spark1.6.1讀取csv檔案轉為為DataFrame和使用SQL

一、讀取csv spark2.0才開始原始碼支援CSV,所以1.6版本需要藉助第三方包來實現讀取CSV檔案,有好幾種方法, 1.如果有maven的,到https://spark-packages.org/package/databricks/spark-csv下載對應scala版本的第三方j

springboot2接收前端傳的base64格式圖片資料圖片

參考:https://blog.csdn.net/zmx729618/article/details/78038764 @PostMapping("/base64Upload") public AppResult<String> uploadImage(String base64Data

unity使用SimpleJSON讀取json資料存程VO存入list內

</pre>這幾天做專案用到了這方面的東西,技術說讓把json資料做成vo存入list裡,所以就研究了研究。<p></p><p>首先寫一個簡單的Json格式的文件</p><p><pre name

服務端返回json資料前端通過判斷json資料值做跳頁面

<scriptsrc="http://cdn.static.runoob.com/libs/jquery/1.10.2/jquery.min.js"> </script> <script>$(document).ready(functio

JSON解析類庫之Fastjson(1) --- Fastjson類庫學習, 生成與解析json資料json字串與Java物件互

JSON解析類庫之Fastjson(1) --- Fastjson基礎知識、簡單JavaBean與複雜Bean物件與JSON互轉 -- Fastjson類庫學習, 生成與解析json資料,json

sqlalchemy 關聯資料的新增和查詢json

類定義: from sqlalchemy.ext.declarative import declarative_base from sqlalchemy.orm import relationship from sqlalchemy import Meta

python讀取json檔案並將資料插入到mongodb

#coding=utf-8 import sunburnt import urllib from pymongo import Connection from bson.objectid import ObjectId import logging from dateti

從控制層返回到js的json資料帶“\”譯符怎麼去掉

場景:寫了一個ajax,呼叫url後,從控制層返回的資料是json格式。 ajax的內容是,裡面註釋有說明: $.ajax({ url : '${base}/commonDialog/applyCis5ZZCAntiReport?appNo=${(appNo)!

關於python讀取 json文件 dict錯誤問題

encoding lin dict java python 發現 ava inux 支持 晚上到家10點老大突然說有東西解決不了 說python 讀取java生成的json文件字符編碼 出問題 爬起來開電腦 弄了好久 試過了 with open rb encoding=ut

讀取資料庫資料以報表的形式顯示在前臺網頁(asp.net+echarts+ajax+資料庫)

1、首先在VS2010裡新建專案ASP.NET Web應用程式:WebApplication1; 在應用程式裡新建專案:WebForm.aspx(Web窗體),Model.cs(類),Controller.cs(類),Handler.ashx(一般處理程式),WebForm.js(JScript

SQL與eclipse的連線從資料庫讀取資料將二維陣列資料匯入表

示例: import java.util.List; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; impor

json資料解析文字方法

需要用到LitJSON.dll JsonMapper using LitJson; using System; public class Person { // C# 3.0 auto-implemented properties public string Na

前臺傳過來的json資料解析request

/** * 解析前臺獲得的互動資料 * @param request * @return * @throws IOException */ public static JSONObject getJsonObject(HttpServletRequest re

C++學習筆記-利用rapidJSON讀取JSON資料

JSON檔案如下: { "errorCode":0, "reason":"OK", "result": {"userId":10086,"name":"中國移動"}, "numbers":[110,120,119,911] } 目錄結構如下:

python讀取sqlserver資料儲存到csv中

# -*- coding: utf-8 -*- """ @use:查詢17.11-18.1,18.6-18.8的PM2.5資料,匯出到csv """ import pymssql import xlwt import datetime from xml.dom.minidom import

vue 處理後臺請求json資料並渲染

後臺傳給前臺的json資料格式,這裡原本只是傳list資料給後臺,因為需要分頁,所以用pageInfo包了一下,成了json格式: { "data": { "endRow": 1, "firstPage": 1, "hasNextPage": false,

php後臺查詢出資料返回json資料前臺接收並輸出

stu表: index.html <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <script src="http://www.jq22.com/jquery/jquery