RDD基本操作之Action
Action介紹
在RDD上計算出來一個結果
把結果返回給driver program或保存在文件系統,count(),save
常用的Action
reduce()
接收一個函數,作用在RDD兩個類型相同的元素上,返回新元素。
可以實現,RDD中元素的累加,計數,和其它類型的聚集操作。
舉例:
val rdd = sc.parallelize(Array(1,2,3,3))
rdd.collect()
collect()
遍歷整個RDD,想driver program返回RDD的內容
需要單機內存能容納下(因為數據要拷貝給driver,一般是測試的時候使用)
大數據的時候,使用saveAsTextFile() action等。
take(n)
返回RDD中的n個元素(同時嘗試訪問最少的的partitions)
返回結果是無序的,一般為測試時候使用
top(n)
返回排序後的前n個,(根據RDD中的數據比較器)
RDD的特性
RDD基本操作之Action
相關推薦
RDD基本操作之Action
介紹 比較 text inf count program 圖片 訪問 器) Action介紹 在RDD上計算出來一個結果 把結果返回給driver program或保存在文件系統,count(),save 常用的Action reduce() 接收一個函數,作用在RDD
Spark程式設計指南之一:transformation和action等RDD基本操作
文章目錄 基本概念 開發環境 程式設計實戰 初始化SparkContext RDD的生成 RDD基本操作 Key-Value Pairs Transformations f
目錄基本操作之mkdir命令
用戶 信息 version 上下文 mkdirmkdir命令主要用來創建目錄。語法 mkdir (選項) (參數)選項-Z 設置安全上下文,僅開啟SElinux時有效 -m <目標屬性>或--mode<目標屬性>建立目錄的同時設置目錄的權限 -p或--pa
SQL Server 基本操作之三種增加法
一次 增刪改查 sql 數據的操作 插入 table 增長 類型 val 前言: 數據庫操作避免不了對數據的操作,操作方法大同小異,萬變不離其宗,今就寫一下各種花式操作的根本增刪改查四種操作,今天我們就來說一下增加操作的三種方法 正文: 增加操作是對數據庫進
elasticsearch基本操作之--使用QueryBuilders進行查詢
constant false cor ble conn 中一 listen terms int /** * 系統環境: vm12 下的centos 7.2 * 當前安裝版本: elasticsearch-2.4.0.tar.gz */ QueryBuilder 是es
web自動化2-selenium基本操作之元素定位
main .com blog text lin div spa wid 操作 id driver.find_elenment_by_id("kw") name driver.find_element_by_name("kw") class name diver.find
mysql基本操作之增刪改查
mysql查詢查詢所有列select * from 表名;例:select * from classes;查詢指定列可以使用as為列或表指定別名select 列1,列2,... from 表名;例:select id,name from classes;增加說明:主鍵列是自動增長,但是在全列插入時需要占位,通
紅黑樹-RBT(二、基本操作之左旋)
都是 spa 左旋 class body 節點 圖片 如果 info 一、左旋 1、當在含有n個關鍵字的紅黑樹上運行時,TREE-INSERT和TREE-DELETE操作對樹作了修改,結果可能違反(一、紅黑樹--》2、定義)中給出的紅黑樹的性質,為了保持這些性質,就要改
linux基本操作之yum程序包管理器
yum在Centos系統中,程序包管理器的核心是rpm: 其後端所使用rpm命令行工具; 前段使用yum命令行工具或dnf命令行工具;程序包管理的前段工具: RHEL/Centos系列發行版linux中,yum和dnf; yum命令行工具: Yellow
linux基本操作之rpm程序包管理器
rpm在linux中的應用程序結構形式分為三種: 1)源代碼形式 2)二進制形式 3)程序包形式其中源代碼是最權威的,二進制形式經過了一系列的編譯、匯編、連接等等其他操作得到可以執行的程序及其他相關的文件,而程序包形式則是二進制形式進一步進行操作,使之可以自動安裝程序包中的所有文件,當然在卸
mongodb的基本操作之數據刪除
table rop test 數據 error: 不同的 mon error tables 刪除操作使用remove進行,數據的刪除與查詢類似,接受一個參數,與查詢不同的是,為了防止誤操作,刪除操作不允許不傳參數 比如 db.test_collection
Python基本操作之文件操作
enc 開頭 基本操作 常用 odin 文件 see tel 文件名 一、 1.文件操作的函數 open("文件名字(路徑)",mode="模式",encoding="字符集") 2.模式:r,w,a,r+,w+,a+,rb,wb,ab,r+b,w+b,a+
Flask中之數據庫框架和模型類四:再述SQLAlchemy配置和基本操作之增刪改查
模糊 offset odi com app ack 字符 add () from flask import Flask from flask_sqlalchemy import SQLAlchemy app = Flask(__name__) #設置連接數據庫的URL
File類的基本操作之InputStream位元組輸入流
話不多少。我直接把程式碼貼上來了。有什麼問題請給我留言 package org.mark.streamRW; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; /
RDDs基本操作之Transformations
逐元素Transformation map() map()接收函式,把函式應用到RDD的每個元素,返回新的RDD 舉例: val lines = sc.parallelize(Array("hello", "spark", "hello", "world") val lines2 = lines.map
redis基本操作之hmset/hmget
import redis.clients.jedis.Jedis; import java.util.HashMap; import java.util.List; import java.util.Map; public class RedisUtil { private static J
二、MongoDB的基本操作之索引
(一)建立索引 1、查詢集合中所有索引 db.imooc_collection.getIndexes() 2、建立索引 db.imooc_collection.ensureIndex({x:1}), (1)ensureIndex建立索引,引數是json文件 (2)key的值不再代
MongoDB基本操作之(mongodb的簡單封裝)
具體的程式碼實現如下: /********************************************* * CLR 版本: 4.0.30319.42000 * 類 名 稱: MongoHelper * 機器名稱:
Pandas DataFrame 的基本操作之重新索引
1.reindex:可以對行和列索引,預設對行索引,加上關鍵字columns對列索引。 import pandas as pd data=[[1,1,1,1],[2,2,2,2],[3,3,3,3],[4,4,4,4]] df = pd.DataFrame(data,ind
python檔案的基本操作之控制檔案指標
f.tell #每次統計都是從檔案頭到當前指標所在位置####只要在t 模式在是read(n)n代表字元個數,除此之外的檔案指標都是以bytes為單位 # f=open('c.txt',mode='rt',encoding='utf-') # print(f.read(3)) # f