1. 程式人生 > >R語言學習筆記2——常用數學函式

R語言學習筆記2——常用數學函式

R語言學習筆記2

——常用數學函式

楊旭東(2012-3-4)

R語言的數學運算和一些簡單的函式整理如下:

向量可以進行那些常規的算術運算,不同長度的向量可以相加,這種情況下最短的向量將被迴圈使用。

> x <- 1:4

> a <- 10

> x * a

[1] 10 20 30 40

> x + a

[1] 11 12 13 14

> sum(x)        #對x中的元素求和

[1] 10

> prod(x)              #對x中的元素求連乘積

[1] 24

> prod(2:8)     #8的階乘

[1] 40320

> prod(2:4)     #4的階乘

[1] 24

> max(x)        #x中元素的最大值

[1] 4

> min(x)        #x中元素的最小值

[1] 1

> which.max(x)     #返回x中最大元素的下標

[1] 4

> which.min(x)      #返回x中最小元素的下標

[1] 1

> x <- 4:1                     #對向量x重新賦值

> x

[1] 4 3 2 1

> which.min(x)

[1] 4

> which.max(x)

[1] 1

> range(x)             #與c(min(x), max(x))作用相同

[1] 1 4

> mean(x)             #x中元素的均值

[1] 2.5

> median(x)           #x中元素的中位數

[1] 2.5

> var(x)         #x中元素的的方差(用n-1做分母)

[1] 1.666667

> x

[1] 4 3 2 1

> rev(x)         #對x中的元素取逆序

[1] 1 2 3 4

> sort(x)         #將x中的元素按升序排列;

[1] 1 2 3 4

> x

[1] 4 3 2 1

> cumsum(x)                #求累積和,返回一個向量,它的第i個元素是從x[1]到x[i]的和

[1] 4  7  9 10

> cumsum(rev(x))

[1] 1  3  6 10

> y <- 11:14

> pmin(x,y)    #返回一個向量,它的第i個元素是x[i], y[i], . . .中最小值

[1] 4 3 2 1

> x <- rev(x) #重新賦值

> pmin(x,y)

[1] 1 2 3 4

> pmax(x,y)   #返回一個向量,它的每個元素是向量x和y在相應位置的元素的最大者

[1] 11 12 13 14

> cumprod(x) #求累積(從左向右)乘積

[1] 1  2  6 24

> cummin(x)  #求累積最小值(從左向右)

[1] 1 1 1 1

> cummax(x)  #求累積最大值(從左向右)

[1] 1 2 3 4

> match(x, y)  #返回一個和x的長度相同的向量,表示x中與y中元素相同的元素在y中的位置(沒有則返回NA)

[1] NA NA NA NA

> y[c(2,4)] <- c(2,4)

> y

[1] 11 2 13  4

> match(x, y)

[1] NA 2   NA  4

na.omit(x)函式忽略有缺失值(NA)的觀察資料(如果x是矩陣或資料框則忽略相應的行)

> na.omit(match(x,y))

[1] 2 4

attr(,"na.action")

[1] 1 3

attr(,"class")

[1] "omit"

> na.fail(match(x,y)) #na.fail(x) 如果x包含至少一個NA則返回一個錯誤訊息

錯誤於na.fail.default(match(x,y)) : 物件裡有遺漏值

which()函式返回一個包含x符合條件(當比較運算結果為真(TRUE)的下標的向量,在這個結果向量中數值i說明x[i] == a(這個函式的引數必須是邏輯型變數)

> which( x == 2)

[1] 2

> which( x <= 2)

[1] 1 2

求組合數

> choose(4,2)

[1] 6

> choose(3,1)

[1] 3

> choose(-3,1)

[1] -3

> choose(-4,2)

[1] 10

> y <- c(1:4, rep(4,1))

> y

[1] 1 2 3 4 4

> unique(y)    #如果y是一個向量或者資料框,則返回一個類似的物件但是去掉所有重複的元素(對於重複的元素只取一個)

[1] 1 2 3 4

> table(y)              #返回一個表格,給出y中重複元素的個數列表(尤其對於整數型或者因子型變數)

y

1 2 3 4

1 1 1 2

> subset(x, x>2) #返回x中的一個滿足特定條件...的子集

[1] 3 4

> sample(x, 2) #從x中無放回抽取size個樣本,選項replace= TRUE表示有放回的抽樣

[1] 1 2

> sample(x, 2, replace = TRUE) #有放回的抽樣

[1] 2 3

R中用來處理資料的函式太多了而不能全部列在這裡。讀者可以找到所有的基本數學函式(log, exp, log10, log2, sin, cos, tan, asin, acos, atan, abs, sqrt,. . . ), 專業函式(gamma,digamma, beta, besselI, . . . ),同樣包括各種統計學中有用的函式。