1. 程式人生 > >R語言︱函式使用技巧(迴圈、if族/for、switch、repeat、ifelse、stopifnot)

R語言︱函式使用技巧(迴圈、if族/for、switch、repeat、ifelse、stopifnot)

每每以為攀得眾山小,可、每每又切實來到起點,大牛們,緩緩腳步來俺筆記葩分享一下吧,please~

———————————————————————————


後續加更內容:

應用一:if族有哪些成員呢?——if/ifelse/stopifnot

應用二:如何在迴圈中,實時輸出時間消耗?


————————————————————————————————————

1、迴圈

##迴圈for
iris
allzl=unique(iris$setosa)
for (i in 1:2){
  pp=iris[iris$setosa==allzl[i],]
  plot(pp$Sepal.Length~pp$Sepal.Width)
}

for迴圈中,需要將數值組合起來,如果資料整齊可以用matrix;如果不整齊,用list,不等長合併的時候,rbind.fill函式可以很好將資料進行合併,並且補齊沒有匹配到的缺失值為NA

可參考: 

案 例

temp<-matrix(data = NA,181,31)
for (i in 1:31){
  temp[,i]<-filter(data[i]/7, rep(1, 7))
  }
yatmdata<-data.frame(temp)
程式碼利用matrix先定義一個181*31的空值矩陣,然後往裡面灌數字。

2、switch分支語句

##switch分支語句
switch(1,mean(1:10),rnorm(4))  #執行mean(1:10)
switch(2,mean(1:10),rnorm(4))  #執行rnorm(4)
#由switch(x)來選擇執行那個函式

3、while迴圈語句

注意執行順序,先執行f[i]+f[i+1]<1000,然後往下走,與下面repeat有區別

##while迴圈語句
#計算斐波那契數列
f=1
f[2]=1
i=1
while(f[i]+f[i+1]<1000){
  f[i+2]=f[i]+f[i+1]
  i=i+1
}
f
#注意執行順序,先執行f[i]+f[i+1]<1000,然後往下走,與下面repeat有區別

4、repeat迴圈

常常與if聯用。

##repeat語句
#計算斐波那契數列
f=1
f[2]=1
i=1
repeat{
  f[i+2]=f[i]+f[i+1]
  i=i+1
  if (f[i]+f[i+1]>1000) break
};f
#與if常常聯用,注意執行順序,f[i]+f[i+1]>1000,與while<1000不同

與if常常聯用,注意執行順序,f[i]+f[i+1]>1000,與while<1000不同。

5、if函式+function

if和while都是需要資料TRUE/FALSE這樣的邏輯型別變數,這就意味著,if內部,往往是對條件的判別,例如 is.na, is.matrix, is.numeric等等,或者對大小的比較,如,if(x > 0), if(x == 1), if(length(x)== 3)等等。

if後面,如果是1行,則花括號可以省略,否則就必須要將所有的語句都放在花括號中。這和迴圈是一致的

fun.test <- function(a, b, method = "add"){
    if(method == "add") { ## 如果if或者for/while;
        res <- a + b       ## 等後面的語句只有一行,則無需使用花括號。
}
    if(method == "subtract"){
        res <- a - b
    }
    return(res)           ## 返回值
}
### 檢驗結果
fun.test(a = 10, b = 8, method = "add")
fun.test(a = 10, b = 8, method = "substract")

同時if還有類似與excel的用法——ifelse

ifelse(Age > 30, "Old", "Young")

Age變數>30,則輸出old;<30,輸出Young

————————————————————————————————————————————————————————————

Function與迴圈函式結合的實踐案例

1、函式如何輸出?——print、return&list

如果是單個輸出,直接用1.3方法即可

如果有很多輸出專案,那麼需要return(終止運算,並輸出return中的專案)最終輸出的專案

R中預設的情況是將最後一句作為返回值。

1.1 return&list組合

[html] view plain copy print?在CODE上檢視程式碼片派生到我的程式碼片
  1. sbdeep=function(data,parts,xiaoz){  
  2.   parts<-parts         #分幾個箱  
  3.   xiaoz<-xiaoz         #極小值  
  4.     value<-quantile(data,probs = seq(0,1,1/parts))  #這裡以data等比分為4段,步長為1/4  
  5.   number<-mapply(function(x){  
  6.     for (i in 1:(parts-1))   
  7.     {  
  8.       if(x>=(value[i]-xiaoz)&x<value[i+1])  
  9.       {  
  10.         return(i)  
  11.       }  
  12.     }  
  13.     if(x+xiaoz>value[parts])  
  14.     {  
  15.       return(parts)  
  16.     }  
  17.     return(-1)  
  18.   },data)  
  19.   #打標籤L1L2L3L4  
  20.   return(list(degree=paste("L",number,sep=""),degreevalue=number,value=table(value),number=table(number)))               #將連續變數轉化成定序變數,此時為L1,L2,L3,L4...根據parts  
  21. }  
該函式是對單個序列資料進行等深分箱,可以返回四類:

一個基於L1L2L3....的每個指標標籤序列degree;

標籤序列值degreevalue,

每個百分位數對應的變數值value,

不同百分點的數量number。

1.2 print直接輸出

  function(){
    print(plot(cv.out)) 
  }

print可以直接輸出.

1.3 直接輸出——一一般都是直接輸出

function(){
a=c(1:50)
a
}
其中a就是直接寫在末尾,當做輸出項。

2、function中應用if switch函式

test=function(mode=c("all", "out", "in")){
  mode <- switch(mode, out = 1, `in` = 2, all = 3)
 
  if (as.numeric(mode)==1) {
    t=1
  }
 
  if (as.numeric(mode)==2) {
    t=2
  }
 
  if (as.numeric(mode)==3) {
    t=3
  }
  t=t+1
  return(t+4)
}
a=test(mode="out")

test(mode="in")

test(mode="all")
解決場景:編寫函式時候,可能巢狀很多模型的時候,就需要用這個流程。

switch函式,輸入mode,執行相應的內容,此時是mode選擇“all”,則執行返回1,;mode選擇"out"則返回2;

然後用if去進行每個數字背後的建模,注意“==”
"in"注意要引號,因為會跟內嵌函式重疊

3 異常值處理——如何報錯

  # 異常處理,當僅輸入一個數據的時候,告知不能計算標準差
   if(length(x) == 1){                          
      stop("can not compute sd for one number,
           a numeric vector required.\n")       
   }

————————————————————————————————————

應用一:if族有哪些成員呢?——if/ifelse/stopifnot

在函式中,if的應用場景非常多,用來識別某類情況前提下,再執行下一個。

其中筆者就見過這樣三類if:if-else   ifelse   stopifnot

1、if-else

這個很常見,就是需要注意一下,if-else的寫法,來看經管之家論壇一位壇友的提醒與使用心得:


      if(){}else{}  表示先執行if括號後面的條件語句,如果正確就執行第一個大括號裡的程式,如果錯誤就執行else後面大括號裡的語句。
      有一種情況,r會報錯:

if(){}
else{} 

      就是這種情況,即else語句換了一行執行時,這是r會認為if語句已經執行完畢,但執行else發現前面無法執行,因此報錯,在這裡要提醒使用r的同志們,else必須緊挨著if語句後的大括號,這時才不會出錯。

2、ifelse

      跟If-else其實是一模一樣的,但是效率提高很多,是提高程式碼運算效率很高的函式。ifelse()的句法格式類似於if()函式,但其運算速度卻有了巨大的提升。即使是在沒有預設資料結構且沒有簡化條件語句的情況下,其運算效率仍高於上述的兩種方法。

ifelse(test, yes, no)

      ifelse返回的是結果,有一點麻煩的是,不像if-else一樣,可以寫一些分佈計算的東西,譬如現在有以下一種情況:
a<-c+d
sum(a>2)  #在c大於2的情況下,要計算a大於2的個數

      這個分步情況在if-else裡面很好解決,但是在ifelse裡面可不容易,只能接受一步,所以儘量把運算鏈合併在一起。

3、stopifnot

      這個函式跟Ifelse有點像,但是很奇特。stopifnot(c>2),如果正確執行,那麼就會啥都沒發生,如果錯誤了,就會跳入Debug模式,報錯,讓函式立刻停下來。

      這個stopifnot跟trycatch函式聯合使用,威力無比。

tryCatch跳過:

[html] view plain copy print?在CODE上檢視程式碼片派生到我的程式碼片
  1. result = tryCatch(  
  2.         {expr},   
  3.         warning = function(w) {warning-handler-code},   
  4.         error = function(e) { error-handler-code},   
  5.         finally = {cleanup-code}  
  6.         )  
出現warning、error時候怎麼處理,就可以跳過了。例子:[html] view plain copy print?在CODE上檢視程式碼片派生到我的程式碼片
  1. result = tryCatch(  
  2.         {segmentCN(txt)},   
  3.         warning = function(w) {"出警告啦"},   
  4.         error = function(e) { "出錯啦"},   
  5.         )  

分詞時候,容易因為Lapply中斷之後,就不會運行了,這樣功虧一簣所以可以用這個辦法跳過。


————————————————————————————————————

應用二:如何在迴圈中,實時輸出時間消耗?

   想知道迴圈中進行到哪裡?這樣可以合理安排函式程序。那麼怎麼辦呢?

      第一辦法:使用Rstudio 1.0版本,裡面有一個Profiling with profvis,可以很好的對你函式每一步的耗時進行參看。


當然,這個不能實時輸出內容。

      第二辦法:利用difftime函式

[html] view plain copy print?在CODE上檢視程式碼片派生到我的程式碼片
  1. t1 = Sys.time()  
  2. for (i in 1:5){  
  3. a=a+1  
  4. b=a*a  
  5. print(difftime(Sys.time(), t1, units = 'sec'))  
  6. }  
      先預設當前時間,然後用difftime+print方式,迴圈輸出。

——————————————————————————————————————————————————————————————

迴圈中使用的神器。

assign函式在迴圈時候,給變數賦值,算是比較方便通過for迴圈給變數a1、a2、a3賦值

for (i in 1:3){  
    assign(paste("a", i, sep = ""), i:10)  
}  
  
ls()  
[1] "a1" "a2" "a3" "i"  
  
> a1  
 [1]  1  2  3  4  5  6  7  8  9 10  
> a2  
[1]  2  3  4  5  6  7  8  9 10  
get的用法是通過字串引用函式。
a = c(1,2)
get("a")
>>> 1,2

get和assign聯合用法

for(i in 1:3){
     assign(paste("p", i, sep=""), i)
     tmp <- get(paste("p", i, sep=""))
     print(tmp)
 }
[1] 1
[1] 2
[1] 3


每每以為攀得眾山小,可、每每又切實來到起點,大牛們,緩緩腳步來俺筆記葩分享一下吧,please~

———————————————————————————