1. 程式人生 > >R語言排序函式sort(),rank(),order()

R語言排序函式sort(),rank(),order()

在R中,和排序相關的函式主要有三個:sort(),rank(),order()。
sort(x)是對向量x進行排序,返回值排序後的數值向量。rank()是求秩的函式,它的返回值是這個向量中對應元素的“排名”。而order()的返回值是對應“排名”的元素所在向量中的位置。
下面以一小段R程式碼來舉例說明:

> x<-c(97,93,85,74,32,100,99,67)
> sort(x)
[1]  32  67  74  85  93  97  99 100
> order(x)
[1] 5 8 4 3 2 1 7 6
> rank(x)
[1]
6 5 4 3 1 8 7 2

假設x為一組學生完成某項測試所花費的時間(所用時間越短,排名越靠前),rank()的返回值是這組學生所對應的排名,而order()的返回值是各個排名的學生成績所在向量中的位置。
前一段同學問我一個問題,如何返回一個數值向量中滿足某條件的元素在向量中的位置?舉例來說,x<-c(97,93,85,74,32,100,99,67),希望返回x中滿足值大於50且小於90的元素在向量x中的下標。當時想了想,沒覺得有什麼好的方法,使用了比較繁瑣的語句
sort(x,index.return=TRUE)[[2]][sort(x,index.return=TRUE)[[1]]<90&sort(x,index.return=TRUE)[[1]]>50],
後來發現sort(x,index.return=TRUE)[[2]]和order(x)的返回值是一樣的,而sort(x,index.return=TRUE)[[1]]和sort(x)的返回值是相同的,因此語句可以簡化為order(x)[sort(x)>50&sort(x)<90]。下面是相關的R程式碼:

> x
[1]  97  93  85  74  32 100  99  67
> sort(x,index.return=TRUE)[[2]][sort(x,index.return=TRUE)[[1]]<90&sort(x,index.return=TRUE)[[1]]>50]
[1] 8 4 3
> order(x)[sort(x)>50&sort(x)<90]
[1] 8 4 3
> sort(x,index.return=TRUE)
$x
[1]  32  67  74  85  93  97  99 100

$ix
[1] 5 8
4 3 2 1 7 6 > order(x) [1] 5 8 4 3 2 1 7 6