Scala函數語言程式設計(四)函式式的資料結構 下
前情提要
Scala函數語言程式設計指南(一) 函式式思想介紹
scala函數語言程式設計(二) scala基礎語法介紹
Scala函數語言程式設計(三) scala集合和函式
Scala函數語言程式設計(四)函式式的資料結構 上
1.List程式碼解析
今天介紹的內容,主要是對上一篇介紹的scala函式式資料結構補充,主要講程式碼。可以先看看上一節,主要講的是函式式的list,Scala函數語言程式設計(四)函式式的資料結構 上。這些程式碼我都放在我的公眾號裡面,包括函式式的List以及一個函式式的二叉搜尋樹,關注公眾號:哈爾的資料城堡,回覆“scala樹資料結構”就能直接獲得(寫文章不容易,大哥大姐關注下吧 :) )。
話說回來,上一篇中,主要介紹了List的一些基礎用法,包括定義基礎的結構,節點Cons和結尾的Nil。以及使用一個object List來定義基礎的List操作。
//定義List為特質,Nil和Cons為結尾和中間的Node sealed trait List[+A] case object Nil extends List[Nothing] case class Cons[+A](head: A, tail: List[A]) extends List[A] { override def toString: String = s"$head :: ${tail.toString}" } //Listc操作的定義方法,object相當於java中的靜態類,裡面的方法可以直接呼叫 object List { def sum(ints: List[Int]): Int = ints match { case Nil => 0 case Cons(x,xs) => x + sum(xs) } def map[A,B](l: List[A],f: A => B): List[B] =l match { case Nil => Nil case Cons(head, tail) =>Cons(f(head), map(tail,f)) } def apply[A](a: A*): List[A] = if (a.isEmpty) Nil else Cons(a.head, apply(a.tail: _*)) def empty[A]: List[A] = Nil object ops { //定義隱式轉換,這個是為了擴充List的操作而準備的,可以看看最下面是如果使用的 implicit def listOps[A](list: List[A]): ListOps[A] = new ListOps(list) } }
關於節點Cons和Nil的定義和上一節一樣,只是Cons多了個重寫的toString方法。
簡單再說下,這裡呢,在object List裡面,在裡面我們定義了apply方法,可以初始化生成一個List。以及上一節提到的sum和map方法。如果對這些看不明白可以看看上一節的內容。
但這樣的話當我們要呼叫sum方法的時候,只能通過object List來呼叫,類似下面這樣:
//使用object List裡面的apply方法初始化,生成List scala> val numList = List(1,2,3,4) numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil //使用object List裡面的sum方法 scala> List.sum(numList) res0: Int = 10
但是呢,我們日常使用的時候可不是這樣呀,我們更熟悉的應該是要這樣:
//使用object List裡面的apply方法初始化,生成List
scala> val numList = List(1,2,3,4)
numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil
//直接使用numList內建的方法來處理
scala> numList.sum()
res0: Int = 10
更加通用的做法,應該是通過List本身,來呼叫方法,就像上面看到的那樣。通常的做法,是直接加在Cons裡面,但由於Cons是繼承自trait List[+A],所以大家(包括)Nil裡面都需要定義那一堆方法了,有沒有別的辦法呢?
有的,scala的又一個語法糖,隱式轉換,就是上面object List裡面的ops。
object ops {
//定義隱式轉換,這個是為了擴充List的操作而準備的,可以看看最下面是如果使用的
implicit def listOps[A](list: List[A]): ListOps[A] = new ListOps(list)
}
隱式轉換主要是通過implicit這個關鍵字定義的,當然隱式轉換還有其他用法,不管這裡的用法算是最常見的用法了。
隱式轉換函式,看的主要是引數,以及返回,函式名字(這裡名字是listOps)是不重要的,起什麼都沒關係。
隱式轉換的作用這裡不多解釋,可以百度看看,簡單說就是在需要的時候,將一個型別轉換成另一種型別。這裡的作用,是在特定的情況下將我們定義的List轉成ListOps型別,而ListOps類,則在下面給出。
//擴充List的操作
private[list] final class ListOps[A](list: List[A]) {
//匯入隱式轉換函式,因為下面的處理也是需要隱式轉換
import List.ops._
//使用遞迴實現,foldRight的實現就是呼叫了這個函式,這麼做是為了複用
//程式碼複用是函式式中很重要的一個特性,看下面append方法就可以明白
def foldRightAsPrimary[B](z: B)(f: (A, B) => B): B = list match {
case Nil => z
case Cons(head, tail) => f(head, tail.foldRightAsPrimary(z)(f))
}
def foldRight[B](z: B)(f: (A, B) => B): B = foldRightViaFoldLeft(z)(f)
def map[B](f: A=> B): List[B] = list match {
case Nil => Nil
case Cons(head, tail) => Cons(f(head), tail.map(f))
}
}
有了這段程式碼後,當我們需要使用map的時候,就可以不用再借助object List代勞,而可以直接使用,就像這樣:
//使用object List裡面的apply方法初始化,生成List
scala> val numList = List(1,2,3,4)
numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil
//直接使用numList內建的方法來處理,而不是List.map(numList,function)
scala> numList.map(function)
當代碼檢測到List呼叫map方法,但List內部並沒有map方法,就會觸發隱式轉換,轉換成ListOps型別,呼叫ListOps型別裡面的map方法,然後返回一個List作為結果。雖然經過了諸多波折,但呼叫者是感受不到的,反而感覺就像是List裡面本身的map方法一樣。在Spark裡面就有很多這樣的操作。
如上面的程式碼,現在我們可以直接使用numList.map(function)這樣的方式,就像List裡面本身就有map函式一樣來使用了。
2.二叉搜尋樹
在上一篇末尾,給出了一份還未完成的資料結構,二叉搜尋樹當作練習。這一節就來講講這個。
其實如果把之前的List都看懂的話,其實二叉搜尋樹並沒有什麼難點。
二叉搜尋樹,是樹,自然就有葉節點和葉子節點(就是末尾)。不過這次和List不一樣的是,沒有使用隱式轉換,所以我們定義的就不是特質了,而是先定義一個抽象類。然後讓葉節點和葉子節點繼承它。
//定義一個二叉樹的抽象類
sealed abstract class TreeMap[+A] extends AbstractMap[Int, A] {
def add[B >: A](kv: (Int, B)): TreeMap[B] = ???
def deleteMin: ((Int, A), TreeMap[A]) = ???
def delete(key: Int): TreeMap[A] = ???
def get(key: Int): Option[A] = ???
def +[A1 >: A](kv: (Int, A1)): TreeMap[A1] = ???
def -(k: Int): TreeMap[A] = ???
override def toList: List[(Int, A)] = ???
def iterator: Iterator[(Int, A)] =???
}
//葉子節點,也就是每個分支的末尾,繼承了上面的抽象類
case class Leaf() extends TreeMap[Nothing]
//葉節點,包含左右和內容,繼承了上面的抽象類
case class Node[+A](key: Int, value: A,
left: TreeMap[A], right: TreeMap[A]) extends TreeMap[A]
二叉樹中有有基礎的增刪查操作,還過載了兩個符號,+和-分別代表增加和刪除。對了,這裡的???,其實和python裡面的pass是一樣的,就充當個佔位符,告訴編譯器這裡會有東西的,先別報錯。
然後主要就是要實現二叉樹裡面空缺的程式碼,其實熟悉樹結構的同學應該都知道,遞迴是樹天生的基因。所以這裡自然都是要通過遞迴實現的。不過在編寫前,還是要提一下,一般函數語言程式設計裡面,不會使用可變變數(var),也不會使用可變的資料結構(ListBuff)。
實現過程也沒什麼好解釋的,其實就是通過遞迴,以及scala的模式匹配,如果碰到葉子節點就掛掉,不是就遞迴去進行。直接看程式碼。這裡主要介紹add方法,其他的基本都是類似的:
sealed abstract class TreeMap[+A] extends AbstractMap[Int, A] {
......
//使用模式匹配,實現遞迴操作,主要是找到對應的位置,插入資料
def add[B >: A](kv: (Int, B)): TreeMap[B] = {
val (key, value) = kv
//this就是當前的型別,可能是葉節點,也可能是葉子節點
this match {
case Node(nodeKey, nodeValue, left, right) => {
//按照二叉搜尋樹的規則,進行遞迴
if(nodeKey > key)
Node(nodeKey, nodeValue, left.add((key,value)), right)
else if(nodeKey < key)
Node(nodeKey, nodeValue, left, right.add((key,value)))
else
Node(nodeKey, value, left, right)
}
//如果是葉子節點,則新生成一個葉節點,返回
case Leaf() => {
Node(key, value, Leaf(), Leaf())
}
}
......
}
根據二叉搜尋樹的規則,新鍵大於節點的鍵的時候,插入右邊,小於節點的鍵的時候,插入到左邊。然後約定好結束條件,也就是碰到葉子節點的時候返回。這樣一來就完成了插入的操作。後面無論是刪除,還是查詢,都是同樣的思路。
而過載運算子方法,比如過載+方法,就是直接呼叫上面的add方法,即直接複用。然後看看object TreeMap。
object TreeMap {
def empty[A]: TreeMap[A] = Leaf()
def apply[A](kvs: (Int, A)*): TreeMap[A] = {
kvs.toSeq.foldLeft(empty[A])(_ + _)
}
}
這個object主要作用有兩個,一個是生成葉子節點,一個是初始化一棵樹(注意是apply方法)。和List一樣,這裡也是用多引數的輸入方式,不同的是這裡沒有用遞迴,而是直接把多個引數轉化成一個序列,然後用foldLeft,逐個累加。從而實現初始化樹。
OK,到這裡就結束了,最後還是希望你能夠自己試著寫下tree的程式碼,寫完再用test case測試下,程式設計功底就是這樣一步一步打下的。
3.小結
函式式的資料結構篇到此就結束,希望在這裡,你能明白函式式的資料結構與我們最開始接觸到的資料結構的實現有哪些不同,又為何要大費周章用函式式的方式實現!!
很多scala的教程介紹到這裡就一句話,scala的預設資料結構是不可變的,如果可變的要怎樣巴拉巴拉,這樣容易讓人陷入知其然不知其所以然的地步。
同時我也一直決定,學習語言的話,語法知識最表層的東西。真正深入學習一門語言,你需要逐漸知道這門語言在設計上的取捨,甚至是設計上的哲學,比如python的至簡哲學。
而在深入這些東西的過程中,語法自然而然就掌握了,比如較為晦澀的隱式轉換。在這裡就會知道隱式轉換是這樣用的,原來spark裡面一直都有這個東西參與!!!
接下來一篇將介紹scala中的錯誤處理方式,依舊是函式式的處理方式,像java中的try{}catch{}肯定是非函式式的,那麼scala是怎麼實現的呢,下一篇就來介紹:)
如果有什麼疑問,也歡迎留言。
以