1. 程式人生 > >Scala 系列(二)—— 基本資料型別和運算子

Scala 系列(二)—— 基本資料型別和運算子

一、資料型別

1.1 型別支援

Scala 擁有下表所示的資料型別,其中 Byte、Short、Int、Long 和 Char 型別統稱為整數型別,整數型別加上 Float 和 Double 統稱為數值型別。Scala 數值型別的取值範圍和 Java 對應型別的取值範圍相同。

資料型別 描述
Byte 8 位有符號補碼整數。數值區間為 -128 到 127
Short 16 位有符號補碼整數。數值區間為 -32768 到 32767
Int 32 位有符號補碼整數。數值區間為 -2147483648 到 2147483647
Long 64 位有符號補碼整數。數值區間為 -9223372036854775808 到 9223372036854775807
Float 32 位, IEEE 754 標準的單精度浮點數
Double 64 位 IEEE 754 標準的雙精度浮點數
Char 16 位無符號 Unicode 字元, 區間值為 U+0000 到 U+FFFF
String 字元序列
Boolean true 或 false
Unit 表示無值,等同於 Java 中的 void。用作不返回任何結果的方法的結果型別。Unit 只有一個例項值,寫成 ()。
Null null 或空引用
Nothing Nothing 型別在 Scala 的類層級的最低端;它是任何其他型別的子型別。
Any Any 是所有其他類的超類
AnyRef AnyRef 類是 Scala 裡所有引用類 (reference class) 的基類

1.2 定義變數

Scala 的變數分為兩種,val 和 var,其區別如下:

  • val : 類似於 Java 中的 final 變數,一旦初始化就不能被重新賦值;
  • var :類似於 Java 中的非 final 變數,在整個宣告週期內 var 可以被重新賦值;
scala> val a=1
a: Int = 1

scala> a=2
<console>:8: error: reassignment to val // 不允許重新賦值

scala> var b=1
b: Int = 1

scala> b=2
b: Int = 2

1.3 型別推斷

在上面的演示中,並沒有宣告 a 是 Int 型別,但是程式還是把 a 當做 Int 型別,這就是 Scala 的型別推斷。在大多數情況下,你都無需指明變數的型別,程式會自動進行推斷。如果你想顯式的宣告型別,可以在變數後面指定,如下:

scala>  val c:String="hello scala"
c: String = hello scala

1.4 Scala直譯器

在 scala 命令列中,如果沒有對輸入的值指定賦值的變數,則輸入的值預設會賦值給 resX(其中 X 是一個從 0 開始遞增的整數),res 是 result 的縮寫,這個變數可以在後面的語句中進行引用。

scala> 5
res0: Int = 5

scala> res0*6
res1: Int = 30

scala> println(res1)
30

二、字面量

Scala 和 Java 字面量在使用上很多相似,比如都使用 F 或 f 表示浮點型,都使用 L 或 l 表示 Long 型別。下文主要介紹兩者差異部分。

scala> 1.2
res0: Double = 1.2

scala> 1.2f
res1: Float = 1.2

scala> 1.4F
res2: Float = 1.4

scala> 1
res3: Int = 1

scala> 1l
res4: Long = 1

scala> 1L
res5: Long = 1

2.1 整數字面量

Scala 支援 10 進位制和 16 進位制,但不支援八進位制字面量和以 0 開頭的整數字面量。

scala> 012
<console>:1: error: Decimal integer literals may not have a leading zero. (Octal syntax is obsolete.)

2.2 字串字面量

1. 字元字面量

字元字面量由一對單引號和中間的任意 Unicode 字元組成。你可以顯式的給出原字元、也可以使用字元的 Unicode 碼來表示,還可以包含特殊的轉義字元。

scala> '\u0041'
res0: Char = A

scala> 'a'
res1: Char = a

scala> '\n'
res2: Char =

2. 字串字面量

字串字面量由雙引號包起來的字元組成。

scala> "hello world"
res3: String = hello world

3.原生字串

Scala 提供了 """ ... """ 語法,通過三個雙引號來表示原生字串和多行字串,使用該種方式,原生字串中的特殊字元不會被轉義。

scala> "hello \tool"
res4: String = hello    ool

scala> """hello \tool"""
res5: String = hello \tool

scala> """hello
     | world"""
res6: String =
hello
world

2.3 符號字面量

符號字面量寫法為: '識別符號 ,這裡 識別符號可以是任何字母或數字的組合。符號字面量會被對映成 scala.Symbol 的例項,如:符號字面量 'x 會被編譯器翻譯為 scala.Symbol("x")。符號字面量可選方法很少,只能通過 .name 獲取其名稱。

注意:具有相同 name 的符號字面量一定指向同一個 Symbol 物件,不同 name 的符號字面量一定指向不同的 Symbol 物件。

scala> val sym = 'ID008
sym: Symbol = 'ID008

scala> sym.name
res12: String = ID008

2.4 插值表示式

Scala 支援插值表示式。

scala> val name="xiaoming"
name: String = xiaoming

scala> println(s"My name is $name,I'm ${2*9}.")
My name is xiaoming,I'm 18.

三、運算子

Scala 和其他語言一樣,支援大多數的操作運算子:

  • 算術運算子(+,-,*,/,%)
  • 關係運算符(==,!=,>,<,>=,<=)
  • 邏輯運算子 (&&,||,!,&,|)
  • 位運算子 (~,&,|,^,<<,>>,>>>)
  • 賦值運算子 (=,+=,-=,*=,/=,%=,<<=,>>=,&=,^=,|=)

以上操作符的基本使用與 Java 類似,下文主要介紹差異部分和注意事項。

3.1 運算子即方法

Scala 的面向物件比 Java 更加純粹,在 Scala 中一切都是物件。所以對於 1+2,實際上是呼叫了 Int 類中名為 + 的方法,所以 1+2,也可以寫成 1.+(2)

scala> 1+2
res14: Int = 3

scala> 1.+(2)
res15: Int = 3

Int 類中包含了多個過載的 + 方法,用於分別接收不同型別的引數。

3.2 邏輯運算子

和其他語言一樣,在 Scala 中 &&|| 的執行是短路的,即如果左邊的表示式能確定整個結果,右邊的表示式就不會被執行,這滿足大多數使用場景。但是如果你需要在無論什麼情況下,都執行右邊的表示式,則可以使用 &| 代替。

3.3 賦值運算子

在 Scala 中沒有 Java 中的 ++-- 運算子,如果你想要實現類似的操作,只能使用 +=1,或者 -=1

scala> var a=1
a: Int = 1

scala> a+=1

scala> a
res8: Int = 2

scala> a-=1

scala> a
res10: Int = 1

3.4 運算子優先順序

操作符的優先順序如下:優先順序由上至下,逐級遞減。

在表格中某個字元的優先順序越高,那麼以這個字元打頭的方法就擁有更高的優先順序。如 + 的優先順序大於 <,也就意味則 + 的優先順序大於以 < 開頭的 <<,所以 2<<2+2 , 實際上等價於 2<<(2+2) :

scala> 2<<2+2
res0: Int = 32

scala> 2<<(2+2)
res1: Int = 32

3.5 物件相等性

如果想要判斷兩個物件是否相等,可以使用 ==!=,這兩個操作符可以用於所有的物件,包括 null。

scala> 1==2
res2: Boolean = false

scala> List(1,2,3)==List(1,2,3)
res3: Boolean = true

scala> 1==1.0
res4: Boolean = true

scala> List(1,2,3)==null
res5: Boolean = false

scala> null==null
res6: Boolean = true

參考資料

  1. Martin Odersky . Scala 程式設計 (第 3 版)[M] . 電子工業出版社 . 2018-1-1

更多大資料系列文章可以參見 GitHub 開源專案: 大資料入門指南