1. 程式人生 > >視覺化學習筆記1:資料型別

視覺化學習筆記1:資料型別

資料型別彙總

定量

定量資料是可以用數字衡量的資料,例如溫度、金錢和貓咪的抓痕數。你可以將定量資料分成兩組:連續資料和離散資料。離散資料只能包含特定的值。例如,交易售出的商品數量只能是正整數,你不可能購買 2.5 個枕頭(或 2.5 只貓!)

連續資料可以是某個範圍內的任何值,例如時間、高度或金錢。

定性

定性資料是對事物進行描述的資訊,無法用數字量化,例如男性/女性和頭髮顏色。這些是分類資料,表示屬於某個類別和組。通常,你需要按照類別對資料分組並進行對比。

資料還可以是有序資料,例如排名和在問卷調查中看到的主觀量表,例如“你覺得炸玉米餅怎麼樣?”

  1. 好惡心!
  2. 不好吃
  3. 還行
  4. 好吃
  5. 很美味!

你有時候會看到有序資料被編號了(1 到 5),但是這些數字並不表示任何含義。

這些是你將看到的典型資料型別。你可能會處理圖片或文字,這些內容似乎不符合上述類別。但是大部分情況下,你可以將它們轉換為數字或類別。

以下是到目前為止的總結

  • 定量
    • 連續
      • 時間、高度、重量、金錢、利率、溫度
    • 離散
      • 出售的數量、會的語言數量、昨天收到的郵件數量
  • 定性
    • 分類
      • 性別、頭髮顏色、國家/地區、貓咪品種
    • 有序
      • 排名、調查問卷問題,例如“你對貓咪有何感受?”
        1. 討厭貓咪
        2. 不喜歡
        3. 保持中立
        4. 喜歡
        5. 非常喜歡

下面的流程圖可以幫助你明白你的資料歸為何種資料型別。