1. 程式人生 > >深入淺出-統計學(1)

深入淺出-統計學(1)

最近開始學習《深入淺出-統計學》,在此記錄一下學習筆記。 第一章:資訊圖形化 術語: 1.頻數:表示在一個特定組,或者說在一個特定區間內的統計物件的數目,類似於數數 2.類別資料(定性資料)、數值型資料(定量資料) 3.累積頻數:累加到某個數值為止的總頻數,基本上是所有頻數的累積總和。 要點:
  • 頻數是一種統計方法,用於描述一個類別中有多少個項。
  • 餅圖能很好的體現基本比例。
  • 條形圖更靈活、更精確。
  • 數值型資料涉及的是數字和數量;類別資料涉及的是表述和質量。
  • 水平條形圖用於展現類別資料,尤其是在類別名稱太長的時候。
  • 垂直條形圖用於展現數值型資料;若類別名稱不長,也用於體現類別資料。
  • 可以一張條形圖上體現多批資料,具體做法由你選擇。可以使用堆積條形圖,讓相互關聯的長方形並列顯示,藉此比較頻數;可以使用分段條形圖,把長方形一個個銜接起來,藉此顯示比例和總頻數。
  • 條形圖示度可以是百分數,也可以是頻數。
  • 每張圖都變化多端。
  • 直方圖是一種專門體現分組資料的圖形。
  • 直方圖的特點是:長方形的面積表示頻數,長方形的高度稱為頻數密度。頻數密度=頻數/組距
  • 繪製直方圖時,每個長方形的寬度與其分組寬度(“組距”)成正比例,長方形按照連續的數字標度繪製。
  • 通過累積頻數,可基於累積頻數找到每組資料的上限。
  • 需要體現趨勢時請使用折線圖,例如基於時間的趨勢圖。因此,可以用折線圖進行基本的預測,只要延長趨勢線即可進行預測,但要儘量保持基本形狀。
  • 可用折線圖顯示多批資料。每批資料各用一條線表示,請確保能清晰的識別每條線。
  • 不要使用折線圖顯示類別資料,除非要顯示每一個類別的趨勢,例如基於時間的趨勢。