1. 程式人生 > >Introductory: Seeing through Statistics - Part 1

Introductory: Seeing through Statistics - Part 1

比較 tween vat ESS oba ive 隨機 調查 simple

---------------------Chapter 1. The benefits and risks of using statistics-----------------
1. Statistics的定義:
Statistics is a collection of procedures and principles for gaining and processing information in order to make decisions when faced with uncertainty.
統計指的是在不確定情況下,為作出決定而進行的獲取和處理信息的一系列流程和原則。

2. 進行研究必須註意:

  • 找到代表性樣本(representative sample): (a) 樣本(sample) (b) 總體(population)
  • 樣本量足夠大:
    樣本的大小取決於研究變量的變差(variability)大小。
  • 區分觀察性研究(observational study)與實驗(experiment):
    實驗組的樣本是隨機分配的(randomly assigned),而觀察性研究則不一定。

-----------------------------------Chapter 2. Reading the news---------------------------------


1. 關於統計研究報告合理性的七大關鍵要素:

  • 研究的來源:哪些機構支持
  • 研究者:訪問者的專業性
  • 樣本的選擇:盡量保持隨機性
  • 使用的問題或者度量(measurement):清楚界定問題的定義、用詞精確
  • 調查的時間地點方式等
  • 被比較的組中存在的不同:考慮可能影響組之間不同結果的因素並進行解釋
  • 差異度量所使用的量級/量綱:用具體數字給出答案而不是籠統的結論

-----------Chapter 3. Measurements, mistakes, and misunderstandings------------
1. 設計問題時需要註意的:

  • 蓄意偏誤(deliberate bias):問題具有導向性
  • 無意偏誤(unintentional bias):用詞不具體
  • 折中偏誤(desire to please):受訪者低報或高報結果
  • 不知情受訪者(asking the uninformed):虛報
  • 不必要的復雜化(unnecessary complexity):問題需盡量簡單
  • 問題的順序(ordering of questions)
  • 保密性和匿名(confidentiality and anonymity)

2. 開放性問題/封閉性問題:

  • 開放性問題:沒有備選答案
  • 封閉性問題:有給出備選答案

3. 相關名詞:

  • 分類變量(categorical variable) vs 數值型變量(measurement variable)
  • 連續變量(continuous variable) vs 離散變量(discrete variable)
  • 合理性(validity), 可靠性(reliability), 偏差(bias), 變差(variability):
    合理性:actually measures what is claims to measure
    可靠性:對同一樣本重復多次之後結果仍相似

---------------------------Chapter 4. How to get a good sample--------------------------
1. 樣本來源:

  • 抽樣調查
  • 實驗
  • 觀察性研究
  • 元分析(meta-analysis)
  • 案例研究(case study):對一個或少數幾個個體進行深入調查和研究

2. 相關名詞:

  • 個體(unit): 單個個體或物體
  • 總體(population): 所有可以作為調查對象的個體組成
  • 樣本(sample): 實際進行調查的個體所組成
  • 抽樣框(sampling frame): 樣本從抽樣框中抽取,一般情況下包含總體
  • 普查(census): 對總體中的所有個體都進行調查

3. 抽樣調查:

  • 抽樣調查的準確度:誤差範圍(margin of error) = $1/\sqrt{n}$
  • 優點:快速、經濟、準確

4. 簡單隨機抽樣(simple random sampling):

  • 屬於概率抽樣(probability sampling)的一種,總體中每個個體被抽中的概率是相等的
    要素1:包含總體所有個體的抽樣框
    要素2:隨機數

5. 其他抽樣方法:

  • 分層隨機抽樣(stratified random sampling): 先將總體中的個體進行分層,然後對每一層執行簡單隨機抽樣
  • 整群抽樣(cluster sampling): 將總體中的個體劃分為群,隨機抽取一個群,對該群中的所有個體進行調查
  • 系統抽樣(systematic sampling): 隨機選定起始點,等間隔抽取樣本
  • 隨機數字撥號(random digit dialing)
  • 多階抽樣(multistage sampling): 多種抽樣方法的結合

6. 分層抽樣適用於以下情況:

  • 可以得到每層的估計;
  • 若每一層中的變量相比於總體的變量有更強的一致性,那麽分層抽樣得到的結果會更準確;
  • 若層與層之間是按地理位置劃分的,那麽分層抽樣的經濟性更高;

7. 抽樣可能遇到的問題:

  • 使用錯誤的抽樣框
  • 找不到選中的個體
  • 無回答或者是誌願回答(volunteer response)

--------------------Chapter 5. Experiments and observational study----------------------
1. 相關名詞:

  • 解釋變量(explanatory variable), 響應變量(response variable), 處理(treatment)
  • 實驗 vs 觀察性研究
  • 混雜變量(confounding variable): 該變量對響應變量的效應不能從解釋變量的效應中分離出來
    例:在孕期抽煙的女性生育的孩子的IQ一般比不抽煙的女性的孩子的IQ低,可能是因為抽煙的婦女同時營養不足,這一情況下,在研究抽煙對IQ的影響時,營養可能成為一個混雜變量
  • 變量間的交互效應(interactions between variables): 某個解釋變量對響應變量的效應依賴於另一個解釋變量

2. 實驗設計:

  • 隨機化:處理的順序的隨機化、處理的類型的隨機化
  • 控制組(control group)、無效對照組(placebo)

Introductory: Seeing through Statistics - Part 1