1. 程式人生 > >科學研究設計三:抽樣

科學研究設計三:抽樣

說明

這是Bangor University 2007年School of Sport Health & Exercise Sciences的教學講義,大家可以在這裡檢視原課程的講義

課程目錄

為什麼要看這個?

這個在我看來,適合大學生或者剛入學的研究生學習,主要為了提高科學素養、培養科學研究的思維以及一些研究設計中要考慮的很多細節問題。雖然裡面沒有很多高超的方法,而且課程也是十年前的,但是裡面對於科學的理解以及思考問題的思維方式確實值得剛進入科研這條不歸路的人學習。

格式說明

  1. 標題格式都按照markdown排版的,但是標題之間的關係可能沒有排好,主要是參考了原課程網站的標題設計
  2. 書中一些專有名詞或者大牛們說的話都沒有翻譯,以防止因為我的問題導致誤解
  3. 名人名言和我自己的理解都是用引言格式標註的,不同的是,大牛們的話是英文,我自己的理解是中文
  4. 因為課程中有問答環節,問題我會用加粗來標識,問題的答案一般會用斜體來標識

最後一句話

因為本人英文水平有限,有些話翻譯得可能很彆扭,有能力的話建議大家去看原網址。

這裡寫圖片描述

這一課是關於抽樣的:抽樣是什麼,為什麼以及如何做,以及問題是什麼。 您應該按順序瀏覽頁面。 為了從本課中獲得最大收益,無論我提出一個問題,請花幾分鐘時間思考一下,然後再繼續。

為什麼抽樣 Why do we sample?

有時當我們收集資料時,我們只關心人們的屬性(通常是)或者實際提供資料的東西。例如,在SSHES的每個模組的最後,我們收集學生對模組的評估反饋。我們的目的是要找出你,學生對課程模組的想法。理想情況下(儘管在實踐中這很少發生),每個學生完成反饋表。然後我們拿這些資料進行一些簡單的分析來總結資料,如計算平均數和標準偏差。然後,我們感覺到這門課程的學生對這個模組的感受。當然,這些資料不能也不能告訴我們什麼是學生對其他模組的感受,或者其他學生對我們所評估的模組的看法。在這種情況下,樣本是感興趣的人群。描述樣本與描述總體相同。

然而,在大多數研究情況下,我們希望從我們的資料中學到一些比提供資料的特定個人更多的資料。例如,我們可能有興趣描述精英運動員,久坐的人,適合的人等的屬性。問題當然與參加模組的學生人口不同,這些人口往往非常龐大,不可能收集每個人的資料。因此,我們別無選擇,只能獲得感興趣的人口樣本。

這裡寫圖片描述

當人口本身太大時,我們從人口中抽取樣本,以便從其每個成員收集資料。

推理 Inference

當我們從一個人口中抽樣時,我們並不真正對樣本的性質感興趣,而是對樣本能夠告訴我們的人群的的性質。 換句話說,我們想從樣本資料中得出有關所有人群的推論。 這就是推理統計( inferential statistics)(如t-檢驗,方差分析,相關係數等)的全部內同:從中抽取樣本中告訴我們抽樣人群的差異(方差)或關係(在相關係數的情況下) 。

代表 Representativess

因此,樣本必須是其人群的代表。如果不是,那麼我們就不能對所有人群進行任何推斷,也沒有任何統計學的魔法可以使我們這樣做。例如,如果我想抽樣SHES學生的人數(因為我沒有時間或從每個學生那裡收集資料),我的樣本必須代表SHES學生團體,例如:性別平衡,年齡,學習成績,健身情況等。假設我們百分之五十的學生是男性,百分之五十是女性。如果我的樣本只包括百分之三十的女性,那麼它將是有偏見的,不具代表性。同樣,如果我想對整個班戈大學的學生團體進行推斷,那麼對SHES學生的人口進行抽樣就沒有多大用處。 SHES的學生與班戈大學的學生在許多方面會有所不同,比如在運動和鍛鍊方面的健身和興趣方面(我希望!)。所以SHES的學生不會成為班戈全體學生的代表。根據我的問題,這可能或可能不重要。例如,我可能會對描述班戈學生的政治背景感興趣。我不認為有什麼理由認為SHES學生比一般學生更有可能以這種或那種方式投票。因此,為此目的,SHES學生的樣本可能是班戈大學學生的代表。但如果我有興趣瞭解學生對體育鍛煉的態度,我會期望SHES學生的態度與普通學生顯著不同,所以在這種情況下他們不具有代表性。所以有代表性的樣本的另一個方面是它們應該適合他們的目的。

關於對整體人群的推論只有在樣本準確地代表了感興趣的人群的範圍內才是有效的

獲得一個有代表性的樣本 Obtaining a representative sample

確保代表性的最明顯的方法是選擇一個隨機樣本。 通過從總體中隨機選擇,應該能夠避免樣本中的任何系統偏差。 這個看起來很直截了當,但實際上卻充滿了困難,正如我希望展示的那樣。 樣本通常被描述為隨機的(特別是由學生),而事實上他們並不是那種樣子。

隨機抽樣 Random sampling

隨機抽樣有兩種方法:簡單隨機抽樣和分層隨機抽樣。 我將更詳細地描述分層隨機抽樣。 簡單的隨機抽樣就是這樣的:人口的成員是隨機抽取的,通過一些程式或其他。 隨機抽樣的兩種方法都是概率抽樣的例子。 在一個簡單的隨機樣本中,每個人都有相同的選擇機會。

在一個簡單的隨機樣本中,每個人都有相同的選擇機會

簡單的隨機抽樣真的很簡單嗎 Is simple random sampling really so simple?

現在,簡單的隨機抽樣並不像聽起來那麼簡單。考慮以下抽樣方法,這些方法通常被描述為隨機的。

從帽子裡抽取名字 Drawing names out of a hat

想要從研究方法課上的學生中獲得N = 20的隨機樣本。我把他們的名字放在一頂帽子裡,抽出20個。這是簡單的隨機抽樣嗎?

採用這種方法,取決於取樣的確切程式。 如果我把每個名字都從帽子里拉到一邊,那麼不行,這樣就不會隨機抽樣了。 假設班上有100人。 第一個名字將有1/100的選擇機會。 如果我放棄這個名字,然後再抽,第二個人只有1/99的選擇機會,第三個1/98,依此類推。 被選中的機率隨著越來越多的名字的抽出而增加。因此,每個人都沒有相同的概率被選中。 另一方面,如果我在選擇後把每個名字都放回帽子裡,帽子裡總是會有100個名字,所以每個名字都有相同的選擇機會。 這被稱為隨機抽樣與替換。 但是,如果我多次選擇同一個名字會發生什麼?

沒問題。你只要把這個名字放回帽子裡,這樣總有一百個可以選擇!

不能理解

在通知欄上徵求志願者 Putting a notice on the board asking for volunteers

這可能是學生為他們的研究專案獲取樣本的最常見方式。是隨機抽樣嗎?

這絕對不是隨機的。首先,只有SHES的人可能會看到通知,所以只能吸引特定人群的成員。這可能是好的,這取決於你想回答的問題。然而,只有那些閱讀布告牌的人才會看到這個(排除不那麼敏銳,不那麼知情的學生)。那麼,那些看到的人中,只有一小部分會真正簽約。所以樣本最終由自選的志願者組成。志願者在很大程度上與一般人群有所不同:他們可能更有動力,更關心研究的內容,更需要參與以獲得技能單位等。這並不意味著你不應該使用這種方法來為你的研究專案獲取樣本。對於大多數人來說,這是唯一可行的解決方案。但是這確實意味著你不應該把這樣的樣本描述成隨機的。這個例子說明了隨機抽樣的問題。很難想象任何情況下都可能獲得一個真正的隨機樣本,代表一般人群的參與者。無論你如何去做,最終都要由每個人選擇是否參與。畢竟,研究倫理的原則要求我們給人選擇參與研究的選擇。

在聯盟裡尋找志願者 Asking people in the Union bar

學生中另一種常見的方法。是隨機抽樣嗎?

同樣也不是!除了志願服務的問題以及不是每個人都去吧,這個方法也有潛在的實驗者偏見。即使這只是一個潛意識的決定,你也許只會問那些你認為準備同意參與的人。

阻止大街上的人 Stopping people in the High Street

有時在民意調查和市場調查中使用,路人在街上停下來,要求提供某種資料。是隨機抽樣嗎?

再一次,答案是否定的,出於與最後一個例子相同的原因。你會接近一個揮舞著血濺斧頭的旋轉眼睛的裸體瘋子,並要求他花一點時間來填寫你的問卷嗎?不太可能,是嗎?也許是一個極端的例子,但是,可能有很多原因讓你不準備在街上接近某個人。

從電話簿中隨機選擇姓名 Selecting names ‘at random’ from the phone book

那麼這個方法怎麼樣?這可以描述為隨機抽樣?代表性呢?

那麼,你可以隨意選擇名字,這不是什麼大問題。但是並不是每個人都有電話,而不是每個人都在電話簿中。所以樣本只能代表在電話簿中有姓名的人群!類似的情況是從選民登記冊中隨機選擇姓名;不是每個人都在登記冊上。無論如何,做出選擇你還是有志願者的問題。儘管如此,從實際角度來看,我們可能在這裡儘可能接近真正隨機的,有代表性的樣本。

什麼時候隨機樣本不具代表性 When random is not representative

因此,我們在這裡有一些經常被描述為隨機的抽樣方法的例子,它們要麼是不隨機的,要麼不是真正隨機的,因為每個人都有平等的參與機會。

如果不是,則不要將樣本描述為隨機樣本

另外一個問題是,即使奇蹟出現了,我們也能得到一個真正隨機的樣本,這並不意味著它將代表我們感興趣的人群。假設我們對精英運動員的心理技能感興趣。 我們獲得一個“隨機”的大學運動員樣本,並測試他們的技能。 顯然,他們不能說是一個有代表性的樣本。 所以我們不能把我們的發現推廣到給我們真正感興趣的人群。

另一個嚴重的問題是,即使我們能夠獲得一個真正的隨機抽樣,也可能不是純粹偶然的代表。 樣本可能恰好是比我們的目標人群更老,更合適,更胖或者其他任何東西。 當我們獲得小樣本時,這種情況的可能性更大(為什麼大樣本一般是首選的原因之一)。 一個方法是使用分層隨機抽樣的方法。

分層隨機抽樣 Stratified random sampling

分層隨機抽樣旨在基於感興趣人群的已知屬性,確保樣本的代表性。 例如,假設我們想隨機抽取一些患有冠心病(CHD)的人。 我們知道,冠心病的發病率因年齡而異。 瞭解冠心病的發病率隨著年齡的變化而變化,我們可以選擇我們的樣本來考慮這個因素。 為了爭辯,讓我們假設從20多歲到60多歲的每個十年中冠心病的發病率如下:

這裡寫圖片描述

因此,在冠心病患者中,5%的年齡在20-30歲之間,10%在30-40歲之間。 這些群體或總人口中的每一個都被稱為階層。 我做了這些數字,但可以想象,他們不是太遙遠。 順便提一句,請想一想,為什麼我在60+的範圍內比50-60的範圍低。

對我來說,60歲以上的冠心病患者比年輕的冠心病患者更有可能死亡。所以這個階層的人少了

有了這些資訊,我們可以構建一個準確反映CHD人群年齡平衡的樣本。對於每100位參加者,我們選擇參加研究,確保5位年齡在20-30歲之間,10位年齡在30-40歲之間,20位年齡在40-50歲之間。

採用分層隨機抽樣,不是每個總人口成員都有相同的被抽中機會,像簡單的隨機抽樣一樣。但是根據我們對每個階層人員百分比的瞭解,任何成員被選中的概率是已知的。在這個例子中,年齡在20-30之間的被選中的概率是5/100(1/20或0.05);對於30-40歲的人來說,這是10/100(1/10或者0.10)等等。如果你考慮50-60歲成員比例最高的階層,這應該是有意義的。他們中有更多的人,所以他們的選擇概率應該大於任何其他階層的成員。

不過要注意的是,由於這是分層隨機抽樣,我們還是要隨機抽取20〜30歲有冠心病,30〜40歲有此病的人群,所以我們還是要面對所有人獲得一個真正的隨機樣本的問題。但至少我們知道樣本在年齡方面不會有代表性。有一個類似的抽樣方法稱為配額抽樣(Quota sampling)。採用這種方法,我們採用完全相同的程式,但沒有從總人口的每個階層隨機抽樣。因此,我們可以通過我們掌握的任何方式從每個階層獲得一個參與者的名額。配額抽樣是非概率抽樣的一個例子。

非概率抽樣 Non-probability sampling

現在很明顯的是,除非總人口是固定的或有限的,而且不是太大(如SHES學生的人口),以便選定任何成員的概率是可知的,否則真正的隨機抽樣是不可行的。 當我們抽樣不知道任何成員被選中的概率時,我們正在進行非概率抽樣。 實際上,這是最常用的抽樣型別。 非概率抽樣有三種方法:我們已經遇到的配額抽樣,任意抽樣(convenience sampling)和有目的抽樣(purposive sampling)。

任意抽樣就是這樣的:我們只要把握恰到好處的人就可以了。到目前為止,在人類和行為科學研究中最常用的取樣方法是使用本科生的任意抽樣。像豚鼠一樣,它們相當容易獲得,發生的數量相對較多,並且不要過多地抱怨參與,只要保持良好的餵養。與豚鼠不同,他們也可以通過提供某種形式的課程學分而受到誘惑。

目的抽樣涉及針對一個特定的群體,因為它是我們感興趣的群體。例如,如果我們對精英運動員感興趣,那麼我們針對精英運動員。所以在這種情況下,參與者必須符合一些預先確定的標準。

減員率和迴應率 Attrition and response rates

消耗,有時被稱為主體死亡(subject mortality),意味著退出(而不是參與者死亡)。消耗可能導致縱向研究中的問題,在這些研究中數次從同一樣本收集資料。問題是,你可以從一個(相對)隨機的樣本開始,但如果人們退出,它可能不會保持隨機。例如,假設你正在研究健美操班參與者的態度和動機因素。你招募一個“隨機”樣本100,衡量他們的態度和動機,然後為他們跑健美操課程十二個星期,然後再採取措施。一開始,由於隨機選擇,你的態度和動機有了合理的變化,一些參與者有積極的態度,有些則不如其他人更積極。在研究過程中30%退出。可能有30%的積極態度較少,動機不如那些堅持。所以最終樣本與初始樣本完全不同,不再是感興趣人群的隨機表示。

如果參與者退出,隨機抽樣可能不會隨機抽樣

類似的問題涉及迴應率。在基於問卷調查的研究中,通過某種方式(例如選舉登記)選擇一個相對隨機的樣本並將問卷打包出去是相當普遍的。通常情況下,只有少數收到包裹的人完成並退回。答覆率是返回問卷的參與者的百分比。這樣的研究受到了我們已經遇到的自我選擇和志願者問題的困擾,只有更有動機的人或有興趣的人回答問卷,他們在許多方面與不選擇參與者不同。

解決方法 Solutions?

這些抽樣問題沒有真正的解決辦法。但是,我們所能做的就是對樣本的性質嚴格誠實。首先,抽樣程式應該總是被充分詳細地描述,以便讀者能夠決定樣本代表感興趣的人群。只說“獲得隨機樣本”是不夠的。我們想知道它是如何獲得的。其次,樣本的特徵也應該詳細描述:他們的年齡,性別平衡,教育水平,職業,身體特徵或與學習問題相關的任何事情。這樣,讀者可以再次確定樣本的代表性。在縱向研究中,可以使用這些特徵的資料來比較完成研究的退出率。如果他們之間沒有明顯的差異,那麼退出可能沒有太大的影響。

隨機抽樣與隨機分組 Random sampling versus random assignment to groups

不要混淆隨機抽樣和隨機分組。在談到抽樣時,我們只是首先討論獲得一個研究參與者的池,而不是一旦你拿到了他們就做什麼。在實驗性研究中,通過抽樣感興趣的人群,您通常會將參與者分配到一個或多個組,例如實驗組,治療組和對照組。這也必須隨機完成,否則最終可能導致各組之間的系統差異。我們經常在學生招募他們的研究專案時看到的一個非常糟糕的實踐的例子是這樣的:學生正在進行一項研究,以確定運動訓練對某些生化標記的影響。參加者將在跑步機上以高強度跑步一個小時,每週三次,每週三次,或者是一個沒有受過訓練的對照組的成員。生化指標將在研究結束時進行評估,並對兩組進行比較。學生通過在招募欄上發出通知要求人們報名參加治療組或控制組招募新人。這有什麼問題?

顯然,志願參加培訓組的人比那些報名參加對照組的人可能更適合和/或更好地接受培訓。因此,測試後生物化學標誌物的任何差異可能是由於適應性在實驗研究中,隨機抽樣是不夠的。參與者也必須被隨機分配到組開始的差異而不是由於訓練所致。

在實驗研究中,隨機抽樣是不夠的。參與者也必須被隨機分到不同的組