1. 程式人生 > >統計思維:程序員數學之概率統計(1)

統計思維:程序員數學之概率統計(1)

隨機 解決問題 第一章 個數字 檢驗 對象 特點 總結 clas

第一章:

經驗之談:

觀察的數量太少、選擇偏差、確認偏差、不準確

更好的做法-統計方法

收集數據,使用大型全國性調查的數據

描述性統計,計算能總結數據的統計量

探索性數據分析,尋找模式、差異和其他能解決問題的而特征

假設檢驗,評判影響是否真實

估計,樣本推斷整體

術語

經驗之談  個人隨意收集的證據

直觀效應  表示發生了某種有意思的事情的度量或匯總統計量

人為    由於偏差、測量錯誤或其他錯誤導致的直觀效應

隊列    一組被調查者

橫斷面研究  收集群體在特定時間點的數據的研究

字段  數據庫中組成記錄的變量名稱

縱貫研究  跟蹤群體,隨著時間推移對同一組人反復采集數據的研究

過采樣  為避免樣本量過少,而增加某個子群體代表的數量

總體  要研究的一組事物,通常是一群人

原始數據  未經或只經過很少的檢查 計算或解讀而采集和重編碼的值

重編碼  通過對原始數據進行計算或者其他邏輯處理得到的值

記錄  數據庫中關於一個人或其他對象的信息的集合

代表性  如果人群中的每個成員都有同等的機會進入樣本,那麽這個樣本就具有代表性

被調查者  參與調查的人

樣本  總體的一個子集,用於收集數據

統計顯著  若一個直觀效應不太可能是由隨機因素引起的,就i是統計顯著的

匯總統計量  通過計算將一個數據集歸結到一個數字,而這個數字能表示數據的某些特點

表   數據庫中若幹記錄的集合

統計思維:程序員數學之概率統計(1)