1. 程式人生 > >資料分析工程師筆試題:計算平均數的指標及其優缺點

資料分析工程師筆試題:計算平均數的指標及其優缺點

平均指標的種類有:算術平均數調和平均數幾何平均數眾數中位數。前三種平均數是根據總體所有標誌值計算的所以稱為數值平均數,後兩種平均數是根據標誌值所處的位置確定的,因此稱為位置平均數。

1、算術平均數的計算

算術平均數是計算平均指標的最常用方法,它的基本公式形式是總體標誌總量除以總體單位總量。在實際工作中,由於資料的不同,算術平均數有兩種計算形式:即簡單算術平均數加權算術平均數

簡單算術平均數:


其中:\bar{X}算術平均數,X各單位標誌值(變數值),n總體單位數(項數)。


其中:\bar{X} ----代表算術平均數,x 代表各單位標誌值(變數值),f 代表各組單位數(項數)。

  簡單算術平均數適用於未分組的統計資料,如果已知各單位標誌值和總體單位數,可採用簡單算術平均數方法計算。

  加權算術平均數適用於分組的統計資料,如果已知各組的變數值和變數值出現的次數,則可採用加權算術平均數計算。在“加權算術平均數=\sum(各組變數值×各組次數)/\sum各組次數”,公式中,各組次數具有權衡各組變數值輕重的作用,某一組的次數越大,則該組的變數值對平均數的影響就越大,反之越小。加權算術平均數的大小受兩個因素的影響,其一是受變數值大小的影響。其二是受次數分配值即各組次數佔總次數比重的影響。加權算術平均數中的權數,指的就是標誌值出現的次數或各組次數佔總次數的比重。在計算平均數時,由於出現次數多的標誌值對平均數的形成影響大些,出現次數少的標誌值對平均數的形成影響小些,因此就把次數稱為權數。在分組數列的條件下,當各組標誌值出現的次數或各組次數所佔比重均相等時,權數就失去了權衡輕重的作用,這時用加權算術平均數計算的結果與用簡單算術平均數計算的結果相同。

2、調和平均數的計算

在實際工作中,有時由於缺乏總體的單位數資料,而不能直接計算平均數,這時就可採用調和平均數計算。因此在統計工作中,調和平均數常常被作為算術平均數的變形來使用。調和平均數也有簡單調和平均數加權調和平均數兩種形式。

  例2、某月某企業按工人勞動生產率高低分組的生產班組數和產量資料如下:

按工人勞動生產率
分組(件/人)
生產班組 產量(件)
50-60
60-70
70-80
80-90
90以上
10
7
5
2
1
8250
6500
5250
2550
1520

  試計算該企業工人平均勞動生產率。

  解:列計算表如下:

按工人勞動生產率
分組(件/人)
組中值 產量(件) 人數
50-60
60-70
70-80
80-90
90以上
55
65
75
85
95
8250
6500
5250
2550
1520
150
100
70
30
16
合 計 24070 366
工人平均勞動生產率

注意本題計算中權數的選擇。資料中“生產班組”可以是次數,但並不是合適的權數。因為本題中的工人勞動生產率是按件/人計算的,和生產班組沒有直接關係,所以它不能作為權數進行平均數的計算。本題應以“產量”權數,進行加權調和平均數的計算。

  加權算術平均數與加權調和平均數是計算平均指標時常常用到的兩個指標。加權算術平均數中的權數一般情況下是資料已經分組得出分配數列的情況下標誌值的次數。而加權調和平均數的權數是直接給定的標誌總量。在經濟統計中,經常因為無法直接得到被平均標誌值的相應次數的資料而採用調和平均數形式來計算,使調和平均數的計算結果與加權算術平均數的計算結果相同,所以:


在實際應用加權算術平均數時,需注意權數的選擇。

  應用平均指標必須注意的問題有:⑴計算和應用平均指標,必須注意現象總體的同質性;⑵用組平均數補充說明總平均數;⑶計算和運用平均數時,要注意極端數值的影響,因為算術平均數受極端數值的影響很明顯。

3、眾數和中位數

  眾數和中位數是兩個位置平均數,在一定條件下用它們反映變數數列的一般水平是非常有效的。

  眾數是總體中出現次數最多的變數值。在單位數不多或一個無明顯集中趨勢的資料中,眾數的測定沒有意義。一般來講,只有根據分組數列才能確定眾數。

  中位數是將總體各單位標誌值按大小順序排列後,處於中間位置的那個數值。根據未分組資料和分組資料都可確定中位數。

4.平均指標的特點

    1、把總體各單位標誌值的差異抽象化了。
  2、平均指標是個代表值,代表總體各單位標誌值的一般水平。

5.平均指標的作用

  1、它可以反映總體各單位變數分量分佈的集中趨勢,可以用來比較同類現象在不同單位發展的一般水平。
  2、用來比較同一單位的同類指標在不同時期的發展狀況。
  3、還可以用來分析現象之間的依存關係等相對指標數值的表現形式,有名數和無名數兩種。

6.平均指標與強度相對指標的區別

    1、指標的含義不同。強度相對指標說明的是某一現象在另一現象中發展的強度、密度或普遍程度;而平均指標說明的是現象發展的一般水平。
  2、計算方法不同。強度相對指標與平均指標,雖然都是兩個有聯絡的總量指標之比,但是,強度相對指標分子與分母的聯絡,只表現為一種經濟關係,而平均指標是在一個同質總體內標誌總量和單位總量的比例關係。分子與分母的聯絡是一種內在的聯絡,即分子是分母(總體單位)所具有的標誌,對比結果是對總體各單位某一標誌值的平均。

相關推薦

資料分析工程師試題計算平均數指標及其優缺點

平均指標的種類有:算術平均數、調和平均數、幾何平均數、眾數和中位數。前三種平均數是根據總體所有標誌值計算的所以稱為數值平均數,後兩種平均數是根據標誌值所處的位置確定的,因此稱為位置平均數。 1、算術平均數的計算 算術平均數是計算平均指標的最常用方法,它的基本公式形式

java試題關於short s1=1;s1=s1+1;short s1=1;s1+=1;short s3=s1+s2;中存在的簡單資料型別轉換問題的理解

面試題的內容大概是這樣:short s1=1;s1=s1+1;這兩句程式碼有什麼問題?short s1=1;s1+=1;這兩句程式碼有什麼問題?short s1=1,s2=1;short s3=s1+s2;這兩句程式碼有什麼問題? 下面我就對這三個問題按照自己的理解以及參考做出解釋: 解釋之

No.23 經典試題用巨集來計算偏移量,判斷大小端(聯合體法,指標法)

寫一個巨集,計算結構體中某變數相對於首地址的偏移,並給出說明 判斷大小端 程式碼1: //寫一個巨集,計算結構體中某變數相對於首地址的偏移,並給出說明 //定義的這個巨集將結構體裡邊的變數的地址取出後再強轉成char型,然後進行相減。 //注意:&s

資料工程師試題集錦附指南網際網路公司篇!

大資料工程師是近幾年異常火爆的職位,市場需求旺盛,眾多網際網路公司都打出了高薪招聘的廣告,本文整理了網路上部分技術人員分享的各大網際網路公司大資料類(Hadoop、Spark等)面試題以及面試時需要注意的一些問題,希望對各位技術人員有所幫助。 阿里巴巴   阿里巴巴的面試輪次基本是三次,技術

網上搜到的一些資料分析工程師的面試題

,有哪些聚類分析方法,寫出原理和演算法。 3.SQL題,給出一個表,寫SQL語句,建立表名為B(結構和原表一樣),按列出最早訪問的url id:使用者名稱 time:使用者訪問時間 url:使用者訪問網頁 4.一個B2C網站,使用者群是辦公室女性,一個表是一週的銷售額:工作日的銷售額都是5000-5100,週

計算頁號----百度2016研發工程師試題(六)

設某計算機的邏輯地址空間和實體地址空間均為64KB,按位元組編址。某程序最多需要6頁資料儲存空間,頁的大小為1KB,  作業系統採用固定分配區域性置換策略為此程序分配4個頁框。當該程序執行到時刻260時,要訪問邏輯地址為17CAH的資料  。該邏輯地址對應的頁號是() 頁號   頁框好 裝入時間  訪問位

PHP工程師試題

extend xtend log new 筆試題 clas col 繼承 null //已經定義以下php類 class People{ static $version = "1.02beta"; private $age; public

阿裏試題求兩個子序列的最大連續子序列

代碼 else nat 順序 post string popu substr 連續 原題例如以下: 給定一個query和一個text。均由小寫字母組成。要求在text中找出以相同的順序連續出如今query中的最長連續字母序列的長度。比如。query為 "acbac",t

關於 阿裏巴巴試題 投資保險的 建議

bre pub start n) break 推斷 str catch except /** * * @author xy1131975903 * 1)應該將保險類設計為資源共享,即設計一個同步方法用於控制用戶的投資;推斷是否投資成功; * 2)應將投資者

2017頭條試題二維點集中找出右上角沒有點的點並按x坐標從小到大打印坐標

測試結果 ++ reserve using 如果 穩定 一個 lac 順序 PS:這篇是之前本來就想發的但是一直沒時間寫,加上今天做了京東的題,結果代碼名就命名為jingdong了……懶得改代碼名重新跑一遍結果了=。= 暴力法去做就是遍歷每個點,判斷它是不是“最大點”。判

Linux運維工程師試題第十三套

硬件 消息隊列 多說 提示 per 負載均衡 但是 轉發 -s 這套題的出處是http://blog.51cto.com/nolinux/1670406 ,看到了周末閑著沒事就做一做,答案都是我結合自己的工作得到的,不一定百分百準確,現在拿出來跟各位分享一番。1、請寫出

< 鳳凰大廳房卡代理>華為嵌入式工程師試題

流量 都是 全局變量 長整型 轉換 華為 原子 文件中 udp 1、什麽是預編譯,何時需要預編譯: 鳳凰大廳房卡代理(h5.hxforum.com) 聯系方式170618633533企鵝2952777280 (http://yhgj8004.com) 源碼出售 房卡出售

網易試題推箱子

左右 esp 一行 else HA 經典的遊戲 clas 不能 box 大家一定玩過“推箱子”這個經典的遊戲。具體規則就是在一個N*M的地圖上,有1個玩家、1個箱子、1個目的地以及若幹障礙,其余是空地。玩家可以往上下左右4個方向移動,但是不能移動出地

網易試題找出指定區間數列中能被3整除的個數

字符串 include namespace style 試題 AI () pan string 題目描述:給定一個數列:1,12,123,...,12345678910,1234567891011...,找出指定區間能被3整除的個數。 輸入描述:輸入兩個數字l和r,代表數列

順豐測試工程師試題參考

jdb 技術 ~~ 朋友 一個 設置 試題 參數 round   於2018年9月15日,參加了順豐的測試工程師在線筆試,感覺順豐的題比較貼心,各種方面都涉及到了,可能結果不是很滿意,但是為我以後的筆試以及學習帶來了很大的參考價值,嗚嗚嗚~~~   我為了能夠後期對考題進行

順豐測試工程師試題參考(二)

工程師 函數 調用 圖片 區別 狀態圖 png 分享 分享圖片 繼續上一篇,直接上圖(本次有3道題之前沒有了解過,並且涉及的比較復雜 ,額不想百度,就空著了(⊙o⊙)…) 11、信號傳輸模式:雙工(全雙工、半雙工),單工 12、數據庫視圖知識點考察 13、子網掩碼的計算

Java試題給定一個ReadOnlyClass的對象roc,能否把這個對象的age值改成30?

acc 資料 謝謝 ble 技術 set exce turn 宋體 在Java筆試面試中,經常會遇到代碼題,今天我們就來看一則Java代碼筆試題。 有如下代碼: Class ReadOnlyClass { private Intege

java試題找出3~999的水仙花數的三種實現方式

style col 展示 ava num get 實現 sys pack 第一種方式: package test; public class Exsercise { public static void main(String[] args) {

java試題隨機生成一個4位數字的年號,判斷是否是閏年?

技術 ring ima color 一個 sta string == pub 老規矩,直接上代碼: /** * 隨機生成一個4位數的年號,判斷概念是否為閏年並輸出相應的信息。 */ public static void LeapYear

java試題判斷一個3~100之間的所有的素數?

java筆試題 int 打印 () als 註意 分享圖片 技術 sqrt 註意兩點:① 什麽是素數?② 如何利用計算機的方法去解決問題? public static void NumberDemo(){ int x = 0; System