1. 程式人生 > >MDX示例:求解中位數、四分位數(median、quartile)

MDX示例:求解中位數、四分位數(median、quartile)

一個人力資源諮詢集團通過網路爬蟲採集手段將多個知名招聘網站上釋出的求職和招聘等資訊準實時採集到自己的庫裡,形成一個數據量浩大的招聘資訊庫,跟蹤全國招聘和求職的行業、工種、職位、待遇等資訊,並通過商業智慧系統,開展職業職位供求及趨勢等相關統計分析。這家公司竟然用SSAS OLAP Cube多維資料集容納如此數量級的資料,廣告維成員包含了每一個廣告條目。該商業智慧團隊的開發人員諮詢如何用MDX求解薪水中位數、四分位數(Median,Quartile)等。

以下是對Median、Q1、Q3等問題的MDX解答:

1、MDX中位數(Median)求解

中位數(median)是對長度為n的系列資料,根據資料大小排列得到的位於[(n+1)/2]位置上的資料。當變數值的項數N為奇數時,處於中間位置的變數值即為中位數;當N為偶數時,中位數則為處於中間位置的2個變數值的平均數,即(M1+M2)/2。中位數是以它在所有標誌值中所處的位置確定的全體單位標誌值的代表值,不受分佈數列的極大或極小值影響,從而在一定程度上提高了中位數對分佈數列的代表性。

1、求解所有招聘廣告薪水待遇的中位數median.MDX
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 //商業智慧之路(jbean.org),Begin WITH //採集到的招聘廣告條目(薪水測量值非空) SetRawAdvSetAS NonEmpty([Advertisement].[Adv Id].members,[Measures].[Salary Sum]) //將廣告條目按照薪水排序 SetAdvSetAS Order(RawAdvSet, [Measures].[Salary Sum],DESC) //招聘廣告總數 Member [measures].[AdvCount] as Count
(AdvSet) //招聘廣告條目中間位置 Member [Measures].[MedianReal] as ([measures].[AdvCount]-1) * 50 / 100 Member [Measures].[MedianInt] as Int([Measures].[MedianReal])

相關推薦

MDX示例求解位數位數(medianquartile

一個人力資源諮詢集團通過網路爬蟲採集手段將多個知名招聘網站上釋出的求職和招聘等資訊準實時採集到自己的庫裡,形成一個數據量浩大的招聘資訊庫,跟蹤全國招聘和求職的行業、工種、職位、待遇等資訊,並通過商業智慧系統,開展職業職位供求及趨勢等相關統計分析。這家公司竟然用SSAS

【統計學】資料描述方法(均值位數眾數標準差離差位數

分佈中心的測量:     均值:大多數時候所說的平均數,它的定義如下:         均值=  所有數值的總和 / 所有數值的個數總和     中位數:分類資料組的中間值(如果資料個數為偶數,則

統計量分析--極差標準差變異係數位數間距

#-*- coding: utf-8 -*- #餐飲銷量資料統計量分析 import pandas as pd catering_sale = 'catering_sale.xls' #餐飲資料 da

均值標準差位差(C++

均值:Mean。即平均數。表示一組資料集中趨勢的量數,是指在一組資料中所有資料之和再除以這組資料的個數。 中值:Median。即中位數。是指將統計總體當中的各個變數值按大小順序排列起來,形成一個數列,處於變數數列中間位置的變數值就稱為中位數。 標準差:Sta

資料分析度量資料散佈的位數

假設屬性X的資料以數值遞增序排列。分位數是取自資料分佈的每隔一定間隔上的點,把資料劃分成基本上大小相等的連貫集合。4-分位數是3個數據點,他們把資料劃分成4個相等的部分,使得每部分表示資料分佈的四分之一。通常稱它們為四分位數。四分位數給出分佈的中心、散佈和形狀的某種指示。第1

面試題應用很多jar包,比如springmybatisredis等等,各自用的日誌系統各異,怎麼用slf4j統一輸出?

一、問題概述 如題所說,後端應用(非spring boot專案)通常用到了很多jar包,比如spring系列、mybatis、hibernate、各類連線資料庫的客戶端的jar包。可能這個jar包用的是logback、那個用的是log4j、那個又是log4j2, 這時候,怎麼才能保證各jar包的日誌都能輸

面試題應用很多jar包,比如springmybatisredis等等,各自用的日誌系統各異,怎麽用slf4j統一輸出?

相同 如何 align 等等 version 試題 ava body jakarta 一、問題概述 如題所說,後端應用(非spring boot項目)通常用到了很多jar包,比如spring系列、mybatis、hibernate、各類連接數據庫的客戶端的jar包。可能這

迴圈連結串列示例求解約瑟夫問題(C++實現)

約瑟夫問題描述: 一個旅行社要從n個旅客中選出一名旅客,為他提供免費的環球旅行服務。旅行社安排這些旅客圍成一個圓圈,從帽子中取出一張紙條,用上面寫的正整數m(<n)作為報數值。遊戲進行時,從

Android 錯誤 TextView屬性ellipsize的 值為startmiddle可能會出現錯誤

錯誤摘要如下: Java.lang.ArrayIndexOutOfBoundsException: length=*; index=-1 at android.text.StaticLayout.c

位數(定義位置數值

一、定義 四分位數(Quartile)是統計學中分位數的一種,即把所有資料由小到大排列並分成四等份,處於三個分割點位置的資料就是四分位數。 第一四分位數 (Q1),又稱“下四分位數”,等於該樣本中所有資料由小到大排列後第25%的資料。        第二四分位數 (Q

去哪網實習總結JavaWeb文傳參亂碼問題的解決(JavaWeb

vertical size bsp style -m post 保持 留言 認同 本來是以做數據挖掘的目的進去哪網的。結構卻成了系統開發。。。 只是還是比較認真的做了三個月。老師非常認同我的工作態度和成果。。。 實習立即就要結束了,總結一下幾點之前沒有註意過的變

js Math [ 隨機數絕對值舍五入進一取整舍去取整最大值最小值圓周率 ]

pre 最大 abs 取整 dom tran 絕對值 rip math <script> /* 數學對象:Math */ with (document) { write(‘<br>-3.5的絕

《Java從入門到放棄》入門篇hibernate的多表對應關系(二

文件中 nas join upx proxy n2n pla sta int 前一篇講完了一對多的關系,通過與JDBC對比應該能發現,是不是比JDBC簡單了很多? 我們只需要把對象只間的包含或對應關系理清楚,完全不用我們自己來寫SQL語句。所以使用hibernate框架後,

Tarjan算法求解圖的割點與橋(割邊

none 特殊 說明 align 定義 兩個 bsp tom 還需要 簡介: 割邊和割點的定義僅限於無向圖中。我們可以通過定義以蠻力方式求解出無向圖的所有割點和割邊,但這樣的求解方式效率低。Tarjan提出了一種快速求解的方式,通過一次DFS就求解出圖中所有的割點和割邊。

知識儲備SpringBean的生命週期(基於註解版

一:前言 在Spring專案中,通常配置Spring都是使用XML的形式進行配置,配置bean是通過<bean></bean>標籤將bean加入IOC容器中,但在Spring註解版中,可以通過Java程式碼進行配置,即建立一個java類在其類頭上標註@Configurat

pandas資料處理實踐(時間序列date_range資料箱cut分組技術GroupBy

時間序列: 關鍵函式 pandas.date_range(start = None,end = None,periods = None,freq = None,tz = None,normalize = False,name = None,closed = None,**

{轉載}位數

------------------------------------------------------------------------------------------------------ 四分位數(Quartile),即統計學中,把所有數值

轉發python的網頁爬取函式requests.get(和urlopen函式的區別

爬蟲裡面,我們不可避免的要用urllib中的urlopen()和requests.get()方法去請求或獲取一個網頁的內容,這裡面的區別在於urlopen開啟URL網址,url引數可以是一個字串url或者是一個Request物件,返回的是http.client.HTTPRespons

Tarjan演算法求解圖的割點與橋(割邊

簡介: 割邊和割點的定義僅限於無向圖中。我們可以通過定義以蠻力方式求解出無向圖的所有割點和割邊,但這樣的求解方式效率低。Tarjan提出了一種快速求解的方式,通過一次DFS就求解出圖中所有的割點和割邊。 歡迎探討,如有錯誤敬請指正 1. 割點與橋(割邊)的定義 在無向圖中才有割邊和割點的定義 割點:無

openstacknova“從映象啟動(建立一個新卷”建立虛擬機器的流程

原文網址:http://blog.csdn.net/xiangpingli/article/details/47912777 nova還有一種啟動方式:“從映象啟動(建立一個新卷)” 這個流程中,nova會在_prep_block_device中的attach_blo