1. 程式人生 > >《BI那點兒事》三國資料分析系列——蜀漢五虎上將與魏五子良將武力分析,絕對的經典分析

《BI那點兒事》三國資料分析系列——蜀漢五虎上將與魏五子良將武力分析,絕對的經典分析

獻給廣大的三國愛好者們,希望喜歡三國的朋友一起討論,加深對傳奇三國時代的瞭解

資料分析基礎概念:
集中趨勢分析是指在大量測評資料分佈中,測評資料向某點集中的情況。
總體(population)是指客觀存在的,並在同一性質的基礎上結合起來的許多個別單位的整體,即具有某一特性的一類事物的全體,又叫母體或全域。簡單地說,總體也就是我們所研究的性質相同個體的總和,用符號N表示。
樣本(sample),是指從總體中抽出的一部分個體。樣本中所包含個體數目稱樣本容量或含量,用符號n表示。
標準差與方差的區別:從公式上可以很明顯看出,方差是標準差的平方,其餘一模一樣。
那它們二者的區別就體現在,標準差是以最初的單位存在,而方差是以平方單位存在。

建立準備分析環境:
蜀漢五虎上將,是指羅貫中的長篇小說《三國演義》中,蜀漢昭烈帝劉備麾下的五員猛將,分別是:關羽、張飛、趙雲、馬超、黃忠。原文描寫為“五虎大將”,後人慣稱“五虎上將”。

SELECT  *
FROM    FactSanguo11
WHERE   姓名 IN ( N'關羽', N'張飛', N'趙雲', N'馬超', N'黃忠' )


關羽、張飛、趙雲、馬超、黃忠武力值為:97,98,96,97,93
分析過程:

驗證分析結果:

SELECT  AVG([武力]) AS 均值 ,
        VARP([武力]) AS 總體方差 ,
        VAR
([武力]) AS 樣本方差 , STDEVP([武力]) AS 總體標準差 , STDEV([武力]) AS 樣本標準差 FROM FactSanguo11 WHERE 姓名 IN ( N'關羽', N'張飛', N'趙雲', N'馬超', N'黃忠' )



魏五子良將
五子良將是指三國時期,曹魏勢力的五位將軍,即前將軍張遼、右將軍樂進、左將軍于禁、徵西車騎將軍張郃以及右將軍徐晃。
陳壽撰寫魏書卷十七時,將此五人合傳,敘述諸將生平事蹟後評曰:“太祖建茲武功,而時之良將,五子為先”,因此現代人將其稱之為“五子良將”或“魏五子”。

SELECT
* FROM FactSanguo11 WHERE 姓名 IN ( N'張遼', N'樂進', N'于禁', N'張郃', N'徐晃' )


張遼、樂進、于禁、張郃、徐晃 武力值為:92,84,78,89,90
分析過程:

驗證分析結果:

SELECT  AVG([武力]) AS 均值 ,
        VARP([武力]) AS 總體方差 ,
        VAR([武力]) AS 樣本方差 ,
        STDEVP([武力]) AS 總體標準差 ,
        STDEV([武力]) AS 樣本標準差
FROM    FactSanguo11
WHERE   姓名 IN ( N'張遼', N'樂進', N'于禁', N'張郃', N'徐晃' )



分析結論:

蜀漢五虎上將

魏五子良將

1均值

96.2

86.6

2中位數

97

89

3眾數

97

-

4最大

98

92

5最小

93

78

6極差

5

14

7總體方差

2.96

25.44

8總體標準差

1.72

5.04

9樣本方差

3.7

31.80

10樣本標準差

1.92

5.64

11 CV(sample)

1.9958%

CV(sample)= (1.92/96.2)*100%=1.9958%

6.5127%

CV(sample)= (5.64/86.6)*100%=6.5127%

附錄:蜀漢五虎上將、魏五子良將配圖

相關推薦

BI點兒三國資料分析系列——蜀漢上將良將武力分析絕對經典分析

獻給廣大的三國愛好者們,希望喜歡三國的朋友一起討論,加深對傳奇三國時代的瞭解 資料分析基礎概念:集中趨勢分析是指在大量測評資料分佈中,測評資料向某點集中的情況。總體(population)是指客觀存在的,並在同一性質的基礎上結合起來的許多個別單位的整體,即具有某一特性的一類事物的全體,又叫母體或全域。簡單地

BI點兒資料探勘各類演算法——準確性驗證

準確性驗證示例1:——基於三國志11資料庫 資料準備: 挖掘模型:依次為:Naive Bayes 演算法、聚類分析演算法、決策樹演算法、神經網路演算法、邏輯迴歸演算法、關聯演算法提升圖: 依次排名為: 1. 神經網路演算法(92.69% 0.99)2. 邏輯迴歸演算法(92.39% 0.99)3. 決策

BI點兒資料探勘初探

什麼是資料探勘? 資料探勘(Data Mining),又稱資訊發掘(Knowledge Discovery),是用自動或半自動化的方法在資料中找到潛在的,有價值的資訊和規則。 資料探勘技術來源於資料庫,統計和人工智慧。 資料探勘能夠做什麼 對企業中產生的大量的資料進行分析,找出其中潛藏的規

BI點兒資料流轉換——查詢轉換

查詢轉換通過聯接輸入列中的資料和引用資料集中的列來執行查詢。是完全匹配查詢。在源表中查詢與字表能關聯的所有源表記錄。準備資料。源表 T_QualMoisture_Middle_Detail字典表 T_DIC_QualProcess資料流任務設計圖: 設計步驟: (adsbygo

BI點兒資料流轉換——多播、Union All、合併、合併聯接

建立測試資料: CREATE TABLE FactResults ( Name VARCHAR(50) , Course VARCHAR(50) , Score INT ) INSERT INTO FactResults

BI點兒資料探勘的主要方法

一、迴歸分析目的:設法找出變數間的依存(數量)關係, 用函式關係式表達出來。所謂迴歸分析法,是在掌握大量觀察資料的基礎上,利用數理統計方法建立因變數與自變數之間的迴歸關係函式表示式(稱迴歸方程式)。迴歸分析中,當研究的因果關係只涉及因變數和一個自變數時,叫做一元迴歸分析;當研究的因果關係涉及因變數和兩個或兩個

BI點兒資料流轉換——OLE DB 命令轉換

OLE DB命令對資料流中的資料行執行一個OLE DB命令。它針對資料表中的每一行進行更新操作,可以事先將要更新的資料存放在表中。或者針對一個有輸入引數的儲存過程,可以將這些引數存放在一個數據表中,不用每次都輸入引數。示例資料準備: CREATE TABLE SourceParametersForSt

BI點兒資料流轉換——排序

排序轉換允許對資料流中的資料按照某一列進行排序。這是五個常用的轉換之一。連線資料來源開啟編輯介面,編輯這種任務。不想設定為排序列的欄位不要選中,預設情況下所有列都會選中。如圖所示,按照TotalSugar_Cnt排序,並將所有列輸出。 在底部的表格中,可以設定輸出列的別名,是否按照列來排序。Sort Ord

BI點兒資料流轉換——資料轉換

資料轉換執行類似於T-SQL中的函式CONVERT或CAST的功能。資料轉換的編輯介面如圖,選擇需要轉換的列,在DataType下拉列表中選擇需要的資料型別。Output Alias欄內設定輸出時使用的別名。 (adsbygoogle = window.adsbygoogle |

BI點兒資料流轉換——匯入列、匯出列

匯入列: 匯入列例子現在來做一個例子:建立路徑D:\Pictures隨便在路徑D:\Pictures中貼上4個比較小的影象檔案命名為01.png、02.png、03.png、04.png在路徑D:\Pictures內建立一個txt檔案命名為filelist.txt,檔案內容如下D:\Pictures\01.

BI點兒資料流轉換——字詞查詢轉換

字詞查詢轉換將從轉換輸入列的文字中提取的字詞與引用表中的字詞進行匹配,然後計算出查詢表中的字詞在輸入資料集中出現的次數,並將計數與引用表中的此字詞一併寫入轉換輸出的列中。此轉換對於建立基於輸入文字並帶有詞頻統計資訊的自定義詞列表很有用。 本章功能:取出一個表中某欄位的資料,並取出另一個表中的關鍵詞,判斷關鍵

BI點兒資料流轉換——逆透視轉換

  逆透視轉換將來自單個記錄中多個列的值擴充套件為單個列中具有同樣值的多個記錄,使得非規範的資料整合為較規範的版本。例如,每個客戶在列出客戶名的資料集中各佔一行,在該行的各列中顯示購買的產品和數量。逆透視轉換將資料集規範之後,客戶購買的每種產品在該資料集中各佔一行。   我們下一步是進行逆透視。與透視配置不

BI點兒資料流轉換——透視

這個和T-SQL中的PIVOT和UNPIVOT的作用是一樣的。資料透視轉換可以將資料規範或使它在報表中更具可讀性。 通過透視列值的輸入資料,透視轉換將規範的資料集轉變成規範程度稍低、但更為簡潔的版本。例如,在列有客戶名稱、產品和購買數量的規範的 Orders 資料集中,任何購買多種產品的客戶都有多行,每一行

BI點兒資料流轉換——條件性拆分

根據條件分割資料是一個在資料流中新增複雜邏輯的方法,它允許根據條件將資料輸出到其他不同的路徑中。例如,可以將TotalSugar< 27.4406的輸出到一個路徑,TotalSugar >= 27.4406的輸出到另一個路徑。如圖。可以從上面的屬性結構中拖放一個列或者程式碼段,然後根據邏輯重新命名

BI點兒資料流轉換——派生列

派生列轉換通過對轉換輸入列應用表示式來建立新列值。 表示式可以包含來自轉換輸入的變數、函式、運算子和列的任意組合。 結果可作為新列新增,也可作為替換值插入到現有列。 派生列轉換可定義多個派生列,任何變數或輸入列都可以出現在多個表示式中。可以使用此轉換執行下列任務: 將不同列的資料連線到一個派生列中。 例

BI點兒資料流轉換——百分比抽樣、行抽樣

百分比抽樣和行抽樣可以從資料來源中隨機選擇一組資料。這兩種task都可以產生兩組輸出,一組是隨機選擇的,另一組是沒有被選擇的。可以將這些選擇出的資料傳送到開發或者測試伺服器上。這個Task的最合適的應用是建立資料探勘模型然後,使用這些抽樣資料來驗證這個模型。 編輯這種task,選擇要抽取的行數或者 百分比,

BI點兒資料流轉換——模糊分組轉換

在模糊查詢中我們提到髒資料是怎樣進入到表中的事情,主要還是由於一些“Lazy-add”造成的。這種情況我們的肉眼很容易被欺騙,看上去是同一個單詞,其實就差那麼一個字母,變成了兩個不同的單詞。一個簡單的例子是X-Ray Tech和xRey,我們很有可能認為他們是同一個職務,CT操作員,但是如果讓計算機來處理的話

BI點兒》SSRS圖表和儀表——雷達圖分析三國超一流謀士、統帥資料(圖文並茂)

雷達圖分析三國超一流謀士、統帥資料,獻給廣大的三國愛好者們,希望喜歡三國的朋友一起討論,加深對傳奇三國時代的瞭解 建立資料環境: -- 抽取三國超一流謀士TOP 10資料 DECLARE @t1 TABLE ( [姓名] NVARCHAR(255) , [統率]

BI點兒》運用標準計分和離差——分析三國超一流統帥綜合實力排名 絕對客觀資料說話

資料分析基礎概念:標準計分: 1、無論作為變數的滿分為幾分,其標準計分的平均數勢必為0,而其標準差勢必為1。2、無論作為變數的單位是什麼,其標準計分的平均數勢必為0,而其標準差勢必為1。公式為: 離差:離差就是應用標準計分所得的數值。1、無論作為變數的滿分為幾分,其離差的平均數勢必為50,而其標準差勢必為1

BI點兒三國人物智力分佈狀態分析

獻給廣大的三國愛好者們,希望喜歡三國的朋友一起討論,加深對傳奇三國時代的瞭解資料分析基礎概念:資料分為“不可測量”的資料和“可測量”的資料。不可測量的資料稱為“分類資料”(Category Data或Categorical Data。),而可測量的資料稱為“數值資料”(Numerical Data)。組中值: