1. 程式人生 > >資料分析系列教程之numpy(四)

資料分析系列教程之numpy(四)

前面幾節講了numpy中資料型別建立,選取,修改,今天是numpy的最後一節,繼續講一些更常見的一些計算方法

1、求和函式

求和函式,用sum(),當然下圖中我是直接選取哪些資料,就對哪些資料求和

在這裡插入圖片描述

sum函式裡面有引數,當然下面的函式同樣也包含該引數axis,axis代表軸,axis=0表示求列之和,axis=1表示求行之和

在這裡插入圖片描述

2、求平均值函式

mean()函式求平均值,同樣引數有axis

在這裡插入圖片描述

3、最大值最小值函式

分別是max()和min( )函式

在這裡插入圖片描述

4、最大值最小值之差函式

ptp()函式可以求最大值和最小值之差

在這裡插入圖片描述

上面的這些計算函式都是很常用的,其實都很簡單,用法也一樣,無非我們記住這些方法就好了,但是正因為簡單,可能反而容易犯一些眼高手低的錯誤,所以我把這些方法以最簡單的例子給大家計算執行出結果,讓大家直接能一目瞭然看懂每個方法的作用

5、方差、標準差計算

為了能讓大家清楚明瞭的看懂方差和標準差如何計算,給大家手動計算其計算方式和兩者關係,相信大家一看應該就能明白

方差:比如按第一列來說,所有樣本減去該列的均值,求平方,在求和,最後取平均數,即可計算出方差

標準差:方差開根號

在這裡插入圖片描述

6、這裡給大家普及下,如何計算20的開平方?

方式一:python中**表示冪,開平方就是0.5次冪

方式二:利用math庫中的sqrt方法求

在這裡插入圖片描述

對應到numpy的話,有std方法,計算標準差,也就是方差開平方後的值

在這裡插入圖片描述

7、方差、標準差概念和作用

概率論中方差用來度量樣本資料和均值之間的偏離程度。方差是各個資料分別與其平均數之差的平方的和的平均數。

那麼問題來了,既然有了方差來描述變數與均值的偏離程度,那又搞出來個標準差幹什麼呢?

方差與我們要處理的資料的量綱是不一致的,雖然能很好的描述資料與均值的偏離程度,但是處理結果是不符合我們的直觀思維的。

舉個例子:一個班級裡有60個學生,平均成績是70分,標準差是9,方差是81,成績服從正態分佈(前提條件),那麼我們通過方差不能直觀的確定班級學生與均值到底偏離了多少分,通過標準差我們就很直觀的得到學生成績分佈在[61,79]範圍的概率為0.6826,即約等於下圖中的34.2%*2

在這裡插入圖片描述

學資料分析還是要有一定的數學知識為基礎,慢慢的都會給大家講這些數學概念和對應的一些數學函式,至此,numpy最常用的一些方法已經給大家提了很多,後面涉及一些具體應用的時候再繼續補充其知識點