python模擬概率論中偏度和峰度計算

阿新 • • 發佈：2019-02-10

在概率學中我們用偏度和峰度去刻畫分佈的情況：

偏度描述的是分佈的對稱性程度，如上面，右偏表示在u值的右側分佈佔多數，左偏則反向，並且通過陰影的面積去刻畫概率。而峰度是描述分佈的最高值的情況，在常用情況下，減去3的原因在於正態分佈的超值峰度恰好為3。

下面使用python代入公式計算和呼叫函式庫計算進行比較：

#!/usr/bin/python
#coding:utf8
#coding=utf8
#encoding:utf8
#encoding=utf8
#_*_ coding:utf8 _*_
#  -*- coding:utf-8 -*-

import numpy as np
from scipy import stats
import math
import matplotlib as mpl
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm


def calc_statistics(x):
    n = x.shape[0]  # 樣本個數

    # 手動計算
    # 分別表示各個k階矩
    m = 0
    m2 = 0
    m3 = 0
    m4 = 0
    for t in x:
        m += t
        m2 += t*t
        m3 += t**3
        m4 += t**4
    m /= n
    m2 /= n
    m3 /= n
    m4 /= n
    # 代入公式求個值
    mu = m
    sigma = np.sqrt(m2 - mu*mu)
    skew = (m3 - 3*mu*m2 + 2*mu**3) / sigma**3
    kurtosis = (m4 - 4*mu*m3 + 6*mu*mu*m2 - 4*mu**3*mu + mu**4) / sigma**4 - 3
    print('手動計算均值、標準差、偏度、峰度：', mu, sigma, skew, kurtosis)

    # 使用系統函式驗證
    mu = np.mean(x, axis=0)
    sigma = np.std(x, axis=0)
    skew = stats.skew(x)
    kurtosis = stats.kurtosis(x)
    return mu, sigma, skew, kurtosis


if __name__ == '__main__':
    d = np.random.randn(100000)
    print(d)
    mu, sigma, skew, kurtosis = calc_statistics(d)
    print('函式庫計算均值、標準差、偏度、峰度：', mu, sigma, skew, kurtosis)
    # 一維直方圖
    mpl.rcParams[u'font.sans-serif'] = 'SimHei'
    mpl.rcParams[u'axes.unicode_minus'] = False
    y1, x1, dummy = plt.hist(d, bins=50, normed=True, color='g', alpha=0.75)
    t = np.arange(x1.min(), x1.max(), 0.05)
    y = np.exp(-t**2 / 2) / math.sqrt(2*math.pi)
    plt.plot(t, y, 'r-', lw=2)
    plt.title(u'高斯分佈，樣本個數：%d' % d.shape[0])
    plt.grid(True)
    plt.show()

    d = np.random.randn(100000, 2)
    mu, sigma, skew, kurtosis = calc_statistics(d)
    print('函式庫計算均值、標準差、偏度、峰度：', mu, sigma, skew, kurtosis)

    # 二維影象
    N = 30
    density, edges = np.histogramdd(d, bins=[N, N])
    print('樣本總數：', np.sum(density))
    density /= density.max()
    x = y = np.arange(N)
    # 高斯分佈
    t = np.meshgrid(x, y)
    fig = plt.figure(facecolor='w')
    ax = fig.add_subplot(111, projection='3d')
    ax.scatter(t[0], t[1], density, c='r', s=15*density, marker='o', depthshade=True)
    ax.plot_surface(t[0], t[1], density, cmap=cm.Accent, rstride=2, cstride=2, alpha=0.9, lw=0.75)
    ax.set_xlabel(u'X')
    ax.set_ylabel(u'Y')
    ax.set_zlabel(u'Z')
    plt.title(u'二元高斯分佈，樣本個數：%d' % d.shape[0], fontsize=20)
    plt.tight_layout(0.1)
    plt.show()

python模擬概率論中偏度和峰度計算

在概率學中我們用偏度和峰度去刻畫分佈的情況：偏度描述的是分佈的對稱性程度，如上面，右偏表示在u值的右側分佈佔多數，左偏則反向，並且通過陰影的面積去刻畫概率。而峰度是描述分佈的最高值的情況，在常用情況下，減去3的原因在於正態分佈的超值峰度恰好為3。下面使

統計分析：偏度和峰度

偏度偏度（Skewness）：是對Sample構成的分佈的對稱性狀況的描述。計算時間序列 xx 的偏度，偏度用於衡量 xx 的對稱性。若偏度為負，則 xx 均值左側的離散度比右側強;若偏度為正，則 xx均值左側的離散度比右側弱。對於正態分佈(或嚴格對稱分佈)偏度

數據的偏度和峰度

對稱性高峰平臺偏差數據描述取值計算公式比較偏度（Skewness）是描述某變量取值分布對稱性的統計量。如果是正太分布的話.偏度是三階中心距,值為0. ,Skewness=0 分布形態與正態分布偏度相同 Skewness>0 正偏差數值較大，為正偏

偏度與峰度（附python程式碼）

1 矩對於隨機變數X,X的K階原點矩為 X的K階中心矩為期望實際上是隨機變數X的1階原點矩,方差實際上是隨機變數X的2階中心矩變異係數(Coefficient of Variation):標準差與均值(期望)的比值稱為變異係數,記為C

多階矩在影象中的含義（方差，偏度，峰度）

設影象共有N點（影象塊則為w*h個畫素點），第i點的灰度值為Xi，其均值為X，則這些特徵的含義如下：方差（Variance）：是一種衡量樣本分佈均勻性的尺度標準。計算公式為：偏度（Skew

機器學習數學|偏度與峰度及其python實現

機器學習中的數學覺得有用的話,歡迎一起討論相互學習~Follow Me 原創文章,如需轉載請保留出處本部落格為七月線上鄒博老師機器學習數學課程學習筆記矩對於隨機變

python（計算資料偏差和峰度）

numpy.set_printtoptions(edgeitems=5):值過多，顯示前5個和後5個偏度：衡量隨機分佈的不均衡性，偏度=0，數值相對均勻的分佈在兩側峰度：概率密度在均值處峰值高低的特徵python計算資料均值、標準差、偏度、峰度：import numpy as

談談js中深度克隆和淺度克隆

typeof ren ng- set [] user 淺度克隆 array child 在js中，我們通常通過var創建一個json對象來方便存儲數據， var template = { 　　user:‘張某‘, 　　password:‘‘, 　　tem:[‘標簽1‘,‘標

python 機器學習中模型評估和調參

劃分 gif osi 最終 http 都沒有 select enume 沒有在做數據處理時，需要用到不同的手法，如特征標準化，主成分分析，等等會重復用到某些參數，sklearn中提供了管道，可以一次性的解決該問題先展示先通常的做法 import pandas as

第一部分 5.4.1 概率論中的乘法和加法（生日悖論）

由生日悖論想到的....<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> ---第五章主要講概率論的一些內容，概率論我一直學得懵

基於權益的代幣協議中的通貨膨脹和參與度

廣受喜愛的加密代幣和基於區塊鏈的協議使用著不同的模式來發行代幣。一些協議起初會發行固定數量的代幣，之後就不再製造任何代幣了，如 Augur 和 Golem 。其他像比特幣和 Zcash 這樣的協議則會隨著時間的流逝逐漸通過挖礦或其它方式來發行代幣，但仍有固定的代幣供應量，這樣代幣的

偏度與峰度的正態性分佈判斷

當我們應用統計方法對資料進行分析時，會發現許多分析方法如T檢驗、方差分析、相關分析以及線性迴歸等等，都要求資料服從正態分佈或近似正態分佈，正態分佈在機器學習的重要性後期會講述。上一篇文章用Q-Q圖來驗證資料集是否符合正態分佈，本文首先介紹了偏度與峰度的定義，然後用偏度與峰度檢測資料集是否符合正態分

Python 3.6中reduce函式和cmp函式

1,Python 3中取消了cmp函式，使用cmp功能的話需按如下所示(方法一種)： import operator #help(operator) ... __ge__ = ge(...) ge(a, b) -- Same as a>=b. __eq__ = eq(...

python-numpy.array中，any()和all()方法介紹

0.摘要本文主要介紹numpy.array.any()和numpy.array.all()的用法和區別。 1.np.array.any()和numpy.array.all() np.array.any()是或操作，將np.array中所有元素進行或操作，然後返回T

python去除列表中的引號和兩端括號

去除列表兩段括號，並以x分割列表元素執行結果： list=['Alice','Bob','Mike','John']a=' '.join(list)b=','.join(list)print("以空格分隔列表元素",a)print("以逗號分隔列表元素",b)

原生js模擬jquery中的addClass和removeClass方法

js程式碼： //新增類 function addClass(obj,className) { if(obj.className == '') { //如果沒有class obj.className = className; }else { var strClass = obj.className; var

statistic—偏度，峰度，卡方分佈，t分佈，f分佈

from __future__ import print_function, division import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy.s

Python：bs4中 string 屬性和 text 屬性的區別及背後的原理

剛開始接觸 bs4 的時候，我也很迷茫，覺得 string 屬性和 text 屬性是一樣的，不明白為什麼要分成兩個屬性。 html = '<p>hello word</p>' soup = BeautifulSoup(html, 'lxml') p = soup.p print(p.

python模擬滑鼠中軸滾動

網上對這個說的不多，自己搜了些帖子，寫下自己的經驗：需要用到的模組win32api、win32con，安裝pywin32即可下載地址：http://download.csdn.net/detail/clean_water/9759816 下面這個方法可模擬滑鼠中軸滑動

Python 3.x中的編碼和解碼問題

最近在極客學院學習爬蟲，老師用的是2.x版本，而我電腦裡的版本是3.x，於是在網頁上查詢在輸出中文時如何正確輸出。我原以為2.x 3.x在很多語法上沒什麼區別，在解碼decode上應該也差不多，沒想到竟然發現，很多部落格提到2.x提出的解決方案 py

python模擬概率論中偏度和峰度計算

相關推薦