1. 程式人生 > >【numpy】新版本中numpy(numpy>1.17.0)中的random模組

【numpy】新版本中numpy(numpy>1.17.0)中的random模組

numpy是Python中經常要使用的一個庫,而其中的random模組經常用來生成一些陣列,本文接下來將介紹numpy中random模組的一些使用方法。

首先檢視numpy的版本:

import numpy 
numpy.__version__

'1.18.2'

numpy獲得隨機數有兩種方式:

  • 結合BitGenerator生成偽隨機數
  • 結合Generate從一些統計分佈中取樣生成偽隨機數

BitGenerator:生成隨機數的物件。包含32或64位序列的無符號整數

Generator:將從BitGenerator生成的隨機數序列轉換為遵從特定概率分佈(均勻、正態或二項式等)的數字序列的物件。

從Numpy版本1.17.0開始,可以使用許多不同的BitGenerators初始化Generator。 它包含了許多不同的概率分佈。 傳統的RandomState隨機數例程仍然可用,但僅限於單個BitGenerator。為了方便和向後相容,單個RandomState例項的方法被匯入到numpy.random名稱空間。

預設情況下,Generator使用PCG64提供的位,該位具有比RandomState中的傳統mt19937隨機數生成器更好的統計屬性。

使用舊的numpy.random.RandomState

from numpy import random
random.standard_normal()

結果:1.3768264062478266

Generator可以替代RandomState。 現在,兩個類例項都擁有一個內部BitGenerator例項來提供位流,可以通過gen.bit_generator對其進行訪問。 某些過期的API清除意味著已從Generator中刪除了舊方法和相容性方法。

# As replacement for RandomState(); default_rng() instantiates Generator with
# the default PCG64 BitGenerator.
from numpy.random import default_rng
rg = default_rng()
rg.standard_normal()
rg.bit_generator

<numpy.random._pcg64.PCG64 at 0x7f6f87dac270>

以下這種方式可以支援RandomState和Generator,但是它們的介面有很大的不同:

try:
  rg_integers = rg.integers
except AttributeError:
  rg_integers = rg.randint
a = rg_integers(1000)

結果:775

種子可以傳遞給任何BitGenerator。 提供的值通過SeedSequence進行混合,以將可能的種子序列分佈在BitGenerator的更廣泛的初始化狀態中。 這裡使用PCG64,並用Generator包裹。

from numpy.random import Generator, PCG64
rg = Generator(PCG64(12345))
rg.standard_normal()

結果:-1.4238250364546312

新的基礎結構採用了不同的方法來從RandomState物件生成隨機數。 隨機數生成分為兩個部分,即位生成器和隨機生成器。 BitGenerator的職責有限。 它管理狀態並提供產生隨機雙精度數和隨機無符號32位和64位值的功能。隨機生成器採用生成器提供的流並將其轉換成更有用的分佈,例如模擬的正常隨機值。 這種結構允許使用很少的程式碼重複來使用替代位生成器。 Generator是面向使用者的物件,幾乎與RandomState相同。 初始化生成器的規範方法將PCG64位生成器作為唯一引數。

from numpy.random import default_rng
rg = default_rng(12345)
rg.random()

結果:0.22733602246716966

也可以直接使用BitGenerator例項例項化Generator。 要使用較舊的MT19937演算法,可以直接例項化並將其傳遞給Generator

from numpy.random import Generator, MT19937
rg = Generator(MT19937(12345))
rg.random()

結果:0.37786929937474845

警告:生成器不再提供用於生成NumPy標準的Box-Muller方法。 使用Generator不能為正態分佈或任何其他依賴於正態的分佈(例如RandomState.gamma RandomState.standard_t)確切的隨機值。 如果需要按位向後相容流,請使用RandomState。

  • Generator的常規,指數和伽馬函式使用256步Ziggurat方法,比NumPy的Box-Muller或逆CDF實現快2-10倍。
  • 可選的dtype引數,它接受np.float32或np.float64來為選擇分佈產生統一的單或雙精度的隨機變數
  • 可選的out引數,允許為選擇分佈填充現有陣列
  • random_entropy提供對密碼應用程式中使用的系統隨機性源的訪問(例如Unix上的/ dev / urandom)。
  • 所有BitGenerator都可以通過CType(ctype)和CFFI(cffi)生成double,uint64和uint32。這允許在numba中使用位生成器。
  • 位生成器可通過Cython用於下游專案。
  • 整數現在是從離散均勻分佈中生成整數隨機數的規範方法。 rand和randn方法僅可通過舊版RandomState使用。端點關鍵字可用於指定開啟或關閉間隔。這將替換randint和已棄用的random_integers。
  • random現在是生成浮點隨機數的規範方法,它取代了RandomState.random_sample,RandomState.sample和RandomState.ranf。這與Python的隨機性是一致的。
  • 隨機。
  • numpy中的所有BitGenerator都使用SeedSequence將種子轉換為初始化狀態。

Generator可以訪問廣泛的發行版,並替代RandomState。 兩者之間的主要區別在於Generator依賴於附加的BitGenerator來管理狀態並生成隨機位,然後將這些隨機位從有用的分佈轉換為隨機值。 Generator使用的預設BitGenerator為PCG64。 可以通過將例項化的BitGenerator傳遞給Generator來更改BitGenerator。

也就是說,設定了:

np.random.default_rng(PCG64(隨機種子))

在生成隨機數的時候都會是相同的。然後替換掉了原來的RandomState(隨機種子)

如果省略seed或None,則每次都會例項化一個新的BitGenerator和Generator。 此功能不管理預設的全域性例項。

Generator的一些方法:

Generator.integers(low, high=None, size=None, dtype=’int64’, endpoint=False)

例如:

rng = np.random.default_rng(PCG64(12345))
rng.integers(2, size=10)

結果:array([1, 0, 1, 0, 0, 1, 1, 1, 1, 0])

這裡的意思是生成10個數,這是個數的取值範圍在0-2之間,不包括2.

再看些例子:

rng.integers(5, size=(2, 4))

結果:array([[4, 3, 4, 0], [4, 0, 2, 1]])

rng.integers(1, [3, 5, 10])

結果:array([1, 3, 3])

這裡的意思是生成1×3的陣列,並且每一位都限制了取值範圍。

rng.integers([1, 5, 7], 10)

結果:array([6, 6, 7])

rng.integers([1, 3, 5, 7], [[10], [20]], dtype=np.uint8)

結果:array([[ 1, 4, 8, 9], [ 5, 18, 16, 12]], dtype=uint8)

這裡使用了廣播機制。

Generator.random(size=None, dtype=’d’, out=None):

在半開區間[0.0,1.0)中返回隨機浮點數。
結果來自指定時間間隔內的“連續均勻”分佈。 要對