1. 程式人生 > >python中numpy的random函式使用

python中numpy的random函式使用

在python資料分析的學習和應用過程中,經常需要用到numpy的random隨機函式:

import numpy as np

1.numpy.random.rand

用法:numpy.random.rand(d0,d1,…,dn)

  • rand函式根據給定維度生成[0,1)之間的資料,包含0,不包含1
  • dn表示每個維度
  • 返回值為指定維度的array

參考一下兩個例子理解:

np.random.rand(4,2)表示如下:

array([[ 0.02173903, 0.44376568],[ 0.25309942, 0.85259262],[ 0.56465709, 0.95135013],[ 0.14145746, 0.55389458]])


np.random.rand(4,3,2)表示:

array([[[ 0.08256277, 0.11408276],[ 0.11182496, 0.51452019],[ 0.09731856, 0.18279204]],

[[ 0.74637005, 0.76065562],[ 0.32060311, 0.69410458],[ 0.28890543, 0.68532579]],

[[ 0.72110169, 0.52517524],[ 0.32876607, 0.66632414],[ 0.45762399, 0.49176764]],

[[ 0.73886671, 0.81877121],[ 0.03984658, 0.99454548],[ 0.18205926, 0.99637823]]

])

2.numpy.random.rand()

numpy.random.randn(d0,d1,…,dn)

  • randn函式返回一個或一組樣本,具有標準正態分佈。
  • dn表示每個維度
  • 返回值為指定維度的array
np.random.randn() # 當沒有引數時,返回單個數據
-1.1241580894939212
np.random.randn(2,4)
array([[ 0.27795239, -2.57882503,  0.3817649 ,  1.42367345],
       [-1.16724625, -0.22408299,  0.63006614, -0.41714538]])
np.random.randn(4
,3,2)
array([[[ 1.27820764,  0.92479163],
        [-0.15151257,  1.3428253 ],
        [-1.30948998,  0.15493686]],

       [[-1.49645411, -0.27724089],
        [ 0.71590275,  0.81377671],
        [-0.71833341,  1.61637676]],

       [[ 0.52486563, -1.7345101 ],
        [ 1.24456943, -0.10902915],
        [ 1.27292735, -0.00926068]],

       [[ 0.88303   ,  0.46116413],
        [ 0.13305507,  2.44968809],
        [-0.73132153, -0.88586716]]])

3.numpy.random.randint()

numpy.random.randint(low, high=None, size=None, dtype=’l’)

  • 返回隨機整數,範圍區間為[low,high),包含low,不包含high
  • 引數:low為最小值,high為最大值,size為陣列維度大小,dtype為資料型別,預設的資料型別是np.int
  • high沒有填寫時,預設生成隨機數的範圍是[0,low)
np.random.randint(1,size=5) # 返回[0,1)之間的整數,所以只有0
array([0, 0, 0, 0, 0])
np.random.randint(1,5) # 返回1個[1,5)時間的隨機整數
4
np.random.randint(-5,5,size=(2,2))
array([[ 2, -1],
       [ 2,  0]])

3.2 numpy.random.random_integers

numpy.random.random_integers(low, high=None, size=None)

  • 返回隨機整數,範圍區間為[low,high],包含low和high
  • 引數:low為最小值,high為最大值,size為陣列維度大小
  • high沒有填寫時,預設生成隨機數的範圍是[1,low]

該函式在最新的numpy版本中已被替代,建議使用randint函式

np.random.random_integers(1,size=5)
array([1, 1, 1, 1, 1])

4 生成[0,1)之間的浮點數

  • numpy.random.random_sample(size=None)
  • numpy.random.random(size=None)
  • numpy.random.ranf(size=None)
  • numpy.random.sample(size=None)
print('-----------random_sample--------------')
print(np.random.random_sample(size=(2,2)))
print('-----------random--------------')
print(np.random.random(size=(2,2)))
print('-----------ranf--------------')
print(np.random.ranf(size=(2,2)))
print('-----------sample--------------')
print(np.random.sample(size=(2,2)))
-----------random_sample--------------
[[ 0.34966859  0.85655008]
 [ 0.16045328  0.87908218]]
-----------random--------------
[[ 0.25303772  0.45417512]
 [ 0.76053763  0.12454433]]
-----------ranf--------------
[[ 0.0379055   0.51288667]
 [ 0.71819639  0.97292903]]
-----------sample--------------
[[ 0.59942807  0.80211491]
 [ 0.36233939  0.12607092]]

5 numpy.random.choice()

numpy.random.choice(a, size=None, replace=True, p=None)

  • 從給定的一維陣列中生成隨機數
  • 引數: a為一維陣列類似資料或整數;size為陣列維度;p為陣列中的資料出現的概率
  • a為整數時,對應的一維陣列為np.arange(a)
np.random.choice(5,3)
array([4, 1, 4])
np.random.choice(5, 3, replace=False)
# 當replace為False時,生成的隨機數不能有重複的數值
array([0, 3, 1])
np.random.choice(5,size=(3,2))
array([[1, 0],
       [4, 2],
       [3, 3]])
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3))
array([['moto', 'iphone', 'xiaomi'],
       ['lenovo', 'xiaomi', 'xiaomi'],
       ['xiaomi', 'lenovo', 'iphone']],
      dtype='<U7')
  • 引數p的長度與引數a的長度需要一致;
  • 引數p為概率,p裡的資料之和應為1
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
array([['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'xiaomi', 'iphone']],
      dtype='<U7')

6 numpy.random.seed()

  • np.random.seed()的作用:使得隨機資料可預測。
  • 當我們設定相同的seed,每次生成的隨機數相同。如果不設定seed,則每次會生成不同的隨機數
np.random.seed(0)
np.random.rand(5)
array([ 0.5488135 ,  0.71518937,  0.60276338,  0.54488318,  0.4236548 ])
np.random.seed(1676)
np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])
np.random.seed(1676)
np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])