1. 程式人生 > >資料視覺化:折線圖--直方圖--散點圖

資料視覺化:折線圖--直方圖--散點圖

import matplotlib.pyplot as plt  -- 繪製2D折線圖,直方圖,散點圖等

import numpy as np   -- 將列表轉換為陣列,給圖形上每個點新增標籤時會用到

import pygal  -- pygal是一個SVG圖表庫。SVG是一種向量圖格式,全稱Scalable Vector Graphics -- 可縮放向量圖形。

from random import choice -- 生成隨機漫步資料,函式choice([])從列表中隨機輸出一個數

from random import randint --randint()從一個區間隨機返回一個數

1、折線圖

plt.plot() 繪製折線圖

np.array() 將列表轉換為儲存單一資料型別的多維陣列,例如[1 2 3 4 5] 

zip(x,y) 函式用於將可迭代的物件作為引數,將物件中對應的元素打包成一個個元組,然後返回由這些元組組成的物件,

     這樣做的好處是節約了不少的記憶體。我們可以使用 list() 轉換來輸出列表。如果各個迭代器的元素個數不一致,

     則返回列表長度與最短的物件相同,利用*號操作符,可以將元組解壓為列表,例如a1,a2 = zip(*zip(a,b))

plt.annotate() 給折線點設定(x,y)座標值

plt.tick_params() 設定刻度線和標籤的大小,顏色,內外側,both代表xy同時設定

plt.title()設定圖表標題

plt.xlabel() 設定X軸標籤

plt.ylabel() 設定Y軸標籤

plt.axis([]) 設定X,Y軸刻度的取值範圍 

plt.savefig('') 儲存圖表為圖片格式

plt.show() 開啟matplotlib檢視器,並顯示繪製的圖形

#模組pyplot包含很多生成圖表的函式
import matplotlib.pyplot as plt
import numpy as np
input_values = [1,2,3,4,5,6]
squares = [1,4,9,16,25,36]
#plot()繪製折線圖
plt.plot(input_values,squares,linewidth=5,color='m') #np.array()將列表轉換為儲存單一資料型別的多維陣列 x = np.array(input_values) y = np.array(squares) #annotate()給折線點設定座標值 for a,b in zip(x,y): plt.annotate('(%s,%s)'%(a,b),xy=(a,b),xytext=(-25,15), textcoords='offset points') #設定標題 plt.title('Square Numbers',fontsize=24) plt.xlabel('Value',fontsize=14) plt.ylabel('Square of Value',fontsize=14) #設定刻度線和標籤的大小,顏色,內外側,both代表xy同時設定 plt.tick_params(axis='both',direction='in',colors='c',labelsize=14) plt.axis([0,8,0,45]) plt.savefig('images\line_chart.png') #show()開啟matplotlib檢視器,並顯示繪製的圖形 plt.show()

2、直方圖

plt.bar() 繪製直方圖

plt.text() 給條形柱新增標籤

import numpy as np
import matplotlib.pyplot as plt
#建立帶數字標籤的直方圖
numbers = list(range(1,11))
x = np.array(numbers)
y = np.array([a**2 for a in numbers])
#繪製圖形
plt.bar(x,y,width=0.5,align='center',color='c')
plt.title('Square Numbers',fontsize=24)
plt.xlabel('Value',fontsize=14)
plt.ylabel('Square of Value',fontsize=14)
plt.tick_params(axis='both',labelsize=14)
#設定xy軸座標取值範圍
plt.axis([0,11,0,110])
#設定標籤,a,b代表標籤的座標,第二個為標籤內容,然後是對齊方式和尺寸
for a,b in zip(x,y):
    plt.text(a,b+0.1,'%.0f'%b,ha = 'center',va = 'bottom',fontsize=7)
plt.savefig('images\squares.png')
plt.show()

3、散點圖

plt.scatter() 繪製散點圖

#scatter()繪製散點圖
import matplotlib.pyplot as plt
x_values = list(range(1,11))
y_values = [x**2 for x in x_values]
#引數c為點的顏色,預設藍色;edgecolor為點的輪廓顏色,預設黑色,none為無色
plt.scatter(x_values,y_values,c='white',edgecolor='green',s=1000)
'''
還可以使用RGB模式,向引數c傳遞一個元組,包含三個0-1之間的小數,
他們分別代表紅綠藍的份量,越接近0,顏色越深,越接近1,顏色越淺
c=(0,0,0.8),代表淡藍色
'''
#設定標題
plt.title('Square Numbers',fontsize=24)
plt.xlabel('Value',fontsize=14)
plt.ylabel('Square of Value',fontsize=14)
#設定刻度的大小,both代表xy同時設定
plt.tick_params(axis='both',labelsize=14)
#設定座標軸的取值範圍
plt.axis([0,11,-20,110])
#plt.savefig('images\squares_plot1.png')
plt.show()

4、顏色對映(colormap)是一系列顏色,從起始顏色漸變到結束顏色。

#根據每個點的Y值來設定顏色對映
x_values = list(range(1,11))
y_values = [x**2 for x in x_values]
'''引數c設定成Y值列表,代表各點的先後順序,使用引數camp告訴
pyplot使用什麼顏色對映,s為點的大小
'''
plt.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Reds,
            edgecolor='green',s=1000)
plt.title('Square Numbers',fontsize=24)
plt.xlabel('Value',fontsize=14)
plt.ylabel('Square of Value',fontsize=14)
plt.tick_params(axis='both',labelsize=14)
plt.axis([0,11,-20,110])
#savefig()自動儲存圖表,第二個引數表示刪除圖表多餘的空白區域
plt.savefig('images\squares_plot2.png',bbox_inches='tight')
plt.show()

5、pygal.Bar() 可縮放的直方圖

randint(1,5) 從一個區間隨機返回一個數,包括兩端的數
hist = pygal.Bar() 定義直方圖類
hist.x_labels=[]  設定X軸刻度
hist.x_title='' X軸標題
hist.y_title='' Y軸標題
hist.add(' ',[]) 繪製直方圖,''內為圖表標題
hist.render_to_file('') 儲存到資料夾
#pygal模組:建立可縮放的向量圖形檔案(.svg)
import pygal
from random import randint
class Die():
    def __init__(self,num_sides=6):
        self.num_sides = num_sides
    def roll(self):
        '''函式randint()返回一個區間的任意數值'''
        return randint(1,self.num_sides)
#建立一個6面骰子,搖1000次,將結果存在列表中
die_1 = Die()
die_2 = Die(10)
results = [die_1.roll() + die_2.roll() for roll_num in range(5000)]
#分析每一種結果的出現頻率,存在一個列表中
max_result = die_1.num_sides + die_2.num_sides
frequencies = [results.count(value) for value in range(2,max_result+1)]
#對結果進行視覺化,hist:頻數直方圖
hist = pygal.Bar()
hist.x_labels = list(range(2,max_result+1,1))#x軸刻度
hist.x_title = 'Result' # 標題
hist.y_title = 'Freqency of Rsult'
#add()向它傳遞一個指定的標籤,一個列表,包含將出現在圖表中的值
hist.add('D6 + D10',frequencies)
hist.render_to_file('images\hist.svg')

6、隨機漫步

choice([])從列表中隨機輸出一個數

figure()用於指定圖表的寬度、高度、解析度和背景色,形參figsize需要指定一個元組,單位為英寸,dpi為解析度,facecolor為視窗邊框顏色

plt.axes().get_xaxis().set_visible(False) 隱藏座標軸

line = pygal.Line() 繪製可縮放的折線圖

import matplotlib.pyplot as plt
import pygal
from random import choice
class RandomWalk():
    '''一個生成隨機漫步資料的類'''
    def __init__(self,num_points):
        self.num_points = num_points
        #所有的隨機漫步都始於(0,0)
        self.x_values = [0]
        self.y_values = [0]
    def get_step(self):
        direction = choice([1, -1])  # 隨機選擇向左向右兩個方向
        distance = choice([0, 1, 2, 3, 4, 5, 6, 7, 8])  # 隨機選擇移動的距離
        return direction * distance  # 每次移動的步長
    def fill_walk(self):
        '''定義一個迴圈,直到達到給定的點數'''
        while len(self.x_values) < self.num_points:
            x_step = self.get_step()
            y_step = self.get_step()
            #拒絕原地踏步
            if x_step and y_step == 0:
                continue
            #計算下一個點的xy值,用列表的最後一個值加上步長
            next_x = self.x_values[-1] + x_step
            next_y = self.y_values[-1] + y_step
            self.x_values.append(next_x)
            self.y_values.append(next_y)
rw = RandomWalk(5000)
rw.fill_walk()
#繪製特定視窗尺寸和解析度的隨機漫步散點圖
plt.figure(figsize=(6,6),dpi=128,facecolor='palegreen')
point_numbers = list(range(rw.num_points))
#以顏色對映的方式展示出來,可以看出漫步中各點的先後順序
plt.scatter(rw.x_values,rw.y_values,c=point_numbers,
            cmap=plt.cm.Greens,edgecolor='none',s=1)
#重新繪製第一個和最後一個點,突出顯示
plt.scatter(0,0,c='red',edgecolors='none',s=100)
plt.scatter(rw.x_values[-1],rw.y_values[-1],c='orange',
            edgecolors='none',s=100)
#exes()隱藏座標軸
plt.axes().get_xaxis().set_visible(False)
plt.axes().get_yaxis().set_visible(False)
#plt.savefig(r'images\random_plot1.png')
plt.show()
'''生成隨機漫步折線圖'''
rw = RandomWalk(5000)
rw.fill_walk()
plt.plot(rw.x_values,rw.y_values,color='cyan',linewidth=1)
plt.axes().get_xaxis().set_visible(False)
plt.axes().get_yaxis().set_visible(False)
plt.show()
'''利用pygal實現隨機漫步折線圖'''
lc = RandomWalk(5000)
lc.fill_walk()
line_chart = pygal.Line()
line_chart.x_labels = map(str, range(0, 9))
line_chart.add('random',lc.y_values)
line_chart.render_to_file(r'images\random.svg')