1. 程式人生 > >談談Python實戰數據可視化之pygal模塊(基礎篇)

談談Python實戰數據可視化之pygal模塊(基礎篇)

chrom org col 6.4 定義 nag .py ini aec

前沿

對於需要在尺寸不同的屏幕上顯示的圖表,請考慮使用Pygal來生成它們,因為它們將自動縮放,以適合觀看者的屏幕,這樣它們在任何設備上顯示時都會很美觀。接下來我會談談pygal模塊生成線、直方圖的基本用法,用書本骰子的案例來更深入了解pygal模塊的使用,對於pygal其他圖形的創建其實方法差不多,實際運用時需要制作哪種圖形就去官網查詢,官網有很多圖形創建的示例代碼,pygal畫廊官網鏈接:http://www.pygal.org/
如下方圖(有圖有代碼,自己打一遍其實懂得也差不多了):
技術分享圖片

pygal繪制線圖

繪制線圖很簡單,需要註意的是最後我們使用render_to_file將這個圖表渲染為一個SVG文件,使用瀏覽器打開SVG文件方可查看生成的圖表。

代碼如下:

# 導入pygal可視化模塊
import pygal

line_chart = pygal.Line()  # 創建一個線圖的實例化對象
line_chart.title = ‘Browser usage evolution (in %)‘  # 設置標題
line_chart.x_labels = map(str, range(2002, 2013))  # 設置X軸標簽,從2002年到2013年
# 下面是添加四條由11個點連成的線
line_chart.add(‘Firefox‘, [None, None, 0, 16.6, 25, 31, 36.4, 45.5, 46.3, 42.8, 37.1])
line_chart.add(‘Chrome‘, [None, None, None, None, None, None, 0, 3.9, 10.8, 23.8, 35.3])
line_chart.add(‘IE‘, [85.8, 84.6, 84.7, 74.5, 66, 58.6, 54.7, 44.8, 36.2, 26.6, 20.1])
line_chart.add(‘Others‘, [14.2, 15.4, 15.3, 8.9, 9, 10.4, 8.9, 5.8, 6.7, 6.8, 7.5])
line_chart.render_to_file(‘bar_chart.svg‘)  # 將圖像保存為SVG文件,可通過瀏覽器查看

運行結果如下:
技術分享圖片

pygal繪制水平線圖

基本用法跟繪制線圖類似,代碼如下:

# 導入pygal可視化模塊
import pygal

line_chart = pygal.HorizontalLine()  # 創建一個水平線圖的實例化對象
line_chart.title = ‘Browser usage evolution (in %)‘  # 設置標題
line_chart.x_labels = map(str, range(2002, 2013))  # 註意,這裏的是水平線圖,那麽X軸就變為Y軸,Y軸變為X軸,所以這裏map返回的值應用於Y軸
# 下面是添加四條由11個點連成的線
line_chart.add(‘Firefox‘, [None, None, 0, 16.6, 25, 31, 36.4, 45.5, 46.3, 42.8, 37.1])
line_chart.add(‘Chrome‘, [None, None, None, None, None, None, 0, 3.9, 10.8, 23.8, 35.3])
line_chart.add(‘IE‘, [85.8, 84.6, 84.7, 74.5, 66, 58.6, 54.7, 44.8, 36.2, 26.6, 20.1])
line_chart.add(‘Others‘, [14.2, 15.4, 15.3, 8.9, 9, 10.4, 8.9, 5.8, 6.7, 6.8, 7.5])
line_chart.range = [0, 100]  # 設置X軸的範圍
line_chart.render_to_file(‘bar_chart.svg‘)  # 將圖像保存為SVG文件,可通過瀏覽器查看

運行結果如下:
技術分享圖片

pygal繪制直方圖

基本用法跟上面類似,代碼如下:

# 導入pygal可視化模塊
import pygal

frequency = [10, 20, 30, 40, 50, 60]
bar = pygal.Bar()  # 創建一個直方圖的實例化對象
bar.title = ‘test‘  # 設置標題
bar.x_labels = [‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘]
bar.x_title = "Result"
bar.y_title = "Frequency of Result"

bar.add(‘D‘, frequency)
bar.render_to_file(‘bar_chart.svg‘)  # 將圖像保存為SVG文件,可通過瀏覽器查看

運行結果如下:
技術分享圖片

使用Pygal模擬擲一個骰子

完成這個擲骰子項目需要以下幾步:
1.創建Die骰子類來模擬人類擲骰子的過程
2.將每次擲骰子後的點數,還有點數對應出現的次數分別保存在results和frequencies列表中
3.根據第二步獲取的數據results和frequencies列表來繪制直方圖
代碼如下:
(1)創建Die骰子類來模擬人類擲骰子的過程
在工程目錄下創建一個die.py文件,文件代碼如下:

from random import randint

class Die:
    def __init__(self, num_sides=6):
        """骰子默認為6面,也可以自定義面數"""
        self.num_sides = num_sides

    def roll(self):
        """返回一個1到骰子面數之間的隨機值來模擬人擲骰子的結果值"""
        return randint(1, self.num_sides)

(2)將數據保存到results和frequencies列表中,並根據數據使用Pygal來繪制直方圖
在工程目錄下創建一個dice_visual.py文件,代碼如下:

# 下面是擲一個六面骰子的案例
from die import Die
import pygal

# 實例化一個Die類對象
die = Die()

results = []
for roll_num in range(1000):
    result = die.roll()  # 調用實例化對象的roll方法隨機生成一個數字,在1-6之間的數字模擬擲骰子
    results.append(result)  # 將結果放入results列表
frequencies = []
# 將實驗的結果數據統計出每個數字出現的次數
for value in range(1, die.num_sides + 1):
    frequency = results.count(value)
    frequencies.append(frequency)

# 繪制直方圖
# 實例化一個bar對象,對該對象的title、x_labels、x_title、y_title屬性設置相當於在直方圖設置。
hist = pygal.Bar()
hist.title = "Results of rolling one D6 1000 times"
hist.x_labels = [‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘, ‘6‘]
hist.x_title = "Result"
hist.y_title = "Frequencies of result"

hist.add(‘D6‘, frequencies)
hist.render_to_file(‘die_visual.svg‘)

運行結果如下:
技術分享圖片
從上面的圖表可以看出,擲一個D6骰子,每個點數出現的可能性接近相等,若擲骰子的次數更大, 那麽每個點數出現的概率就越接近於6分之1.

使用Pygal模擬擲兩個骰子

前面的案例是擲一個骰子,較為簡單。這次案例是擲兩個骰子,獲取的點數更多,結果分布情況也不同。我們創建兩個骰子,以模擬同時擲兩個骰子的情況,每次擲兩個骰子時,我們都將兩個骰子的點數相加,並將結果存儲在results中。最後,利用Pygal模塊繪制直方圖。
修改dice_visual.py文件代碼如下:

# 下面是擲兩個六面骰子的案例
from die import Die
import pygal

# 實例化兩個個Die類對象
die_1 = Die()
die_2 = Die()

results = []
for roll_num in range(1000):
    result = die_1.roll() + die_2.roll()  # 將兩次模擬擲骰子的值相加
    results.append(result)  # 將結果放入results列表
frequencies = []
max_result = die_1.num_sides + die_2.num_sides
# 將實驗的結果數據統計出每個數字出現的次數
for value in range(2, max_result + 1):  # 兩個骰子相加最小也是2
    frequency = results.count(value)
    frequencies.append(frequency)

# 繪制直方圖
# 實例化一個bar對象,對該對象的title、x_labels、x_title、y_title屬性設置相當於在直方圖設置。
hist = pygal.Bar()
hist.title = "Results of rolling two D6 dice 1000 times"
hist.x_labels = list(range(2, max_result + 1))
hist.x_title = "Result"
hist.y_title = "Frequencies of result"

hist.add(‘D6 + D6‘, frequencies)
hist.render_to_file(‘dice_visual1.svg‘)

運行結果如下:
技術分享圖片
從上面的圖表可以看出擲兩個D6骰子,總點數為2或12的可能性最小,而總點數為7的可能性最大,這是因為在6種情況(1和6,2和5,3和4,4和3,5和2,6和1)下得到的總點數都為7。

使用Pygal模擬擲兩個面數不同的骰子

下面創建一個6面骰子和10面骰子,然後同時擲兩個骰子50000次。
再次修改dice_visual.py文件代碼如下:

# 下面是擲兩個面數不同的骰子案例
from die import Die
import pygal

# 實例化兩個Die類對象
die_1 = Die()
die_2 = Die(10)  # 註意這裏傳入10

results = []
for roll_num in range(50000):
    result = die_1.roll() + die_2.roll()
    results.append(result)  # 將結果放入results列表
frequencies = []
max_result = die_1.num_sides + die_2.num_sides
# 將實驗的結果數據統計出每個數字出現的次數
for value in range(2, max_result + 1):
    frequency = results.count(value)
    frequencies.append(frequency)

# 繪制直方圖
# 實例化一個bar對象,對該對象的title、x_labels、x_title、y_title屬性設置相當於在直方圖設置。
hist = pygal.Bar()
hist.title = "Results of rolling a D6 and a D10 50,000 times"
hist.x_labels = list(range(2, max_result + 1))
hist.x_title = "Result"
hist.y_title = "Frequencies of result"

hist.add(‘D6 + D10‘, frequencies)
hist.render_to_file(‘dice_visual2.svg‘)

運行結果如下:
技術分享圖片

談談Python實戰數據可視化之pygal模塊(基礎篇)