Python視覺化庫Matplotlib的使用

一。匯入資料

import pandas as pd
unrate = pd.read_csv('unrate.csv')
unrate['DATE'] = pd.to_datetime(unrate['DATE'])
print(unrate.head(12))

 結果如下：
   DATE  VALUE
0  1948-01-01    3.4
1  1948-02-01    3.8
2  1948-03-01    4.0
3  1948-04-01    3.9
4  1948-05-01    3.5
5  1948-06-01    3.6
6  1948-07-01    3.6
7  1948-08-01    3.9
8  1948-09-01    3.8
9  1948-10-01    3.7
10 1948-11-01    3.8
11 1948-12-01    4.0
二。使用Matplotlib庫

import matplotlib.pyplot as plt
#%matplotlib inline
#Using the different pyplot functions, we can create, customize, and display a plot. For example, we can use 2 functions to :
plt.plot()
plt.show()

結果如下：

三。插入資料

first_twelve = unrate[0:12]
plt.plot(first_twelve['DATE'], first_twelve['VALUE'])
plt.show()

由於x軸過於緊湊，所以使用旋轉x軸的方法結果如下。

plt.plot(first_twelve['DATE'], first_twelve['VALUE'])
plt.xticks(rotation=45)
#print help(plt.xticks)
plt.show()

四。設定x軸y軸說明

plt.plot(first_twelve['DATE'], first_twelve['VALUE'])
plt.xticks(rotation=90)
plt.xlabel('Month')
plt.ylabel('Unemployment Rate')
plt.title('Monthly Unemployment Trends, 1948 
')
plt.show()

五。子圖設定

import matplotlib.pyplot as plt
fig = plt.figure()
ax1 = fig.add_subplot(4,3,1)
ax2 = fig.add_subplot(4,3,2)
ax2 = fig.add_subplot(4,3,6)
plt.show()

六。一個圖示多個曲線。

1.簡單實驗。

unrate['MONTH'] = unrate['DATE'].dt.month
unrate['MONTH'] = unrate['DATE'].dt.month
fig = plt.figure(figsize=(6,3))

plt.plot(unrate[0:12]['MONTH'], unrate[0:12]['VALUE'], c='red')
plt.plot(unrate[12:24]['MONTH'], unrate[12:24]['VALUE'], c='blue')

plt.show()

2.使用迴圈

fig = plt.figure(figsize=(10,6))
colors = ['red', 'blue', 'green', 'orange', 'black']
for i in range(5):
    start_index = i*12
    end_index = (i+1)*12
    subset = unrate[start_index:end_index]
    plt.plot(subset['MONTH'], subset['VALUE'], c=colors[i])
   
plt.show()

3.設定標籤

fig = plt.figure(figsize=(10,6))
colors = ['red', 'blue', 'green', 'orange', 'black']
for i in range(5):
    start_index = i*12
    end_index = (i+1)*12
    subset = unrate[start_index:end_index]
    label = str(1948 + i)
    plt.plot(subset['MONTH'], subset['VALUE'], c=colors[i], label=label)
plt.legend(loc='best')
#print help(plt.legend)
plt.show()

4。設定完整標籤

fig = plt.figure(figsize=(10,6))
colors = ['red', 'blue', 'green', 'orange', 'black']
for i in range(5):
    start_index = i*12
    end_index = (i+1)*12
    subset = unrate[start_index:end_index]
    label = str(1948 + i)
    plt.plot(subset['MONTH'], subset['VALUE'], c=colors[i], label=label)
plt.legend(loc='upper left')
plt.xlabel('Month, Integer')
plt.ylabel('Unemployment Rate, Percent')
plt.title('Monthly Unemployment Trends, 1948-1952')

plt.show()

七。折線圖（某電影評分網站）

1.讀取資料

import pandas as pd
reviews = pd.read_csv('fandango_scores.csv')
cols = ['FILM', 'RT_user_norm', 'Metacritic_user_nom', 'IMDB_norm', 'Fandango_Ratingvalue', 'Fandango_Stars']
norm_reviews = reviews[cols]
print(norm_reviews[:10])

2.設定說明

num_cols = ['RT_user_norm', 'Metacritic_user_nom', 'IMDB_norm', 'Fandango_Ratingvalue', 'Fandango_Stars']
bar_heights = norm_reviews.ix[0, num_cols].values
bar_positions = arange(5) + 0.75
tick_positions = range(1,6)
fig, ax = plt.subplots()

ax.bar(bar_positions, bar_heights, 0.5)//ax.bar繪製折線圖，bar_positions繪製離遠點的距離，0.5繪製離折線圖的寬度。
ax.set_xticks(tick_positions)
ax.set_xticklabels(num_cols, rotation=45)//橫軸的說明 旋轉45度 橫軸說明

ax.set_xlabel('Rating Source')
ax.set_ylabel('Average Rating')
ax.set_title('Average User Rating For Avengers: Age of Ultron (2015)')
plt.show()

3.旋轉x軸 y軸

import matplotlib.pyplot as plt
from numpy import arange
num_cols = ['RT_user_norm', 'Metacritic_user_nom', 'IMDB_norm', 'Fandango_Ratingvalue', 'Fandango_Stars']

bar_widths = norm_reviews.ix[0, num_cols].values
bar_positions = arange(5) + 0.75
tick_positions = range(1,6)
fig, ax = plt.subplots()
ax.barh(bar_positions, bar_widths, 0.5)

ax.set_yticks(tick_positions)
ax.set_yticklabels(num_cols)
ax.set_ylabel('Rating Source')
ax.set_xlabel('Average Rating')
ax.set_title('Average User Rating For Avengers: Age of Ultron (2015)')
plt.show()

八。散點圖

1。基本散點圖

fig, ax = plt.subplots()
ax.scatter(norm_reviews['Fandango_Ratingvalue'], norm_reviews['RT_user_norm'])
ax.set_xlabel('Fandango')
ax.set_ylabel('Rotten Tomatoes')
plt.show()

2.拆分散點圖

#Switching Axes
fig = plt.figure(figsize=(5,10))
ax1 = fig.add_subplot(2,1,1)
ax2 = fig.add_subplot(2,1,2)
ax1.scatter(norm_reviews['Fandango_Ratingvalue'], norm_reviews['RT_user_norm'])
ax1.set_xlabel('Fandango')
ax1.set_ylabel('Rotten Tomatoes')
ax2.scatter(norm_reviews['RT_user_norm'], norm_reviews['Fandango_Ratingvalue'])
ax2.set_xlabel('Rotten Tomatoes')
ax2.set_ylabel('Fandango')
plt.show()

Ps:還是呈現很強的相關性的，基本呈直線分佈

九。直方圖

1.讀入資料

import pandas as pd
import matplotlib.pyplot as plt
reviews = pd.read_csv('fandango_scores.csv')
cols = ['FILM', 'RT_user_norm', 'Metacritic_user_nom', 'IMDB_norm', 'Fandango_Ratingvalue']
norm_reviews = reviews[cols]
print(norm_reviews[:100])

2.統計評分個數

fandango_distribution = norm_reviews['Fandango_Ratingvalue'].value_counts()//統計
fandango_distribution = fandango_distribution.sort_index()//排序

imdb_distribution = norm_reviews['IMDB_norm'].value_counts()
imdb_distribution = imdb_distribution.sort_index()

print(fandango_distribution)
print(imdb_distribution)

3.畫直方圖

fig, ax = plt.subplots()
#ax.hist(norm_reviews['Fandango_Ratingvalue'])
#ax.hist(norm_reviews['Fandango_Ratingvalue'],bins=20)
ax.hist(norm_reviews['Fandango_Ratingvalue'], range=(4, 5),bins=20)//劃分的區間20個，只統計4-5區間的bins
plt.show()

4.不同的媒體評分圖

fig = plt.figure(figsize=(5,20))
ax1 = fig.add_subplot(4,1,1)
ax2 = fig.add_subplot(4,1,2)
ax3 = fig.add_subplot(4,1,3)
ax4 = fig.add_subplot(4,1,4)
ax1.hist(norm_reviews['Fandango_Ratingvalue'], bins=20, range=(0, 5))
ax1.set_title('Distribution of Fandango Ratings')
ax1.set_ylim(0, 50)

ax2.hist(norm_reviews['RT_user_norm'], 20, range=(0, 5))
ax2.set_title('
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    Python視覺化庫Matplotlib的使用
      
                一。匯入資料import pandas as pd
unrate = pd.read_csv('unrate.csv')
unrate['DATE'] = pd.to_datetime(unrate['DATE'])
print(unrate.head(12)) 結果如下：  

  
 

    

    
    Python視覺化庫matplotlib庫各種圖demo
      
							
							
							關聯分析、數值比較：散點圖、曲線圖
分佈分析：灰度圖、密度圖
涉及分類的分析：柱狀圖、箱式圖


核密度估計（Kernel density estimation），是一種用於估計概率密度函式的非引數方法，採用平滑的峰值函式(“核”)來擬合觀察到的資料點，從而對真 

  
 

    

    
    Python視覺化庫 python視覺化--matplotlib
       轉自小小蒲公英原文用Python視覺化庫 
現如今大資料已人盡皆知，但在這個資訊大爆炸的時代裡，空有海量資料是無實際使用價值，更不要說幫助管理者進行業務決策。那麼資料有什麼價值呢？用什麼樣的手段才能把資料的價值直觀而清晰的表達出來？答案是要提供像人眼一樣的直覺的、互動的和反應靈敏的視覺化環境。資料 

  
 

    

    
    Python視覺化中Matplotlib(4.三種設定樣式方法、設定座標刻度以及標籤、設定顯示出特殊字元)
       
 
 1.三種設定方式 
   (1)向方法傳入關鍵字引數 上一節已經總結過，一直在使用 
   （2）對例項使用一系列的setter方法 
           具體的方法直接看程式碼  
 import matplotli 

  
 

    

    
    Python視覺化中Matplotlib(3.線條的詳細樣式及線性、儲存圖片、plot的詳細風格和樣式)、背景色、點和線的詳細設定
       
 
 1.修改線條的樣式： linestyle、color、marker(標記) 
 '''
    顏色  color:修改顏色，可以簡寫成c
    樣式  linestyle='--' 修改線條的樣式 可以簡寫成 ls
    標註  marker : 標註
    線寬  linewidth: 設 

  
 

    

    
    Python視覺化中Matplotlib繪圖(2.設定範圍、標籤、標題、圖例(詳細引數))
       
 
 1.為繪製的圖新增範圍 
 import matplotlib.pyplot as plt   # 匯入繪圖模組
import numpy as np               #  匯入需要生成資料的numpy模組
'''新增範圍'''
y = np.arange(0,10,1)
plt.plo 

  
 

    

    
    視覺化庫-Matplotlib-盒圖(第四天)
      盒圖由五個數值點組成，最小觀測值，下四分位數，中位數，上四分位數，最大觀測值 
IQR = Q3 - Q1 　Q3表示上四分位數， Q1表示下四分位數，IQR表示盒圖的長度 
最小觀測值 min =Q1 - 1.5*IQR 
最大觀測值 max=Q3 + 1.5*IQR  ， 大於最大值或 

  
 

    

    
    視覺化庫-Matplotlib-直方圖(第四天)
      1.plt.hist(array, bins, color)  # array表示數值， bins表示的是bin的範圍 
 
 data = np.random.normal(0, 20, 1000)
# 畫出bins值
bins = np.arange(-100, 100, 5)
plt.hist 

  
 

    

    
    視覺化庫-Matplotlib-散點圖(第四天)
      1. 畫基本的散點圖 plt.scatterdata[:, 0], data[:, 1], marker='o', color='r', label='class1', alpha=0.4) 
np.random.multivariate_normal 根據均值和協方差生成多行列表 
 
 mu_vec1 = 

  
 

    

    
    視覺化庫-Matplotlib-3D圖(第四天)
      1. 畫三維圖片圖 axes = Axes3D(fig)這一步將二維座標轉換為三維座標，axes.plot_surface() 
 
 import matplotlib.pyplot as plt
import numpy as np
from mpl_toolkits.mplot3d import Axe 

  
 

    

    
    【python視覺化一Matplotlib 繪製】視覺化圖片中顯示中文
       
 
  
  
 # ----------------------顯示中文----神奇般的存在----------------
from pylab import *
mpl.rcParams['font.sans-serif'] = ['SimHei']
# ---------------------- 

  
 

    

    
    高效使用 Python 視覺化工具 Matplotlib
      

        
		Matplotlib是Python中最常用的視覺化工具之一,可以非常方便地建立海量型別的2D圖表和一些基本的3D圖表。本文主要介紹了在學習Matplotlib時面臨的一些挑戰，為什麼要使用Matplotlib，並推薦了一個學習使用Matplotlib的步驟。
簡介
對於新手來說 

  
 

    

    
    視覺化庫----Matplotlib+Pandas高階篇及應用
      
							
							
							






以下文件的原始檔，我做成網頁了，可以直接點選這裡

一、柱狀圖詳解



import matplotlib.pyplot as plt
import numpy as np
plt.rcParams["font.sans-serif"]=['Si 

  
 

    

    
    Python數據可視化庫-Matplotlib
      img   use   class   一個   pri   style   randint   degree   spl   折線圖繪制：


import pandas as pd
unrate = pd.read_csv(‘unrate.csv‘)
unrate[‘DATE‘] = pd.to_date 

  
 

    

    
    python視覺化互動庫dash
       
 
  
  
 R有shiny，應該是非常好用的，python像shiny的互動視覺化的庫不多，dash其中之一，簡單實用，但整體似乎還不如shiny。 
 1安裝 
 pip install dash

pip install dash-renderer

pip install dash-html- 

  
 

    

    
    Python視覺化中的Matplotlib(6.散點圖以及詳細引數、為圖形新增文字、註釋、箭頭以及它們的引數)
       
 
 1. 散點圖   
      散點圖需要兩個引數x,y , 但此時，x不是表示x軸的刻度，而是每個點的橫軸座標！ 
    散點圖 scatter() 引數說明： 
         &n 

  
 

    

    
    Python視覺化中的Matplotlib(5.直方圖、條形圖以及餅圖的用法和詳細的引數)
       
 
 1.  直方圖   hist() 
      直方圖的引數只有一個X 
 import matplotlib.pyplot as plt  # 匯入繪圖模組
import numpy as np  # 匯入需要生成資料的numpy模組
' 

  
 

    

    
    Python視覺化中的Matplotlib繪圖(1.畫圖,網格,子圖,畫正餘弦圖,座標軸界限,畫圓,)
       
 
 1.一張基本的圖示包含的元素； 
    · x軸和y軸 以及他們的刻度線 、標籤、繪圖區域 
 import matplotlib.pyplot as plt   # 匯入繪圖模組
import numpy as np               #  匯入需要生成資料的num 

  
 

    

    
    智聯Python相關職位的資料分析及視覺化-Pandas&Matplotlib篇       python
      
							
							
							Numpy（Numerical Python的簡稱）是Python科學計算的基礎包。它提供了以下功能：
快速高效的多維陣列物件ndarray。
用於對陣列執行元素級計算以及直接對陣列執行數學運算的函式。
用於讀寫硬碟上基於陣列的資料集的工具。
線性代數運算、傅立 

  
 

    

    
    Python資料視覺化之matplotlib實踐chapter-01
       
 
 """
Example  1.3.1:
函式plot()

"""

import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(0.05,10,1000)    # x = 0.05到10的等間距1000個點
y = np