Python數據分析-Kobe Bryan生涯數據讀取及分析
阿新 • • 發佈:2017-05-06
type lag col 導入 csv hot plot 打印 cat
1.將數據(csv格式)導入jupyter
import pandas as pd
import matplotlib.pyplot as plt
filename=‘data.csv‘
raw=pd.read_csv filename
print(raw.shape)
raw.head()#打印前幾行
2.去掉某一列的空值
kobe=raw[pd.notnull(raw[‘shot_made_flag‘])]
print(kobe.shape)
3.用matplotlib畫圖
alpha=0.02#點的透明程度,越小透明度越高
plt.figure(figsize=(10,10))
plt.subplot(121)#一行兩列,第一個
plt.scatter(kobe.loc_x,kobe.loc_y,color=‘blue‘,alpha=alpha)#散點圖
plt.title(‘loc_x and loc_y‘)
plt.subplot(122)#一行兩列,第一個
plt.scatter(kobe.loc_x,kobe.loc_y,color=‘green‘,alpha=alpha)#散點圖
plt.title(‘lat and lon‘)
4.打印唯一值
print(kobe.action_type.unique())
print(kobe.combined_shot_type.unique())
print(kobe.shot_type.unique())
print(kobe.shot_type.value_counts())#相同值出現次數
5.
Python數據分析-Kobe Bryan生涯數據讀取及分析