1. 程式人生 > >玩轉人工智慧(8)Python機器學習基礎庫、autoML、Apollo2.0介紹

玩轉人工智慧(8)Python機器學習基礎庫、autoML、Apollo2.0介紹

本文前半部分介紹numpy、scipy、matplotlib、pandas、pyTorch等機器學習的基本函式庫。後半部分介紹cloud autoML和autoML Version、以及X度的Apollo 2.0/auto技術。

numpy庫是python中用來處理資料的函式庫,核心是陣列計算。

http://nbviewer.jupyter.org/github/lijin-THU/notes-python/blob/master/03-numpy/03.03-numpy-arrays.ipynb、陣列的方法常用的有陣列求和sum()、陣列求積prod()、求最值函式min()/max()、求最大最小值在陣列中的位置argmin()/argmax()、求陣列均值的函式mean()、標準差std()、將陣列值限定在某個範圍clip()、陣列元素的排序sort()、陣列的形狀函式shape()\reshape()函式、資料轉置函式transpose()、將多維陣列轉換為一維的flatten()、將陣列轉為字串的tastring()、from string()讀出陣列、生成陣列的函式orange()、linespace()、等等。numpy庫的存在大大提高了python陣列矩陣計算的速度,較少了二次開發底層數學運算的工作量。

scipy庫是科學計算的第三方庫,當然以numpy為基礎。該庫提供了一些列科學計算函式,比如高斯函式、插值函式、scipy.stats類中包含了nanmedian()中位數函式、眾數mode()、skew()偏度、kurtosis()峰值函式,正態分佈norm()類、離散pmf()、曲線擬合的函式polyfit()、linregress()的迴歸函式、integrate()的積分運算函式、稀疏矩陣操作函式sparse()、線性代數計算模組linalg模組。

matplotlib庫是python的2D影象包,https://matplotlib.org  這個函式庫比較簡單,用來顯示圖,當然,顯示的前提是在python 中已經繪製了圖片,繪圖函式plot()、顯示影象的函式show()、axis()函式表示座標軸顯示的範圍、subplot()繪製子圖。各種例項如下:

http://nbviewer.jupyter.org/github/lijin-THU/notes-python/blob/master/06-matplotlib/06.10-different-plots.ipynb

pandas庫是python的資料分析庫,可以生產資料、分析資料、產生資料檢視、操作檔案csv、記憶體讀寫等等。最好用的就是時間序列資料生產和分析系列函式。

pandas 中有三種基本結構:

  • Series
    • 1D labeled homogeneously-typed array
  • DataFrame
    • General 2D labeled, size-mutable tabular structure with potentially heterogeneously-typed columns
  • Panel
    • General 3D labeled, also size-mutable array

Series 是一維帶標記的陣列結構,可以儲存任意型別的資料(整數,浮點數,字串,Python 物件等等)。

作為一維結構,它的索引叫做 index,基本呼叫方法為

s = pd.Series(data, index=index)

其中,data 可以是以下結構:

  • 字典
  • ndarray
  • 標量,例如 5

index 是一維座標軸的索引列表。

DataFrame 是 pandas 中的二維資料結構,可以看成一個 Excel 中的工作表,或者一個 SQL 表,或者一個儲存 Series 物件的字典。

DataFrame(data, index, columns) 中的 data 可以接受很多資料型別:

  • 一個儲存一維陣列,字典,列表或者 Series 的字典
  • 2-D 陣列
  • 結構或者記錄陣列
  • 一個 Series
  • 另一個 DataFrame

index 用於指定行的 labelcolumns 用於指定列的 label,如果引數不傳入,那麼會按照傳入的內容進行設定。

小字部分參考官方文件。

當然,python的開源庫相當多,而且隨著時間的推移,越來越多的庫會出現在人們的開發生活中,所以,通過上文的學習總結,我們要學會一種瞭解前沿資訊變化的嗅覺能力,要緊跟變化。這樣長期以往,我們的開發能力和知識儲備才能勉強跟上時代的需求。 後半部分介紹個大眾玩具,希望大家對機器學習有個新的期待吧!文件要介紹的這個玩具叫autoML,谷歌的。

中文簡介:https://yq.aliyun.com/articles/225857  簡單瞭解。 原始文件的路徑:http://slides.com/streguer/automl/fullscreen#/    http://automl.chalearn.org

期待這一天的帶來。希望大家先入為主。

再送大家一點福利,阿波羅2.0,機器學習在無人駕駛方面的應用。





       2017年7 月5 日,百度在首屆 AI 開發者大會宣佈開放 Apollo 自動駕駛平臺以來,受到了社會各界的廣泛關注,更在自動駕駛開發者群體中引發了熱烈反響。

       2017年7月22日舉辦的第73期百度技術沙龍上,百度自動駕駛事業部資深架構師、資料平臺專家楊凡,百度自動駕駛資深架構師何瑋,百度智慧駕駛事業部資深架構師鬱浩三名講師在中關村創業大街車庫咖啡,向參加沙龍的三百多名開發者們深度解析了Apollo平臺與智慧駕駛方案。對自動駕駛技術感興趣的讀者可以留意下。在後面的章節中,我會介紹一些slam方面的東東。

總結:九層高擡起於壘土,牛逼的應用離不開對基礎知識的厚積薄發。