1. 程式人生 > >資料系列教程之numpy( 三)

資料系列教程之numpy( 三)

上週講了資料分析入門的前兩節,numpy庫,今天繼續講該庫的第三節,給大家講下簡單一些學習思路,最近講的numpy和後面要講的pandas兩個庫,都是資料處理方面很強大的庫,學習思路無非就是先了解其資料結構,如何建立其資料結構,比如上面的教程一,建立好後再就是如何獲取你想要的值,比如上面的教程二,我們取完值以後最後要操作處理這些取到的資料,就是今天的教程三,這就是一個主線,圍繞這個思路學習,就會事半功倍,抓住重點知識掌握,儘量少在一些不必要的地方浪費過多時間。

當然其實說實話,我一不是名校畢業,也不是計算機專業,可能跟不少朋友一樣,轉行到python,二從事資料分析時間也不是特別久,講的東西肯定沒有那些專業的老師講的細緻精準有深度,其實找一些系統視訊教程看更會學的更快,但是我個人有寫文章做總結的習慣,鞏固下自己知識的同時,當作一個自己的知識查詢筆記,同時也把自己的一些學習經驗分享給大家,希望大家能多結合一些學習視訊和文章教程,相輔相成學習

1、numpy中數值的修改

簡單建立一個numpy陣列,np.array()方法,想讓第二列和第三列資料改為0,修改數值先取第二列和第三列

在這裡插入圖片描述

當然複習一點知識點,取值的時候,第一個冒號代表取所有行,後面的話,取連續的多列可以也用冒號方法來表示,類似python列表,取不連續的多列用中括號表示,裡面是列的下標

在這裡插入圖片描述

2、numpy中數值的修改(布林索引)

現在問題升級,我要在最先建立的原始df上修改,將小於10的數替換為0,

在這裡插入圖片描述

大家都知道布林代表true和false,這裡叫布林索引,則是因為我們列印df < 10,返回的是true和false的陣列,我們把滿足true的都替換為我們要替換的值

在這裡插入圖片描述

3、numpy中數值的修改(布林索引升級版)

小於等於10的數替換為0,大於10的數替換為20,從最原始的df開始修改

在這裡插入圖片描述

當然還有另外一種三元運算方法,np.where(條件,滿足條件的替換值,不滿足條件的替換值)

在這裡插入圖片描述

4、numpy中nan修改(空值)

用isnan方法判斷是不是nan資料,返回布林值,是空值的話替換

在這裡插入圖片描述

有nan,資料型別變為float,已經不是int型別,可以用dtype檢視資料型別

在這裡插入圖片描述

5、numpy中nan的一些特性

特性:nan不等於nan,nan和任何值計算都是nan

在這裡插入圖片描述