利用python數據分析panda學習筆記之基本功能

阿新 • • 發佈：2017-08-21

數據分析 method 入行整數 -s cnblogs 3.4 style fill

1 重新生成索引如果某個索引值不存在就引入缺失值

1 from pandas import Series,DataFrame
2 import pandas as pd
3 import numpy as np
4 obj=Series([4.5,7.2,-5.3,3.6],index=[‘d‘,‘b‘,‘a‘,‘c‘])
5 obj
6 
7 #重新生成索引
8 obj2=obj.reindex([‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
9 obj2

技術分享

　　a使用method的ffill可以實現前向值填充，效果如下

1 #前向填充
2 obj3=Series([‘blue‘ 
,‘purple‘,‘yellow‘],index=[0,2,4])
3 obj3.reindex(range(6),method=‘ffill‘)

技術分享

　　b:對於dataframe使用reindex可以同時修改行列索引，如果僅傳入一個序列那麽如下

1 frame=DataFrame(np.arange(9).reshape((3,3)),index=[‘a‘,‘c‘,‘d‘],
2                 columns=[‘ohio‘,‘Texas‘,‘california‘])
3 frame

技術分享

1 frame2=frame.reindex([‘a‘,‘b‘,‘c‘,‘d 
‘])
2 frame2

技術分享

　　c：使用colunms重新索引列

1 states=[‘Texax‘,‘Utah‘,‘california‘]
2 frame.reindex(columns=states)

技術分享

　　d:同時插入行列，但是插值只能按行應用

1 #同時對行 列進行重新索引 而插值只能引用到行
2 frame.reindex(index=[‘a‘,‘b‘,‘c‘,‘d‘],method=‘ffill‘,
3               columns=states)

技術分享

reindex的參數說明如下：

技術分享

2 丟棄制定軸上的項

　　a:drop方法返回一個指定軸上刪除了指定值的新對象，刪除列c

1 #丟棄指定軸的項
2 obj=Series(np.arange(5.),index=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
3 new_obj=obj.drop(‘c‘)
4 new_obj

技術分享

　　b：刪除兩個 b c

obj.drop([‘d‘,‘c‘])

技術分享

　　c：對於dataframe可以刪除任意軸上的索引

1 #對於DataFrame可以刪除任意軸的索引
2 data = DataFrame(np.arange(16).reshape((4,4)),
3                  index=[‘ohio‘,‘colorado‘,‘utah‘,‘new york‘],
4                    columns=[‘one‘,‘two‘,‘three‘,‘four‘])
5 #刪除兩個
6 data.drop([‘colorado‘,‘ohio‘])

技術分享

3 索引，選取和過濾

　　a:Series中的索引類似與Numpy，但是不只是整數，索引字符

1 obj=Series(np.arange(4.),index=[‘a‘,‘b‘,‘c‘,‘d‘])
2 obj[‘b‘]#1.0

技術分享

　　b：按照整數，範圍

1 obj[1]#1.0
2 obj[2:4]# 2 3

技術分享

　　c：利用標簽的切片運算和普通depython切片不同，其包含末端

1 obj[‘b‘:‘c‘]#b c 1 2

技術分享

　　d：那麽對dataframe進行索引就是獲取一個或者多個列勒

1 data=DataFrame(np.arange(16).reshape(4,4),
2            index=[‘ohio‘,‘colorado‘,‘mike‘,‘jason‘],
3                  columns=[‘one‘,‘two‘,‘three‘,‘four‘])
4 data

技術分享

　　e：選擇一列

data[‘two‘]#輸出第二列+行號 也就是索引

技術分享

　　f：選擇多列

1 data[[‘three‘,‘one‘]]

技術分享

　　g：選取行標簽前兩行

data[:2]#選取的是前面兩行

技術分享

　　h：選取第三列大於5的值

data[data[‘three‘]>5]

技術分享

　　i：為了能在dataframe的行上進行標簽索引引入字段ix

data.ix[‘colorado‘,[‘two‘,‘three‘]]

技術分享

　　j：選取第4 1 2列而且行為colorado jason

data.ix[[‘colorado‘,‘jason‘],[3,0,1]]

技術分享

　　k：輸出行mike

data.ix[2]

技術分享

DataFrame索引總結

技術分享

4 算數運算和數據對齊

　　a:Series的加法

1 s1=Series([7.3,-2.5,3.4,1.5],index=[‘a‘,‘c‘,‘d‘,‘e‘])
2 s2=Series([-2.1,3.6,-1.5,4,3.1],index=[‘a‘,‘c‘,‘e‘,‘f‘,‘g‘])
3 s1+s2

技術分享

　　b:對於dataframe，對齊會同時發生在行列中

df1=DataFrame(np.arange(9.).reshape((3,3)),columns=list(‘bcd‘),
              index=[‘utah‘,‘ohio‘,‘colorado‘])
df2=DataFrame(np.arange(12.).reshape((4,3)),columns=list(‘bde‘),
              index=[‘utah‘,‘ohio‘,‘colorado‘,‘oragen‘])

技術分享

df1+df2

技術分享

------>索引和列都為其並集

　　c：在算術方法中填充值。比如說兩個dataframe相加，其中一個不在的時候填充為0

1 #算術中進行填充
2 df1=DataFrame(np.arange(12.).reshape((3,4)),columns=list(‘abcd‘))
3 df2=DataFrame(np.arange(20.).reshape((4,5)),columns=list(‘abcde‘))
4 df1+df2

技術分享

#使用df1的add方法 傳入df2以及一個fill_value參數
df1.add(df2,fill_value=0)

技術分享

5 DataFrame和Series之間的運算----->廣播，也就是如果第一個數值-1，那麽這個列都會減1

　　a：看一看一個二維數組和一行之間的差

arr=np.arange(12.).reshape((3,4))

技術分享

arr[0]

技術分享

arr-arr[0]

技術分享

　　b:frame和series的運算

frame=DataFrame(np.arange(12.).reshape((4,3)),columns=list(‘bde‘),
                index=[‘utah‘,‘ohio‘,‘texas‘,‘orogen‘])
series=frame.ix[0]

技術分享

frame-series

技術分享

好了，加油騷年！！！！

利用python數據分析panda學習筆記之基本功能

數據分析 method 入行整數 -s cnblogs 3.4 style fill 1 重新生成索引如果某個索引值不存在就引入缺失值 1 from pandas import Series,DataFrame 2 import pandas as pd 3 im

python數據分析入門學習筆記兒

rip help cat app run 復雜 bsp 真的 parser 學習利用python進行數據分析的筆記兒&下星期二內部交流會要講的內容，一並分享給大家。博主粗心大意，有什麽不對的地方歡迎指正~還有許多尚待完善的地方，待我一邊學習一邊完善~ 前言：各種和

《利用python進行數據分析》學習筆記--pandas(1)

索引 eight and dong 改變組成過濾 isnull 學習 pandas主要的兩個數據結構是：Series 和DataFrame 1、Series series 類似於一維數組，由索引+數據組成若不指定索引，則會自動創建0到N-1的整數型索引，可

利用Python數據分析-Numpy和Pands篇

單位另一個 mat transpose 映射文件 nor med mea 隨機書籍《利用Python進行數據分析》 Numpy--數組及矩陣，矢量計算　　1、ndarray多維數組， matrix矩陣　　2、針對整組數據進行快速運算的標準數學（統計）函數，（與lis

《利用Python進行資料分析》學習筆記ch03(4)

這章主要是介紹IPython，但因為我現在一直在用Jupyter，所以結果有些出入，看後續的章節是否還有一些較大的問題，這裡就先將就一下。 1.IPython基礎 import numpy as np from numpy.random import r

Python數據分析與挖掘第一篇—基本介紹及環境搭建

sim python 模塊功能對數 numpy 分析沒有兩種一，數據分析與挖掘簡介　　所謂數據分析，是對已有的數據進行分析，提取一些有價值的信息，比如平均數，標準差等。而數據挖掘，是對大量的信息進行分析和挖掘，得到一些未知的，有價值的信息。如今日頭條類的新聞推送

《利用python進行資料分析》讀書筆記之案例二：全美嬰兒姓名

這份資料包含了從1880到2010年間的嬰兒名字頻率資料，其資料形式是多個txt檔案，且用逗號分隔，可以用pandas.read_csv將其載入到DataFrame中，並且用pandas.concat將所有資料都組裝到一個DataFrame。 years=range

《利用python進行資料分析》讀書筆記之案例一：來自bit.ly的1.usa.gov資料

從網上下來的資料檔案，先讀取檔案中的第一行檢視是什麼資料型別 path="usagov_data.txt" open(path).readline() 結果是：從上面的資料格

python數據分析筆記中panda(2)

log csv code panda imp span 抽取分析 .cn 1 將手機號碼分開為運營商，地區和號碼段 1 from pandas import read_csv; 2 3 df = read_csv("H:\\pythonCode\\4.6

python的數據分析的學習方法

python python數據分析的要求並不是軟件開發的要求，確實，對於一門工具，不同目的的使用者，需要的技能是不一樣的，比如刀這個工具，屠夫用它是殺豬的，廚師用它是切菜的，軍人用它是保家衛國的，客人用它是切牛排的，每個人用的方式都不一樣，對於刀的掌握方法都有特定的要求。 python數

Python學習筆記之基本數據結構方法

ack 字典訪問 mos span 函數返回重復空格不存在通用序列操作：索引，序列中元素從0開始遞增，這些元素可以通過編號訪問分片，使用索引只能訪問單個元素，分片操作可以訪問一定範圍內的元素。list[a:b]：a和b是兩個索引作為邊界，包含索引a對應函數，

[讀書筆記] Python數據分析（一）準備工作

基礎 htm 環境防止功能多維處理工具 ati 增強 1. python中數據結構：矩陣，數組，數據框，通過關鍵列相互聯系的多個表（SQL主鍵，外鍵），時間序列 2. python 解釋型語言，程序員時間和CPU時間衡量，高頻交易系統 3. 全局解釋器鎖GIL，

《Python 數據分析》筆記——pandas

filled 處理追加默認 date ips 變量 style 標準差 Pandaspandas是一個流行的開源Python項目，其名稱取panel data(面板數據)與Python data analysis(Python 數據分析)之意。pandas有兩個重要的數

《Python 數據分析》筆記——數據的檢索、加工與存儲

n) eth 搜索 () numpy where python程序 ase blog 數據的檢索、加工與存儲1.利用Numpy和pandas對CSV文件進行寫操作對CSV文件進行寫操作，numpy的savetxt()函數是與loadtxt()相對應的一個函數，他能以諸如CS

Python數據分析學習-re正則表達式模塊

如果 dal nds 隨機數 choice 而且 inf groups 對象正則表達式為高級的文本模式匹配、抽取、與/或文本形式的搜索和替換功能提供了基礎。簡單地說，正則表達式（簡稱為 regex）是一些由字符和特殊符號組成的字符串，它們描述了模式的重復或者表述多個字

高端實戰 Python數據分析與機器學習實戰 Numpy/Pandas/Matplotlib等常用庫

反向傳播數據讀取初識微信試圖 ada 安裝python 改進貝葉斯課程簡介:? ? 課程風格通俗易懂，真實案例實戰。精心挑選真實的數據集為案例，通過Python數據科學庫numpy,pandas,matplot結合機器學習庫scikit-learn完成一些列的

(轉)Python數據分析之numpy學習

.sh dom cno 數據分析開始 mea union nts 統計函數原文：https://www.cnblogs.com/nxld/p/6058572.html Python模塊中的numpy，這是一個處理數組的強大模塊，而該模塊也是其他數據分析模塊（如pand

Python數據分析之numpy學習

span space 二維數組 ace com shape 圖片 stop 數組運算一.數據分析的概念數據分析,把看似雜亂無序的數據從中提取共同點,總結研究出他們的共同規律數據分析三劍客:Numpy,Pandas,Matplotlib Numpy(N

萌新向Python數據分析及數據挖掘第三章機器學習常用算法第二節線性回歸算法（上）理解篇

機器算法數據挖掘一個函數數量一條直線就是線性回歸理解以a b為變量，預測值與真值的差的平方和為結果的函數參數學習的基本方法：找到最優參數使得預測與真實值差距最小假設可以找到一條直線 y = ax+b 使得預測值與真值的差的平方和最小故事假設你面

Python 數據分析與挖掘的學習路徑

手冊 vpd 工作原理學習交流交流 ESS 早期 otl ges 0.前言很多人反映在學習了Python基礎之後無所適從，不知道下一步往哪走。作為較早期的跨界者（土木狗）深有體會。本文將結合上圖，為後來者指明方向，可作為參考。在此強調：如果打算依靠Python逃離現有

利用python數據分析panda學習筆記之基本功能

相關推薦