1. 程式人生 > >Pandas學習筆記(1)基本資料型別及屬性

Pandas學習筆記(1)基本資料型別及屬性

Pandas介紹

Python Data Analysis Library即Pandas是基於NumPy 的一種Python資料分析工具包,包含豐富的資料型別和便捷的操作方式。

基本資料型別

Series

對應Python中的列表和NumPy的一維陣列,Series可以指定索引內容,預設索引與Python相同從0開始的整形數

import pandas as pd

s = pd.Series([1,20,33,np.nan,5,66])
print(s)

output:
0     1.0
1    20.0
2    33.0
3     NaN
4     5.0
5    66.0
dtype: float64

可以使用自定義列表作為索引引數,例如時間序列

dates = pd.date_range('20180205',periods=6)
s = pd.Series([1,3,6,np.nan,44,1],index=dates)
print(s)

output:
2018-02-05     1.0
2018-02-06    20.0
2018-02-07    33.0
2018-02-08     NaN
2018-02-09     5.0
2018-02-10    66.0
Freq: D, dtype: float64

之後可以通過索引訪問資料了

s['2018-2-07']

output:33.0

DataFrame

DataFrame提供表格型別的資料結構,相當於矩陣,NumPy裡的二維陣列和Python的字典。和Series同樣的,DataFrame也有索引,包含行索引(index)和列索引(columns)。

DataFrame可以看做是由Series組成的大字典,二者關係類似於列向量和矩陣的關係。

預設索引與Series一致,均從0開始

df = pd.DataFrame(np.arange(12).reshape((3,4)))
print(df)

output:
    0   1   2   3
0   0   1   2   3
1   4   5   6   7
2   8   9   10  11

指定含參索引如下

df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d'])
print(df)

output:              
                 a         b         c         d
2018-02-05  0.350842  0.316069  0.283373 -1.171848
2018-02-06  0.557246 -2.338000  0.743795 -0.332596
2018-02-07 -0.056014  0.714417  2.609023  0.825786
2018-02-08 -0.638557  1.815248 -0.898888  1.120689
2018-02-09 -1.113309  1.315297 -1.694181  0.274465
2018-02-10 -0.640387 -0.098660 -2.717680 -0.017176

可呼叫屬性

  • dtype 檢視每個列的資料型別

  • index 檢視行索引及其資料型別

  • columns 檢視列索引及其資料型別

  • values 以陣列形式返回DataFrame的值(去索引)

  • describe 顯示資料的總結資訊(均值,方差等)

  • transpose DataFrame的轉置

DataFrame類中定義了排序方法

df.sort_index(axis=0,ascending=False)

其中axis=0,代表按行排序,axis=1,代表按列排序
ascending=True代表正序,False代表逆序

還可以採用按值排序的方法

df.sort_values(by='E')

該方法按指定索引的值進行排序

相關推薦

Pandas學習筆記1基本資料型別屬性

Pandas介紹 Python Data Analysis Library即Pandas是基於NumPy 的一種Python資料分析工具包,包含豐富的資料型別和便捷的操作方式。 基本資料型別 Series 對應Python中的列表和NumPy的一維陣

Python學習筆記——1標準資料型別

    最近一直在用python做一些實驗,都是一邊百度一邊寫程式碼,最後程式碼是寫完了,可是回過頭一想,感覺知識很零碎。沒有構成體系,所以決定寫個系列部落格,把一些基礎知識梳理記錄下來,主要是幫助自己加深理解,構建起系統的知識體系,從資料型別開始吧。版本為python3.6

Kotlin學習筆記基本資料型別

Kotlin中常量和變數的定義格式: val相當於java中的final關鍵字,表示該變數是一個常亮,不可修改(型別的宣告可以不寫) var表示一個變數,可以被修改 val 常量名:變數型別

TCP/IP學習筆記1-----基本概念

使用 本機ip 分類 公司 idt intern xtend pen 不用 TCP/IP的起源   在全球各地,各種各樣的電腦運行著各自不同的操作系統一起為大家服務,這些電腦在表達同一種信息的時候所使用的方法是千差萬別。就好像聖經中上帝打亂了各地人的口音,讓他們無法合作

tcp/ip學習筆記1-基本概念

  為什麼會有tcp/ip 在世界上各地,各種各樣的電腦執行著各自不同的作業系統為大家服務,這些電腦在表達同一種資訊的時候所使用的方法是千差萬別。就好像聖經中上帝打亂了各地人的口音,讓他們無法合作一樣。計算機使用者意識到,計算機只是單兵作戰並不會發揮太大的作用。只有把它們聯合起來,電腦才會發

【原創】pygame學習筆記1----基本的線,矩形,圓形,弧形繪製

PYgame的內容 (1)這個module很有意思 (2)書本至少來源於《Python遊戲程式設計入門》 (3)官方權威說明:https://www.pygame.org/docs/   下面的嘗試把各種圖形在一個程式裡繪製 注意點: (1)特別注意,比如引

OpenCV 2.4.9 學習筆記1—— 基本功能結構

一些關於OpenCV(2.4.9版本)的學習筆記,作為記錄,以免自己忘了。 安裝與配置   OpenCV的下載、安裝以及在各個平臺(Windows/Linux等)配置網上有很多的資料,自己就不用存了。需要或者遇到問題的時候再說。 基本模組結構   OpenCV(Open Source Computer

Pandas學習筆記1

一、Pandas的資料結構介紹 >>> from pandas import Series,DataFrame >>> import pandas as pd >>> import numpy as np 1.Serie

SLAM學習筆記1基本概念

  SLAM (simultaneous localization and mapping),也稱為CML (Concurrent Mapping and Localization), 即時定位與地圖構建,或併發建圖與定位。 SLAM最早由Smith、Self和Cheeseman於1988年提出。   SL

JS高級學習筆記1- 基本數據類型

java 數值 賦值 現在 lean evel image number com 原始數據 基本數據類型是一種即非對象也無方法的數據。JS中有6中基本類型:string、number、boolean、undefined、symbol。 多數情況下,基本類型直接代

ECMAScript 學習筆記2--基本類型語法相關

ECMAScript 學習筆記1、變量名區分大小寫; 註意代碼塊的概念。變量分為原始值和引用值:原始值存儲在棧,引用值存儲在堆(引用值一般是一個指針或對象名、函數名)。在C語言中編譯的程序占用的內存分為以下幾個部分:棧區(由系統分配/內存塊連續)、堆區(由程序員分配與釋放或系統結束後釋放/鏈表結構不連續的內存

Python自動化學習筆記——Python資料型別集合set,元組tuple、修改檔案、函式、random常用方法

1.修改檔案的兩種方式 1 #第一種 2 with open('users','a+') as fw: #用a+模式開啟檔案,使用with這種語法可以防止忘記close檔案 3 fw.seek(0) #移動檔案指標到最前面,然後才能讀到內容 4 result=fw.read()

資料結構與演算法 python語言描述》學習筆記————抽象資料型別和Python類

第一部分:學習內容概要 抽象資料型別 Python的類 第二部分:學習筆記 抽象資料型別   1.抽象資料型別(Abstract Data Type,ADT),通過一套介面闡述說明這一程式部分的可用功能,但不不限制功能的實現方法。      2.抽象資料型

Stuts2學習筆記1:環境搭建Demo

原始碼: github: https://github.com/liaotuo/Struts2-Demo/tree/master/struts2-demo 環境搭建 下載struts2 官網下載:http://mirror.bit.edu.cn/apache/struts

Redis學習筆記——Redis資料型別

歡迎訪問:zrxJuly’s Bolg Redis支援5種資料型別: - string:字串 - hash:雜湊 - list:列表 - set: 集合 - zset:有序集合(sorted set) String:字串 string是Red

OpenCV學習筆記3——Scalar資料型別理解

定義: 首先單詞scalar的意思是標量,但是我們經常可以看到Scalar是包含多個值的,很像是一個向量,這是怎麼回事呢?很是讓人感覺困惑。先收起我們的困惑,首先來看看,Scalar的定義: typedef struct Scalar { double val

重拾Java1-基本資料型別與字面值

Java是一種強型別化的語言,每個變數都有一種型別,每個表示式也都有一種型別,並且每一種型別都是嚴格定義的。所有的賦值操作不管是顯式的還是在方法中呼叫中通過引數傳遞的,都要經過型別相容性檢查。 一、基本資料型別 1.1、概述 Java定義了八種基本資料

Python入門筆記2_ 資料型別取整運算 round,floor,ceil

資料型別 1.  資料型別包括整數、浮點、字串,這些大家都很清楚,關於定義這裡不多說。 不過,關於整數浮點計算要多說兩句。先看如下計算 11 / 4 # ==> 2 11.0 / 4

spark快速大資料分析學習筆記1

本文是《spark快速大資料分析學習》第三章學習筆記,文中大量摘抄書中原本,僅為個人學習筆記。 RDD基礎: RDD是一個不可變的分散式物件集合。每個RDD都被分為多個分割槽,這個分割槽執行在叢集的不同節點上。RDD可以包含Python、Java、Scala中任意型別的物件。 建立RDD的方式:

Lua學習筆記1: HelloWorld和資料型別

Lua是一個輕量級的指令碼語言,由c語言編寫,容易嵌入到應用中,深受遊戲開發者的青睞 環境安裝 選用SciTE作為lua的IDE 可以在github找到這個開源的軟體 SciTE下載連結 安裝好之後開啟 環境搭建完成 HelloWorld Fil