Python Dataframe遍歷，刪除，初始化操作

阿新 • • 發佈：2018-11-17

建立一個DataFrame，它有幾種建立方式：

列表，序列(pandas.Series), numpy.ndarray的字典
二維numpy.ndarray
別的DataFrame
結構化的記錄(structured arrays)
其中，我最喜歡的是通過二維ndarray建立DataFrame，因為程式碼敲得最少：

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(3, 4))
df
0 1 2 3
0 0.236175 -0.394792 -0.171866 0.304012
1 0.651926 0.989046 0.160389 0.482936
2 -1.039824 0.401105 -0.492714 -1.220438

當然你還可以參考我的這篇文章從mysql資料庫或者csv檔案中載入資料到dataframe。
dataframe中index用來標識行，column標識列，shape表示維度。

df.index
df.columns
df.shape

通過describe方法，我們可以對df中的資料有個大概的瞭解：

df.describe()
0 1 2 3
count 3.000000 3.000000 3.000000 3.000000
mean -0.050574 0.331786 -0.168064 -0.144496
std 0.881574 0.694518 0.326568 0.936077
min -1.039824 -0.394792 -0.492714 -1.220438
25% -0.401824 0.003156 -0.332290 -0.458213
50% 0.236175 0.401105 -0.171866 0.304012
75% 0.444051 0.695076 -0.005739 0.393474
max 0.651926 0.989046 0.160389 0.482936

資料select, del, update。

按照列名select:


df[0]
 
0 0.236175
1 0.651926
2 -1.039824

按照行數select:

df[:3] #選取前3行
按照索引select:

df.loc[0]
 
0 0.236175
1 -0.394792
2 -0.171866
3 0.304012

按照行數和列數select:

df.iloc[3] #選取第3行
df.iloc[2:4] #選取第2到第3行
df.iloc[0,1] #選取第0行1列的元素
dat.iloc[:2, :3] #選取第0行到第1行，第0列到第2列區域內的元素
df1.iloc[[1,3,5],[1,3]] #選取第1，3，5行，第1，3列區域內的元素

刪除某列：

del df[0]
df
1 2 3
0 -0.394792 -0.171866 0.304012
1 0.989046 0.160389 0.482936
2 0.401105 -0.492714 -1.220438

刪除某行：

df.drop(0)
 
1 2 3
1 0.989046 0.160389 0.482936
2 0.401105 -0.492714 -1.220438

運算。

基本運算：

df[4] = df[1] + df[2]
 
1 2 3 4
0 -0.394792 -0.171866 0.304012 -0.566659
1 0.989046 0.160389 0.482936 1.149435
2 0.401105 -0.492714 -1.220438 -0.091609

map運算，和python中的map有些類似：

df[4].map(int)
0 0
1 1
2 0

apply運算：

df.apply(sum)
 
1 0.995359
2 -0.504192
3 -0.433489
4 0.491167

Group by 操作。

pandas中的group by 操作是我的最愛，不用把資料匯入excel或者mysql就可以進行靈活的group by 操作，簡化了分析過程。

df[0] = ['A', 'A', 'B']
df
 
1 2 3 4 0
0 -0.394792 -0.171866 0.304012 -0.566659 A
1 0.989046 0.160389 0.482936 1.149435 A
2 0.401105 -0.492714 -1.220438 -0.091609 B
 
g = df.groupby([0])
 
g.size()
 
A 2
B 1
 
g.sum()
 
1 2 3 4
0
A 0.594254 -0.011478 0.786948 0.582776
B 0.401105 -0.492714 -1.220438 -0.091609

groupby選擇列和迭代
g = df.groupby(df['artist_id'])
gsize=g.size()
aa=g.sum()

匯出到csv檔案

dataframe可以使用to_csv方法方便地匯出到csv檔案中，如果資料中含有中文，一般encoding指定為”utf-8″,否則匯出時程式會因為不能識別相應的字串而丟擲異常，index指定為False表示不用匯出dataframe的index資料。

df.to_csv(file_path, encoding='utf-8', index=False)

作者：Deep_IT
來源：CSDN
原文：https://blog.csdn.net/wang4959520/article/details/51087957
版權宣告：本文為博主原創文章，轉載請附上博文連結！

Python Dataframe遍歷，刪除，初始化操作

建立一個DataFrame，它有幾種建立方式：列表，序列(pandas.Series), numpy.ndarray的字典二維numpy.ndarray 別的DataFrame 結構化的記錄(structured arrays) 其中，我最喜歡的是通過二維ndarray建立DataF

python 遍歷，刪除，複製資料夾下所有檔案

import os def files_and_dirs_list(dir_path): """ 遍歷資料夾及資料夾下所有檔案（包括資料夾） :param dir_path: 資料夾路徑 :return: root 所指的是當前正在遍歷的這個資料

集合遍歷過程iterator，添加刪除元素報異常

exc asn 一致性使用遍歷 one mov exceptio 刪除 list set 遍歷過程中添加或者刪除元素，報異常。使用iterator 也會報異常 ConcurrentModificationException remove只能用叠代器的remov

python無限遍歷，實現在多維嵌套字典、列表、元組的JSON中獲取數據

發現多維自身 argument 可能嵌套列表自動 bing 後來接口返回json數據中可能嵌套列表，列表內又嵌套字典的情況，接口自動化過程中需要通過一個key值直接獲取到對應的value，所以有了下面的函數不多說，上代碼： #! /usr/bin/pytho

單鏈表的建立，插入，刪除，遍歷

1 #include<stdio.h> 2 #include<iostream> 3 #include<malloc.h> 4 #define OK 1 5 #define ERROR 0 6 using namespace std; 7

單鏈表的創建，插入，刪除，遍歷

遍歷 clas 創建 delete can i++ info def 尾指針 1 #include<stdio.h> 2 #include<iostream> 3 #include<malloc.h> 4 #define

C++|STL學習筆記-map的基本操作（插入，刪除，遍歷，大到小輸出）【仿大佬寫法】

首先的程式碼是插入，刪除，遍歷執行截圖如下：原始碼如下： #include <map> #include <iostream> #include <algorithm> using namespace std; typedef pair

給定一個字串，刪除字串中所有的b和ac組合，要求：字串只遍歷一次，且不能使用額外的空間

string = 'aaascsscc' ls = list(string) def isA(ls): i = 0 while i < len(ls): if ls[i] == 'b': ls.pop(i) if i &g

資料結構--C語言--逆序建立單鏈表，遍歷單鏈表，在單鏈表第5個元素前插入一個值為999的元素，刪除單鏈表第5個元素

#include<stdio.h> #include<stdlib.h> #define OK 1 #define ERROR 0 #define LEN sizeof(struct LNode) struct LNode{ int data; struct LNode

初識go語言之陣列與切片（建立，遍歷，刪除，插入，複製）

1、陣列 go語言的陣列與其他語言的資料定義基本類似：大小確定，記憶體連續，可以隨機訪問。陣列的元素使用操作符[]來索引。首元素是array[0]，最後一個元素是array[len(array)-1]。 1.1陣列的建立陣列的建立有下面三種方式 [length]T

AVL樹C++實現（插入，刪除，查詢，清空，遍歷操作）

AVL.h檔案程式碼 #pragma once #include<iostream> #include<stack> #include <assert.h> using namespace std; using namespace std; template<cl

新手上路，勿噴。C++連結串列的建立，遍歷，刪除，插入等等

//list.h #pragma once template<typename T>class slistNode { public: slistNode() { next = nullptr; cout << "呼叫了slistnode的建構函式

單鏈表的建立，節點的插入，刪除，遍歷（未完善版）

#include <stdio.h> #include <stdlib.h> #define OK 1 #define ERROR 0 typedef int ElemType; typedef int Status; typedef struct Lin

二叉搜尋樹的基本操作 ---- 插入，刪除，查詢，銷燬，遍歷

首先來看看二叉搜尋樹的概念二叉搜尋樹又稱二叉排序樹，它或者是一棵空樹，或者是具有以下性質的二叉樹若它的左子樹不為空，則左子樹上所有節點的值都小於根節點的值若它的右子樹不為空，則右子樹上所有節點的值都大於根節點的值它的左右子樹也分別為二叉搜尋樹

二叉搜尋樹的插入，刪除，遍歷操作詳解

TreeNode* findNodeInSearchBT(TreeNode*root, int k, TreeNode**pa = nullptr) { //這裡是不需要進行null判斷的，因為後面隱式的判斷了是否為null while (root != nullptr) { if (k >

c++ 搜尋二叉樹插入，刪除，遍歷操作

搜尋二叉樹是一種具有良好排序和查詢效能的二叉樹資料結構，包括多種操作，本篇只介紹插入，排序（遍歷），和刪除操作，重點是刪除操作比較複雜，用到的例子也是本人親自畫的用到的測試圖資料例子第一、構建節點 1 template <typename T> class B

list遍歷的時候，刪除某個符合條件的元素

　　印象中迴圈刪除list中的元素使用for迴圈的方式是有問題的，但是可以使用增強的for迴圈，然後今天在使用時發現報錯了，然後去科普了一下，再然後發現這是一個誤區。下面就來講一講。。伸手黨可直接跳至文末。看總結。。　　JAVA中迴圈遍歷list有三種方式for迴圈、增強for迴圈（也就是常說的forea

二叉排序樹的基本操作（建立，中序遍歷，查詢，刪除，插入）

分析：二叉排序樹的操作的難點在於刪除操作，刪除操作時，只需要滿足二叉排序樹的性質即可，即需要找到要刪除結點p的左孩子的最右下方的數替代該結點的資料，然後刪除p->lchild的最右下方的結點即可。對於p->lchild==NULL的，只需要讓雙親結點直接指向

二叉搜尋樹的插入，刪除，和中序遍歷

構建一個值的型別為int的二叉搜尋樹，輸入N和M，然後進行N次插入操作，每次插入之後進行一次遍歷驗證程式碼正確性。然後進行M次刪除操作，每次刪除之後進行一次遍歷驗證程式碼正確性。 #include "bits/stdc++.h" using namespace std; typedef long lo

Python實遍歷二維陣列題目一：在一個二維陣列中，每一行都按照從左到右遞增的順序排序，每一列都按照從上到下遞增的順序排序。請完成一個函式，輸入這樣的一個二維陣列和一個整數，判斷陣列中是否含有該整數。

在準備國網的過程中，仍要刷題，程式設計題。痛並快樂著。喜歡Python語言，所以用Python進行敲磚頭。劍指offer題目一：在一個二維陣列中，每一行都按照從左到右遞增的順序排序，每一列都按照從上到下遞增的順序排序。請完成一個函式，輸入這樣的一個二維陣列和一個整數，判斷陣列

Python Dataframe遍歷，刪除，初始化操作

建立一個DataFrame，它有幾種建立方式：

資料select, del, update。

按照列名select:

按照行數select:

按照行數和列數select:

刪除某列：

刪除某行：

運算。

apply運算：

Group by 操作。

匯出到csv檔案

相關推薦