Pandas過濾dataframe中包含特定字串的資料
假如有一列全是字串的dataframe,希望提取包含特定字元的所有資料,該如何提取呢?
因為之前嘗試使用filter,發現行不通,最終找到這個行得通的方法。
舉例說明:
我希望提取所有包含'Mr.'的人名
1、首先將他們進行字串化,並得到其對應的布林值:
>>> bool = df.str.contains('Mr\.') #不要忘記正則表示式的寫法,'.'在裡面要用'\.'表示
>>> print('bool : \n', bool)
2、通過dataframe的基本操作將其選取出來:
>>> filter_data = df[bool] >>> print('filter data : \n', filter_data)
總結:這樣就成功將特定資料選取出來了,將程式碼彙總一下就是
>>> bool = df.str.contains('Mr\.')
>>> filter_data = df[bool]
當然也可以連到一起寫,這樣寫是為了方便讀者理解。
相關推薦
Pandas過濾dataframe中包含特定字串的資料
假如有一列全是字串的dataframe,希望提取包含特定字元的所有資料,該如何提取呢? 因為之前嘗試使用filter,發現行不通,最終找到這個行得通的方法。 舉例說明: 我希望提取所有包含'Mr.'的人名 1、首先將他們進行字串化,並得到其對應的布林值: >>&
pandas將DataFrame中的tuple分割成資料框的多列
通過apply(pd.Series)實現將tuple進行分列 df = pd.DataFrame({'a':[1,2], 'b':[(1,2), (3,4)]}) df['b'].apply(pd.Series) df[['b1', 'b2']] = df['b'].apply(pd.S
pandas.DataFrame中選取、修改資料.loc,.iloc,.ix
本文轉載自:https://blog.csdn.net/hecongqing/article/details/61927615 loc——通過行標籤索引行資料 iloc——通過行號索引行資料 ix——通過行標籤或者行號索引行資料(基於loc和iloc 的混合) 同
pandas 取出dataframe中重複的資料(關於某欄位),即去掉不重複的資料
和dataframe去重不同,當需要的是那些重複資料而不是非重複資料是,就想要將重複資料提取出來時,或者去除那些非重複資料。 主要思路: 1. 採用drop_duplicates對資料去兩次重,一次將重複資料全部去除(keep=False),另一次將重複資料保留一個(kee
刪除pandas.DataFrame 中包含NaN的行或列
建立DataFrame樣例資料 >>> import pandas as pd >>> import numpy as np >>> data =
linux中搜索包含特定字串的檔案
find命令,搜尋目錄 檔名 包含全部檔案 管道過濾字串 find /test -name "*.*" | xargs grep "abc" find / -type f -name "*.*" |xargs grep "/home/wwwroot/def
[Lua] 搜尋資料夾下包含特定字串的檔名稱
給自己寫的一個小工具,為了便於在程式碼資料夾中,搜尋包含特定字串的檔名稱,方便debug時查詢一些功能。 之所以用Lua是因為電腦上只有Lua,懶得安裝別的了。 在cmd中,和search.lua同一路徑下,輸入lua se
sql語句查詢某欄位中包含指定字串的資料列表,完全匹配欄位中逗號中間的字串資料
查詢出,使用者表中name欄位完全包含小明的資料資訊 User表 id name userInfo 1 小明,明明 很帥 2 小明,李明 3 明天,李強 SELECT * FROM `User` where concat(',
grep搜尋子目錄中包含某字串的特定檔案
find ./src -name '*.ec' -exec grep -i niuc {} /; -print 在特定檔案中grep某關鍵字,除了使用find 命令加exec選項之外,其實還有更簡單的方法: grep -R --include="*.cpp" key dir 上述命令的含義: 在
使用Ews API去刪除郵件內容中包含特定關鍵字的郵件
res 有效 執行 ember mailbox gid power 精確匹配 shell腳本 之前分享過通過Ews去刪除特定郵件主題的郵件方法,日常工作中會遇到只知道郵件內容中的部分關鍵字,需要去刪除郵件。具體過程如下:1 說明通過EWS API去刪除郵件中包含特定關鍵字方
利用反射,在整形ArrayList集合中,新增字串資料
沒有什麼才能,將就著看吧,重在瞭解,實現程式碼如下: import java.lang.reflect.Method; import java.util.ArrayList; public cla
Linux查詢檔案內容包含特定字串的檔案
聯合使用 find、xargs 和 grep 命令才能達到目的 我們通過下面這個命令組合,就可以查詢當前目錄以及其子目錄中,所有包含 “VPSeek” 這個字串的檔案。 find . |xargs grep "VPSeek"
python中刪除特定字串
現在有一個字串,有一些不想要的單詞和特殊字元 import re text = 'wo,didi;wode,;wode' text0 = text.replace('didi', '') print(re.sub('[,;]', ' ', text0)) 先用替換後用子串
查詢檔案中包含某個字串的行並將所有滿足條件行輸出到新檔案使用命令
查詢檔案中包含某個字串的行並將所有滿足條件行輸出使用命令 dos命令 find "關鍵字" 原始檔 > 輸出檔案 例如 find "QD00001" activity.task.log > activity.task1.txt linux命令 cat
查詢資料庫儲存過程中包含某字串的所有儲存過程名稱
select name from sysobjects o, syscomments s where o.id = s.id and text like '%querytext%' and o.xtype = 'P' ORDER BY name 將querytext替
Mysql查詢欄位中包含某字串的記錄
1.正確的方式: 判斷欄位field_A中是否包含23: select * from table_test where FIND_IN_SET("23", field_A) ; 2.錯誤的方式
linux下刪去檔案中包含某個字串的行
刪除檔案中帶有某個字串的所有行 a.txt sed -e '/xxx/d' a.txt -->打印出來 檔案中包含xxx的行都不會顯示 使用-i引數的話就直接修改檔案了 修改指定字串 sed -e 's/aaa/bbb/g' 全域性aaa替換為bbb 列印指定行 c
查詢所有的儲存過程哪些中包含某個字串
select sysobjects.name, sysobjects.id,syscomments.text from sysobjects,syscomments where sysobjects.id=syscomments.id and syscomments.
pandas.DataFrame中刪除包涵特定字串所在的行
你在使用pandas處理DataFrame中是否遇到過如下這類問題?我們需要刪除某一列所有元素中含有固定字元元素所在的行,比如下面的例子:如果要刪除的元素固定有更簡單的方法,可參考另一篇博文:http://blog.csdn.net/htbeker/article/detai
freemarker中判斷一個字串是否包含另一個字串(select多選框資料回顯)
開發中用到了select多選框,所以資料回顯就要換一種方式解決。多選框返回的資料是一個用逗號分隔的字串,比如“a,b,c”,回顯的時候用contains判斷從而決定是否對每個option進行checked。 <#if "a,b,c,"?contains("a")>