1. 程式人生 > >notepad++正則匹配及匹配內容的保留與處理

notepad++正則匹配及匹配內容的保留與處理

很多時候,我們需要對一些大文字進行處理,比如查詢、替換等等。然而,在更多時候,對於我們要替換的物件只有若干印象描述,比如知道它前面是什麼鬼,後面是什麼鬼,或者自己是由某些字母組成,不能精確地把它拼寫出來,這時,就要用到正則表示式。
我們看保研論壇夏令營2016理科彙總貼,連結
我們想找到所有數學專業同學能報的夏令營,藉助網站自帶的find功能,略顯分散,每一都要一個一個看,不利於儲存之餘,手機上也不能看。
這時,我想用txt將所有數學專業同學能報的夏令營包括它的連結儲存下來。不用python,這次改用notepad++的錄製巨集功能。

  • 右鍵點選,網頁另存為。
  • 用natepad++開啟儲存下來的網頁。我們看看這個凌亂的原始碼。
    這裡寫圖片描述
  • ctrl+F開啟搜尋介面。選擇“標記”標籤頁。打勾“正則表示式“、”標記所在行“、“清除上次標記”。
  • 查詢全部^.*?([0-9]+\.).*?href="(.*?)".*?>(.*?數.*?)<.*?$

  • 搜尋-書籤-刪除未標記行。

  • 替換以上目標為\1\3\n\2\n\n\n
  • <.*?>替換為空白,大功告成。

這裡寫圖片描述

我們可以錄製成巨集,以便下次內容更新後,點選直接生成;儲存後用記事本開啟有可能空格和換行沒了,只要在notepad++中雙擊修改狀態列中的某一項就行了,比如說unix轉換為windows格式。

相關推薦

notepad++匹配匹配內容保留處理

很多時候,我們需要對一些大文字進行處理,比如查詢、替換等等。然而,在更多時候,對於我們要替換的物件只有若干印象描述,比如知道它前面是什麼鬼,後面是什麼鬼,或者自己是由某些字母組成,不能精確地把它拼寫出來

Java中輸出表達式匹配到的內容

clas 則表達式 oid 返回 com post main static println 在Java中用str.matches(reg)的方式是返回的一個布爾值,而我們有的時候需要返回匹配到的值的內容,具體實現代碼如下: public static void main(

C# 表示式html匹配input標籤匹配input的value獲取aspnet頁面VIEWSTATE、EVENTVALIDATION的UI狀態儲存值

1、使用正則表示式從html內容中獲取 input 標籤,然後從 input 標籤中獲取屬性值; 也可以使用正則表示式捕獲組獲取value,在2中說明 using System.Text.RegularExpressions; string excelHtml = divMX.Inne

java表達式匹配文本中想要的字符串

本地文件 則表達式 red mpi col ade cnblogs ges div 需求:獲取一個本地文件中所有符合 $[MAKE_PACKAGE] 格式的字符串,並輸出到另一個文件中. public static void main(String[] args) thr

[Leetcode] Regular expression matching 表達式匹配

edi target 比較 entire 判斷 如何 sin ret ring Implement regular expression matching with support for‘.‘and‘*‘. ‘.‘ Matches any single character

52、劍指offer--表達式匹配

註意 字符 align left 匹配 har match 描述 text 題目描述 請實現一個函數用來匹配包括‘.‘和‘*‘的正則表達式。模式中的字符‘.‘表示任意一個字符,而‘*‘表示它前面的字符可以出現任意次(包含0次)。 在本題中,匹配是指字符串的所有字符匹配整個模

在一串字符串中找到表達式匹配的字符串?(例如:export_20170717_out.log 找到20170717)

group blog public fin ati logs regex att sys 如題:提取字符串:export_20170717_out.log    對應的日期:20170717 package dodo; import java.util.regex.

劍指offer---表達式匹配

表達式 都是 igui true log pub 問題 code urn //遞歸做的 開始用動態規劃做 類似通配符問題 總感覺有問題 答案裏面用dp做的多多少少有點問題 //估計是我水平太低 //只是其中一個帶符號! class Solution { public:

Python實現表達式匹配任意的郵箱

blog too toc print python實現 簡單的 python blank 郵箱 首先來個簡單的例子,利用Python實現匹配163郵箱的代碼: [python] view plain copy print? #-*- coding:ut

表達式匹配郵箱

a-z 字符 www. 郵箱 class 表達式 獲取 href text 正則表達式基礎請移步 正則表達式基礎。 下面講解在jsp中用正則表達式匹配郵箱的基本方法: 首相給出表達式: var regex = /^(?:\w+\.?)\[email protec

python表達式匹配十六進制數據

fin phy decimal 進制 ref check 十六 http ffi 1. Find any hexadecimal number in a larger body of text \b[0-9a-fA-F]+\b 2. Check whether a

表達式匹配身份證 電話號碼 郵箱 住宅電話 郵編等

ext 大寫字母 nsh 辦理 regexp nbsp 新的 pat 中文 # -*- coding: utf-8 -*- import re tt1 = "13143567781" tt2=‘[email protected]‘ tt3=‘4110241945111

js 表達式,匹配郵箱/手機號/用戶名

inpu get 手機號 則表達式 oct www scrip 正則表達式 charset <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title&g

兄弟連學Python(06)---- 表達式匹配規則

驗證 列表 cas 斜杠 小數點 php 能夠 spa 超過 正則表達式 - 匹配規則 基本模式匹配 一切從最基本的開始。模式,是正則表達式最基本的元素,它們是一組描述字符串特征的字符。模式可以很簡單,由普通的字符串組成,也可以非常復雜,往往用特殊的字符表示一個範圍內的字

PHP表達式匹配俄文字符

first html col zh-cn all com .cn 匹配 reg 之前弄過匹配中文的 見 http://www.cnblogs.com/toumingbai/p/4688433.html preg_match_all("/([\x{0400}-\x{04FF

Python: 表達式匹配反斜杠 ""

details 字符串 art tails spa .net python 正在 12px Python正則表達式匹配反斜杠 "\" eg: >>>a=‘w\w\w‘ ‘w\\w\\w‘  # 打印出來的 "\\" 被轉義成 一個反斜杠 "\" 如果需要

表達式-匹配

blog format) 符號 bsp pac col sta main 多次 1,用一些特定的符號表示一些代碼操作,簡化書寫 2,[abc]表示可以是a/b/c [a,z]:小寫 [a-zA-Z]:大小寫均可 3,[^abc] 不可以是a b c 4,.任意字符 5,/d

Python: 表達式匹配多行,實現多行匹配模式

post 表達式 包括 實現 body 表達 捕獲 blog class 1) 點 (.)去匹配任意字符的時候,不能匹配換行符 在這個模式中(?:.|\n)是指定了一個非捕獲組(僅僅用來做匹配,部能通過單獨捕獲或者編號的組) 2) re.DOTALL   re

python一些簡單匹配

元字符 貪婪 分組 非貪婪 元字符的使用re.findall(regex,string)功能:在string字符串中,匹配regex正則表達式能夠匹配的項,放到一個列表中返回* 普通字符串 元字符 :abc 匹配規則 : 匹配字符串的值匹配示例 :abc In [3]: re.findall

表達式匹配“方括號”,“雙引號”

rep repl 引號 span 方括號 需求 很多 簡單的 方法   需求:從字符串["1","2","3"]中得到1,2,3   方法:想到很多方法,可以一步一步的去替。這裏推一個較為簡單的方法 String str = "[\"1\",\"2\",\"3\"]";