正則表示式獲取HTML標記中的內容（C#）

阿新 • • 發佈：2019-02-19

//=====================Begin1========================

//試驗字串

string strTmp =string.Empty;

//正則表示式

string tmpStr =string.Empty;

//取出指定HTML標記中的匹配項的值RegexOptions.IgnoreCase忽略大小寫，RegexOptions.Multiline忽略多行顯示，

//tmpStr = "<title>([^<]*)</title>" //獲取<title>之間內容

strTmp =@"<add key='ConnectionString' value='server=localhost;database=資料庫名;uid=sa;pwd=;pooling=true'/>";

//獲取“database=”與“;”號之間的字串：database=(.*);

tmpStr ="database=([^;]*);";

Match TitleMatch = Regex.Match(strTmp, tmpStr ,RegexOptions.IgnoreCase | RegexOptions.Multiline );

//如下例子作語法參考用獲取size的值，實際應用可能不會如此複雜

strTmp ="><font color='red' size=6>WebForm3</font><" ;

tmpStr =@"<(w+s+w+[=]+[']+w+[']+s+[size=]+d)>";

Match TitleMatch = Regex.Match(strTmp ,tmpStr , RegexOptions.IgnoreCase | RegexOptions.Multiline );

//取出匹配項的值

string tmpStrTitle = TitleMatch.Groups[1].Value;

//替換掉HTML頁中所有HTML標記

Label1.Text=Regex.Replace(Label1.Text.Trim(),"<.+?>","")+"*********"+TitleMatch.Groups[1].Value;

//判斷匹配正則表示式是否成功

if(Regex.Match(tmpStr,"<.+?>").Success)

{

//操作

}

//=====================End1========================

//=====================Begin2========================

string webDocContent="<a href=http://www.xxx.xxx/college/pages/default.htm target=_blank>師資隊伍</A>";

//解釋下面正則表示式：[s]表示匹配空格字元，"+" 表示連線

string strPattern=@"a[s]+href=(?<Link>[^s>]+)[^>]*>(?<Text>[^<]*)</a>";

//獲取連結顯示的文字

MatchCollection Matches=Regex.Matches(webDocContent,strPattern,RegexOptions.IgnoreCase|RegexOptions.Compiled);

foreach(Match NextMatch in Matches)

{

string URL=NextMatch.Groups["Link"].Value.ToString().Trim();

string URLText=NextMatch.Groups["Text"].Value.ToString().Trim();

Response.Write(URL+"****");

Response.Write(URLText);

}

//=====================End2========================

//=====================Begin3========================

string strPageContent =string.Empty;

StreamReader srPage =new StreamReader(@"e:save.txt",System.Text.Encoding.GetEncoding("gb2312"));

strPageContent = srPage.ReadToEnd();

srPage.Close();

//(/s)*表示0或多個空格符、回車符等，*表示比配0或多個。(.*?)表示除回車符外的所有資訊

MatchCollection TitleMatchs = Regex.Matches(strPageContent, "<td width="85%" class="common_text">((/s)*(.*?)(/s)*(.*?)(/s)*(.*?)(/s)*(.*?)(/s)*)</td>", RegexOptions.IgnoreCase | RegexOptions.Multiline );

int tmpNum =0;

//迴圈正則表示式所獲取的，滿足表示式的內容集合

foreach(Match NextMatch in TitleMatchs)

{

++tmpNum;

Label1.Text += tmpNum +"<br>****"+ NextMatch.Groups[1].Value;

}

//=====================End3========================

正則表示式獲取HTML標記中的內容（C#）

//=====================Begin1======================== //試驗字串string strTmp =string.Empty; //正則表示式string tmpStr =string.Empty;

js 正則表示式去除html字元中所有的標籤（img標籤除外）

廢話不多說，直接上程式碼：description.replace(/<(?!img).*?>/g, ""); 如果保留img,p標籤，則為：description.replace(/<

用正則表示式獲取網頁裡面的內容/java面試題

今天，我看到這篇帖子，感覺很好，就打算看看。我這個人看書的話不能有答案的，下面有答案，真的會影響自己思考。就想著把裡面的題目留下了，實在不會就去網頁上面看看，這樣子好點。 Java面試題全集（上） http://blog.csdn.net/jackfrued/ar

Java呼叫replaceAll方法通過正則表示式把HTML字串中的img標籤的src預設屬性值uri補全

class Test { public static void main(String[] args) { String domain = "http://avatar.csdn.net";

正則表示式獲取sql語句中的表名

一個小的實驗，裡面要獲取基本增刪改查的sql語句對應的表名，以下是在W3schoo基本教程的集中sql型別 SELECT 列名稱（*所有列） FROM 表名稱 SELECT 列名稱 FROM 表名稱 where 條件 INSERT INTO 表名稱 V

正則表示式獲取JSON資料中value值

/*** * @Author zhaohp * @Date 2018/9/29 16:07 * @Param [jsonString, set] * @Ret

正則表示式：找出不含（排除）某個字串的所有

Match string not containing string Given a list of strings (words or other characters), only return the strings that do not match. 以正則表示式 ^((?

正則表示式從零開始學習系列（二）

正則表示式學習 -- 實踐如何讓一個完全沒接觸過正則表示式的人去快速有效的學會正則表示式？這的確是個很難回答的問題。不過我想最好的方式就是把自己當成這麼一個人，然後把自己的學習過程分享出來，想必是個比較不錯的方式。現在，我將打算去做這麼一件事，希望對

python3進階之正則表示式之re模組之分組（group）、貪心匹配、編譯

　　除了簡單地判斷是否匹配之外，正則表示式還有提取子串的強大功能。用()表示的就是要提取的分組（Group）。比如：^(\d{3})-(\d{3,8})$分別定義了兩個組，可以直接從匹配的字串中提取出區號和本地號碼m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345'

PHP用正則批量替換Img中src內容,用正則表示式獲取圖片路徑實現縮圖功能

/** * 圖片地址替換成壓縮URL * @param string $content 內容 * @param string $suffix 字尾 */ function get_img_thumb_url($content="",$suffix="!c550x260.jpg") { // by

java正則表示式去除html中所有的標籤和特殊HTML字元

關於java正則表示式去除html中所有的標籤和特殊HTML字元，結合我所做的專案總結的經驗：總共分為三種：第一種適用於適用短的文章，將文章用正則表示式的方式拼接到程式碼中，有些繁瑣，其實不太實用。第二種就是直接將文件引入，進行更改，但是有一個小缺點，就是文件中的格式可能是utf-8格式的

C#正則表示式提取HTML中IMG標籤的SRC地址

原文：http://blog.csdn.net/smeller/article/details/7108502 一般來說一個 HTML 文件有很多標籤，比如“<html>”、“<body>”、“<table>”等，想把文件中的 img 標籤提取出來並不

Python通過正則表示式獲取,去除(過濾)或者替換HTML標籤的幾種方法(本文由169it.com蒐集整理)

python正則表示式關鍵內容: python正則表示式轉義符: . 匹配除換行符以外的任意字元 \w 匹配字母或數字或下劃線或漢字 \s 匹配任意的空白符 \d 匹配數字 \b 匹配單詞的開始或結束 ^ 匹配字串的開始 $ 匹配字串的結束 \W 匹配任意不是字母，數字

Python 正則表示式從Windows路徑中獲取資料夾

<pre name="code" class="python">1. Regular Expression ^([a-zA-Z]:|\\\\[a-zA-Z0-9_.$ -]+\\[a-z0-9_.$ -]+)?((?:\\|^)(?:[^\\/:*?"<&

java中用正則表示式獲取一個指定的子字元在字串中出現的指定次數的下標索引，並且進行字串分割

在開發中遇到這樣的一個報文： 00000123000003RQ0 ################ 000003 <tellerLvl0>0</><brc>3004</><fPIflag>0</><

Java中正則表示式去除html標籤

注：這是Java正則表示式去除html標籤方法。 private static final String regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; // 定義sc

正則表示式提取HTML中IMG標籤的SRC地址

一般來說一個 HTML 文件有很多標籤，比如“<html>”、“<body>”、“<table>”等，想把文件中的 img 標籤提取出來並不是一件容易的事。由於 img 標籤樣式變化多端，使提取的時候用程式尋找並不容易。於是想要尋找它們就

在vs2013中使用正則表示式查詢和替換文字內容

我們有的時候需要替換程式碼中的某些內容，因為替換的內容“不一致”，所以不能簡單的使用一個replace搞定。這裡有幾個解決方法，核心思想是一致的，程式設計師不要做體力活，能交給程式或指令碼的就交給程式或指令碼來完成。我先提一個替換的需求，這

c#使用正則表示式獲取json中的陣列

// 被解析的是引數json，json 是一個json字串，包含了一個數組，形如[ { .... },{.....},{.....} ]，本函式將json 陣列解析到 list<string>,list中每個元素為 {....} public Li

用正則表示式匹配雙引號中的內容

匹配表示式：\"([^\"]*)\"匹配結果實驗： String t = "\"world\""; String p = "\"([^\"]*)\"" ; Pattern P=Pattern.compile(p); Matcher matcher1=P

正則表示式獲取HTML標記中的內容（C#）

相關推薦