1. 程式人生 > >提取HTML中所有a標籤的href連結

提取HTML中所有a標籤的href連結

/**
	 * 提取html中a標籤的href
	 * @param strs
	 * @return
	 */
	public List<String> getAHref(String strs){
        List<String>  al=new ArrayList<String>();
        String regex="<a.*?/a>";
        
        Pattern pt=Pattern.compile(regex);
        Matcher mt=pt.matcher(strs);
 
        while(mt.find()){
        	String s3 = "href=\"(.*?)\"";
            Pattern pt3=Pattern.compile(s3);
            Matcher mt3=pt3.matcher(mt.group());
            while(mt3.find())
            {
                System.out.println("網址:"+mt3.group().replaceAll("href=|>",""));
                String u=mt3.group().replaceAll("href=|>","");
                al.add(u);
            }
        }
		return al;
    }

相關推薦

提取HTML所有a標籤href連結

/** * 提取html中a標籤的href * @param strs * @return */ public List<String> getAHref(String s

java正則表示式去除html所有標籤和特殊HTML字元

關於java正則表示式去除html中所有的標籤和特殊HTML字元,結合我所做的專案總結的經驗: 總共分為三種:第一種適用於適用短的文章,將文章用正則表示式的方式拼接到程式碼中,有些繁瑣,其實不太實用。第二種就是直接將文件引入,進行更改,但是有一個小缺點,就是文件中的格式可能是utf-8格式的

HTMLa標籤,img標籤,列表標籤以及視訊、音訊標籤學習筆記

HTML5標籤語義化 標籤名代表了標籤中內容的意思,讓正確的標籤幹正確的事情,如標題使用標題標籤 結構化標籤 HTML5新增了哪些標籤 header               頭部標籤 nav                     導航連結部分

如何獲取字串最後一個a標籤href的值

 如下連結: String = " </a> <b>1</b> <a href="/news/201804/28/207901_2.html">2</a> <a href="/news/201804/28/2

C#正則表示式提取HTMLIMG標籤的SRC地址

原文:http://blog.csdn.net/smeller/article/details/7108502 一般來說一個 HTML 文件有很多標籤,比如“<html>”、“<body>”、“<table>”等,想把文件中的 img 標籤提取出來並不

python獲取頁面所有a標籤href的值

參考下面的連結中的內容: # -*- coding:utf-8 -*- #python 2.7 #http://tieba.baidu.com/p/2460150866 #標籤操作 from

js 正則表示式去除html字元所有標籤(img標籤除外)

廢話不多說,直接上程式碼:description.replace(/<(?!img).*?>/g, ""); 如果保留img,p標籤,則為:description.replace(/<

HTML A標籤 href click事件衝突

比較淺顯的一個問題, A標籤兩個屬性都寫, 甚至href屬性是 href="" 這樣,都會引起瀏覽器在執行完click事件後再觸發href裡面的連結,如果是空字串,則會使用當前頁面的url 那麼如何禁

正則表示式提取HTMLIMG標籤的SRC地址

一般來說一個 HTML 文件有很多標籤,比如“<html>”、“<body>”、“<table>”等,想把文件中的 img 標籤提取出來並不是一件容易的事。由於 img 標籤樣式變化多端,使提取的時候用程式尋找並不容易。於是想要尋找它們就

FLEX在textArea使用a標籤連結外部資源

今天在開發中遇到了一個問題,就是在textArea中使用a標籤連結外部資源,寫了一個簡單的demo如下: <?xml version="1.0" encoding="utf-8"?> <s:Application xmlns:fx="http://ns.a

傳送html郵件是a標籤的url不顯示問題

最近做到一個找回密碼功能,需要郵箱跳轉修改密碼頁面。但是碰到一個問題,傳送郵件之後a標籤中的href屬性不見了,url也不見了。但是我把url改成百度的連結就可以。困擾了我好幾個小時。結果只是因為在url中沒有加ht

C#替換html程式碼所有img標籤的路徑保留檔名稱

匹配img標籤路徑的正則表示式為:(?i)(?<=<img\b[^>]*?src=\s*(['""]?))([^'""]*/)+(?=[^'""/]+\1) string url = string.Empty;  string turl=""//替換的路徑

提取a標籤連結文字

QQ:979111986/5730473 微信:ainusers 現就職:新浪 微博:AinUser 微信公眾號:AinUser 郵箱:[email protected] 程式設計技術交流群:540049350 github:g

html使用map標籤,coords值怎麼精確定位gif上的連結

  看看這堆複雜的程式碼,估計就是這個了。Map標籤,從來沒有用過這個東西,隨手一查,原來如此。號稱:熱點超連結就是它了。  摘其中的一段程式碼:  分析一下不難發現,href就是連結地址,coords暫時不知,target這個不用說了吧。Shape就是形狀。分析coord

html<a>標簽的用法

ima 榮耀 其他 英文 ack mage span 目標 none <a>標簽的三種用法 <!--本博客所有示例均在頁面底部-->   1 頁面跳轉     <!--href 是屬性,"引號引起來的是屬性值"     寫法<a href

HTML:使用a標籤提交form表單

a標籤提交form表單 如果美工給的form表單提交使用了a標籤,這樣就無法獲取表單資料: <form method="post"> <input name="username" > <input type="password

html的p標籤文字內容首字母縮排

<p class="parallax-alt" style="text-indent: 3em;">                  &

通過HTML的table標籤設定Web頁面

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>用table標籤設定Web頁面</title>

H5 a標籤連結target屬性

<html> <head> <meta charset="utf-8"> <title>超連結練習</title> </head> <body> <a href="#taobao">

HTML】使用a標籤以post方式提交

在HTML中a標籤預設是使用GET方式跳轉的,如果需要使用post跳轉可以這樣用: 一:增加一個form表單 <span style="font-family:SimSun;font-size:18px;"><body> <a href="jav