1. 程式人生 > >Jsoup抓取到頁面A標籤中的href路徑

Jsoup抓取到頁面A標籤中的href路徑

 

直接上程式碼,註釋很全乎

    public static void main(String[] args)throws Exception{
        //抓取的網址
        String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html";
        //編碼格式的轉換
        Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url);
        //根據class獲取到 頁面的 元素內容
        Elements tables = document.getElementsByClass("provincetr");
        //根據td標籤來劃分
        Elements td = tables.select("td");
        for(int j=0;j<td.size();j++){
            //獲取到標籤中的內容
            String text = td.get(j).text();
            System.out.println(text);
            //獲取A標籤的href 網址  select 獲取到當前A標籤 attr href 獲取到地址
            String s = td.get(j).select("a").attr("href");
            System.out.println(s);
        }
    }
        <!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.11.3</version>
        </dependency>

需要引入以上jar包

也可以去這個網址下載,

輸出的時候會抓到  ""  空字串,大家自己判斷下就好了