1. 程式人生 > >Jsoup對HTML的基本處理【提取資訊】【個人筆記】

Jsoup對HTML的基本處理【提取資訊】【個人筆記】

  1. 從一個URL獲取HTML
    Document document1 = Jsoup.connect("https://www.baidu.com").get();
  2. 獲取標題
    Document document1 = Jsoup.connect("https://www.baidu.com").get();
                document1.title();
  3. 獲取整個網頁文字
    Document document1 = Jsoup.connect("https://www.baidu.com").get();
                document1.text();
  4. 獲取網頁編碼
    Document document1 = Jsoup.connect("https://www.baidu.com").get();
                document1.charset();
  5. 根據標籤名獲取節點
    Elements elements = document.getElementsByTag("a");//獲取所有a標籤
  6. 根據標籤屬性名稱獲取屬性值
    element.attr("href");