1. 程式人生 > >以獲取網上某篇文章的標題為例,介紹Jsoup常用的四種選擇器

以獲取網上某篇文章的標題為例,介紹Jsoup常用的四種選擇器

jsoup常用的四種選擇器

第一種選擇方式:通過節點名稱以及class來屬性來進行選擇

第二種選擇方式:通過節點id來進行選擇

第三種方式:通過文件節點順序來進行選擇

第四種方式:通過谷歌瀏覽器來進行幫助選擇

	public void getNewsTitle() throws Exception {
		// 通過呼叫parse方法,傳遞url就可以解析網頁內容
		// 請求網站,獲取網頁內容,封裝成Document 物件
		Document document = Jsoup.parse(new URL("http://news.163.com/17/1114/07/D36G5U1D0001875P.html"), 50000);
	// 第一種方式,通過節點名稱或者class屬性來進行選擇
		// 通過select方法,告訴我們的document按照什麼方式去查詢
		Elements select = document.select("h1");
		// 通過節點名稱來進行查詢
		System.out.println(select.toString());
		// 通過class屬性來進行選擇
		Elements select2 = document.select(".post_content_main");
		Elements select3 = select2.select("h1");
		System.out.println(select3.toString());
		// 一步到位,通過 > 繼續往下選擇
		Elements select4 = document.select("div.post_content_main > h1");
		System.out.println(select4.toString());

	// 第二種方式:通過節點的id來進行選擇
		Elements select5 = document.select("#epContentLeft > h1");
		// 獲取文字內容,去掉標籤
		String text1 = select5.text();
		System.out.println(text1);

	// 第三種方式選擇:通過節點的順序來進行選擇
		Elements select6 = document
				.select("body > div.post_header > div.post_content.post_area.clearfix > div.post_content_main >h1");
		String text2 = select6.text();
		System.out.println(text2);

	// 第四種選擇方式,通過谷歌瀏覽器幫助選擇
		Elements select7 = document.select("#epContentLeft > h1");
		String text3 = select7.text();
		System.out.println(text3);
		System.out.println(select3.toString());
	}