1. 程式人生 > >網路爬蟲全解析(JAVA)--目錄

網路爬蟲全解析(JAVA)--目錄

  • 5.2.1字符集編碼195
  • 5.2.2識別網頁的編碼198
  • 5.2.3網頁編碼轉換為字串編碼201
  • 5.2.4使用正則表示式提取資料202
  • 5.2.5結構化資訊提取206
  • 5.2.6表格209
  • 5.2.7網頁的DOM結構210
  • 5.2.8使用Jsoup提取資訊211
  • 5.2.9使用XPath提取資訊217
  • 5.2.10HTMLUnit提取資料219
  • 5.2.11網頁結構相似度計算220
  • 5.2.12提取標題222
  • 5.2.13提取日期224
  • 5.2.14提取模板225
  • 5.2.15提取RDF資訊227
  • 5.2.16網頁解析器原理227