1. 程式人生 > >Python 系列練習(1)

Python 系列練習(1)

from 時間 sof 版本 lib 興趣 方式 https ren

Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫.它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.Beautiful Soup會幫你節省數小時甚至數天的工作時間.

Beautiful Soup3 的文檔,Beautiful Soup 3 目前已經停止開發,現在推薦在現在的項目中使用Beautiful Soup 4, 移植到BS4,現在python2 的版本逐漸會被python3 所代替,有興趣的同學,可以學習3,不要在學習2了。

 1 import bs4 
 2 
 3 from bs4 import BeautifulSoup as soup 
4 5 from urllib.request import urlopen 6 7 def news(): 8 9 #my_url="https://news.google.com/news/rss" 10 11 my_url="https://news.google.com/news/rss?ned=in&hl=en-IN" 12 13 #To open the Given URL 14 15 Client=urlopen(my_url) 16 17 s_url ="https://news.google.com/news/headlines/section/topic/SPORTS.en_in/Sports?ned=in&hl=en-IN&gl=IN
" 18 19 Client=urlopen(s_url) 20 21 22 23 xml_page=Client.read() 24 25 Client.close() 26 27 soup_page=soup(xml_page,"xml") 28 29 news_list=soup_page.findAll("item") 30 31 for news in news_list: 32 33 print(news.title.text) 34 35
print(news.link.text) 36 37 print(news.pubDate.text) 38 39 print("-"*150) 40 41 n=input() 42 43 44 45 news() 46 47

Python 系列練習(1)