1. 程式人生 > >scrapy爬蟲框架

scrapy爬蟲框架

cnblogs logs spi down 方式 ges htm width sched

技術分享

downloader:負責下載html頁面

spider:負責爬取頁面內容,我們需要自己寫爬取規則 srapy提供了selector,獲取的方式有xpath,css,正則,extract

item容器:spider獲取到的內容放到item中

schedul:負責調度

scrapy爬蟲框架