1. 程式人生 > >python3網路爬蟲第三章: Scrapy 爬蟲框架 (1)

python3網路爬蟲第三章: Scrapy 爬蟲框架 (1)

1.認識目錄結構

安裝略過,使用命令建立專案

 scrapy startproject myfirstpjt

這裡寫圖片描述
這裡面 scrapy.cfg 是爬蟲專案配置檔案,專案的同名子資料夾中,init.py 是初始化檔案,items.py 是爬蟲專案的資料容器檔案,piplines.py 是爬蟲的管道檔案 seetings.py爬蟲專案的設定檔案

2.常用的命令

1.建立所需引數幫助資訊 :

scrpy startproject -h

2.全域性命令

全域性命令不依靠 scrapy 可以全域性使用,引數幫助資訊 scrapy -h

a.scrap fetch -h

在專案外使用就是用 scrapy 預設的爬蟲來爬取,專案內則使用專案中的來爬取
顯示爬取百度的過程

scrapy fetch http://baidu.com

b.scrapy runspider 爬蟲檔名.py

可以直接執行爬蟲檔案不依賴專案

c.scrapy seetings –get BOT_NAME

檢視配置資訊