1. 程式人生 > >scrapy基礎知識之傳送POST請求

scrapy基礎知識之傳送POST請求

可以使用 yield scrapy.FormRequest(url, formdata, callback)方法傳送POST請求。

如果希望程式執行一開始就傳送POST請求,可以重寫Spider類的start_requests(self) 方法,並且不再呼叫start_urls裡的url。

例如:

class mySpider(scrapy.Spider):
    # start_urls = ["http://www.example.com/"]

    def start_requests(self):
        url = 'http://www.renren.com/PLogin.do'

        # FormRequest 是Scrapy傳送POST請求的方法
        yield scrapy.FormRequest(
            url = url,
            formdata = {"email" : "xxx", "password" : "xxxxx"},
            callback = self.parse_page
        )
    def parse_page(self, response):
        # do something

注意:表單資料的提交使用formdata,方法之間的傳參依然使用meta,例如:
class mySpider(scrapy.Spider):
    # start_urls = ["http://www.example.com/"]

    def start_requests(self):
        url = 'http://www.renren.com/PLogin.do'

        # FormRequest 是Scrapy傳送POST請求的方法
        yield scrapy.FormRequest(
            url = url,
            formdata = {"email" : "xxx", "password" : "xxxxx"},
            callback = self.parse_page,
	    meta = {"key1":"value1","key2":"value2"}
        )
    def parse_page(self, response):
	value1 = response.meta["key1"]
        # do something