python Scrapy的spider中回撥函式的引數傳遞方法

阿新 • • 發佈：2018-12-15

通常有兩種方法，一種是使用meta進行引數傳遞。另一種是使用lambda進行引數傳遞。

方法一：

使用meta進行引數傳遞。

舉例如下：

from scrapy.spiders import Spider
import scrapy
import FirmCrawler.items as MI
from sets import Set
import time
import urlparse


class RicohSpider(Spider):
    name = "ricoh"
    allowed_domain = ["www.ricoh-imaging.com.cn"]
    start_urls = [
        "http://www.ricoh-imaging.com.cn/ricoh/service_download.html"
    ]

    allsuffix = Set()
    timeout = 20
    trytimes = 3
    headurl = "http://www.ricoh-imaging.com.cn/"


    def common(self, tr_list):
        pass



    def parse(self, response):

        tr_list_1 = response.xpath(".//*[@id='content2']/div[4]/table[1]/tr[position()>1]")
        for tr in tr_list_1:

            href = tr.xpath("./td[2]/a/@href").extract().pop()
            url = urlparse.urljoin(self.headurl, href)

            prductVersion = tr.xpath("./td[3]/text()").extract().pop()


            filename = tr.xpath("./td[1]/text()").extract().pop()
            print filename

            desc = tr.xpath("./td[2]/a/text()").extract().pop()
            # print desc


            request = scrapy.FormRequest(url, callback=self.parse_page, meta = {'filename':filename,'productVersion':prductVersion,'desc':desc})
            yield request


    def parse_page(self, response):
        print response.url
        publish_Time = response.xpath(".//*[@id='content2']/div[4]/div[3]/table/tbody/tr[4]/td[2]/p/span[1]/text()").extract()
        if publish_Time:
            publishTime = publish_Time.pop()
        else:
            publishTime = ""

        print "test:"+response.meta['filename']
        print "productVersion:" + response.meta['productVersion']
        print "desc:" + response.meta['desc']

主要方法：在scrapy.FormRequest方法中新增meta引數，meta使用字典形式的表達形式。

request = scrapy.FormRequest(url, callback=self.parse_page, meta = {'filename':filename,'productVersion':prductVersion,'desc':desc})
            yield request

在被呼叫的方法中引入字典的key：

# response.meta['key']
print "filename:"+response.meta['filename']
print "productVersion:" + response.meta['productVersion']
print "desc:" + response.meta['desc']

方法二：

使用lambda函式進行引數傳遞。

舉例如下：

    def parse(self, response):

        tr_list_1 = response.xpath(".//*[@id='content2']/div[4]/table[1]/tr[position()>1]")
        tr_list_2 = response.xpath(".//*[@id='content2']/div[4]/table[2]/tr[position()>1]")
        tr_list = tr_list_1 + tr_list_2

        for tr in tr_list:

            href = tr.xpath("./td[2]/a/@href").extract().pop()
            url = urlparse.urljoin(self.headurl, href)

            prduct_Version = tr.xpath("./td[3]/text()").extract()

            if prduct_Version:
                productVersion = prduct_Version.pop()
            else:
                productVersion = ""

            productModel = tr.xpath("./td[1]/text()").extract().pop()

            desc = tr.xpath("./td[2]/a/text()").extract().pop()

            # request = scrapy.FormRequest(url, callback=self.parse_page,
            #                          meta={'productModel': productModel, 'productVersion': prductVersion, 'desc': desc})
            # yield request

            request = scrapy.FormRequest(url, callback=lambda response, pm = productModel,pv= productVersion,dc = desc : self.parse_page(response, pm, pv, dc), dont_filter=True)
            yield request

    def parse_page(self, response, pm, pv , dc ):
        print pm,pv,dc

使用lambda進行引數傳遞，注意引數轉化如：pm = productVersion

使用meta的是時候不需要使用再被呼叫的函式之中新增引數。

 request = scrapy.FormRequest(url, callback=lambda response, pm = productModel,pv= productVersion,dc = desc : self.parse_page(response, pm, pv, dc), dont_filter=True)
            yield request

    def parse_page(self, response, pm, pv , dc ):
        print pm,pv,dc

python Scrapy的spider中回撥函式的引數傳遞方法

通常有兩種方法，一種是使用meta進行引數傳遞。另一種是使用lambda進行引數傳遞。方法一：使用meta進行引數傳遞。舉例如下： from scrapy.spiders import S

JS中回撥函式（一)

一.前奏多用在使用 js 寫元件時，尤其是元件的事件很多都需要回調函式的支援假設 A是回撥函式，B是呼叫者，B引數裡一個是指向A的函式指標，即回撥A，同時另外的引數傳遞給A作為引數二.JS中函式可作為引數傳遞，甚至在另一個函式內部返回一旦作為引數

前端全棧工程化開發專題 — JS中回撥函式的深入解讀

1、回撥函式核心原理分析 js中的定時器及動畫完整版動畫庫封裝回撥函式初步講解擴充套件更多的運動方式（非勻速） options物件引數的應用 ... 什麼是回撥函式？把一個函式當做實參值傳遞給函式的形參變數（或者傳遞給函式，通過函式arguments獲取），在另外一個函

對js中回撥函式的理解

一、什麼是回撥函式一直接觸回撥函式這個名詞，但是不知道具體是幹什麼的，今天在百度上看到了一句話讓對回撥函式產生了一點興趣，那就是回撥函式的英文解釋： A callback is a function that is passed as an argument to an

關於對Java中回撥函式的理解

先來看幾段程式： 1. 首先定義一個類Caller，這個類裡面儲存一個介面引用。 public class Caller { private MyCallInter

python vtk 通過回撥函式監測鍵盤”Up”鍵動作，每按一次方向上鍵，actor變換一種顏色

import vtk class KeyPressInteractorStyle(vtk.vtkInteractorStyleTrackballCamera): def __init__(self,parent=None):

Angular4中回撥函式內資料繫結無法及時更新

解決辦法：1. 匯入 ChangeDetectorRef ：import { ChangeDetectorRef } from '@angular/core'; constructor( private changeDetectorRef: ChangeDetectorR

VS2013MFC中回撥函式的使用&出現的問題

要在MFC類的成員函式中寫一個回撥函式，首先要了解什麼是回撥函式。回撥函式就是函式指標的呼叫，在一個函式寫成指標的形式，在另一個函式中可以把那個寫成指標形式的函式當成引數來使用。通常情況是在動態庫函式裡定義好回撥函式的形式，然後在封裝的函式裡註冊回撥函式。

js中回撥函式的運用

在javascript中，會經常用到回撥的方式，比如，當某一請求執行完成後，要完成某一指定的動作，但是程式無法知道請求什麼時候完成，這時我們便可以使用回撥來實現，像ajax就用到了回撥的概念。下面，筆者列舉自己在專案中用到的兩個例項。例項一、ajax請求遮罩

C語言回撥函式熟練—使用方法（構建程式框架方便好用）

通俗點不行嗎?啊，不行嗎？老外把國人玩的都不是人了。國人還自己玩自己。非把一個簡單的東西複雜化。叫那麼難理解！！窩裡鬥。。。。。。典型！！！！！！！！不說那麼複雜的，誰是狗屎，豬屎。就說怎麼用回撥。使用步驟： 1.寫一個函式A,A裡面有一個引數是個指標函式比如： int shao(in

關於 C#呼叫c庫，將C#的byte[]傳入C庫的方法和將C庫的char*向上傳入C#的回撥函式byte[] 的方法

需求使用C#開發，因某種原因，寫了C庫Dll，使用C#抓圖資料傳入C，將C庫收到的圖片資料向上傳入C#回撥函式。當前現狀 C#中將byte[]轉換成I

iOS微信分享不觸發回撥函式onResp()解決方法

此問題最近困擾了我三天，檢查專案程式碼與網上方法對照，並沒有發現不對的地方，跟斷點除錯，只發現微信分享後微信端並沒有給應用反饋，onResp()沒有觸發。問題描述：線上iOS使用者在第三方應用點選微信分享，無法執行分享後的操作。用iPhone

Java 回撥函式（傳統方法和lambda方法）－一個例子秒懂

背景：想寫一個工具類 Tool.java ，其中方法 public void readOneLine() 負責一行一行地讀檔案，然後根據不同的業務，對每一行進行不同處理。最後輸出到檔案 out.txt 那麼問題來了，根據不同的業務，進行不同處理　怎麼實現？

如何在dwr的回撥函式中傳遞多個引數

C++ | callback回撥函式，函式名做引數傳遞

在js中的回撥函式已經是隨處可見了，像下面這樣 // js callback demo function foo(value){ console.log(value) } function inject(callback){ var value = 'hello!

android利用回撥函式在對話方塊中傳遞資料

android開發中，往往需要在當前activity中開啟一個輸入框來獲取使用者資料，但是怎麼將輸入框的資料傳遞到activity中呢？一種方法是建立一個全域性變數，在對話方塊中將資料傳遞給靜態全域性變數，然後在當前activity中使用它。這種方式繁瑣而且

C#呼叫C/C++ DLL 引數傳遞和回撥函式的總結

Int型傳入： Dll端： extern "C" __declspec(dllexport) int Add(int a, int b) { return a+b; } C#端： [DllImport("aeClient2.0.dll", CallingCo

JavaScript如何向回撥函式傳遞引數

在JavaScript中我們可以將函式作為引數進行傳遞，那麼如果被傳遞的函式有引數，我們該如何處理呢？ /*被回撥的函式*/ function foo(id){ alert(id); } /*執行回撥的函式*/ function exec(func){

Python中函式引數傳遞

前幾天寫一個方法的時候，內部呼叫了第三方庫的可變引數方法，由於實際的需求，導致引數越寫越長，很不方便。這時是不是我們自己也應該寫一個可變引數的方法，然後根據需要動態傳遞引數？在解決這個問題之前，我們先來了解Python中四種傳遞引數的形式： fun1(a, b, c)

如何寫JavaScript中的callback回撥函式

如何寫回調函式？如果自己在寫一個方法或函式，你有可能會遇到需要一個回撥函式。下面就是一個簡單的常見回撥函式例子： function mySandwich(param1, param2, callback) { alert('Started eating my

python Scrapy的spider中回撥函式的引數傳遞方法

相關推薦