1. 程式人生 > >scrapy 爬蟲框架怎麼爬去的資料怎麼生成一個json檔案

scrapy 爬蟲框架怎麼爬去的資料怎麼生成一個json檔案

 scrapy crawl min_spider -o min_spider.json

說明:  我的爬蟲名字為min_spider,這條命令會在當前資料夾下生成一個min_spider.json的檔案

class MinSpiderSpider(scrapy.Spider):
    name = 'min_spider'
    allowed_domains = ['baidu.com']
    start_urls = ['http://www.baidu.com/']

還支援csv xml pickle marshal等格式  程式碼都一樣

 scrapy crawl min_spider -o min_spider.csv
 scrapy crawl min_spider -o min_spider.xml
 scrapy crawl min_spider -o min_spider.pickle
 scrapy crawl min_spider -o min_spider.marshal