1. 程式人生 > >12. scrapy 框架持續化存儲

12. scrapy 框架持續化存儲

.json -a sel snippet code 形式 行存儲 idg codes

一、 基於終端指令的持久化存儲

  • 保證爬蟲文件的parse方法中有可叠代類型對象(通常為列表or字典)的返回,該返回值可以通過終端指令的形式寫入指定格式的文件中進行持久化操作
   執行輸出指定格式進行存儲:將爬取到的數據寫入不同格式的文件中進行存儲:
      scrapy crawl 爬蟲名稱 -o xxx.json
      scrapy crawl 爬蟲名稱 -o xxx.xml
      scrapy crawl 爬蟲名稱 -o xxx.csv

示例:

12. scrapy 框架持續化存儲