1. 程式人生 > >Python elasticsearch 匯入json檔案資料 + 將scrapy爬蟲資料直接存入elasticsearch

Python elasticsearch 匯入json檔案資料 + 將scrapy爬蟲資料直接存入elasticsearch

1、json檔案資料存入elasticsearch

  • json檔案是從網上爬下來的資料

這裡寫圖片描述

  • scrapy 儲存的json格式資料預設Unicode格式編碼,轉utf-8 格式需要在settings裡面加入一條:
FEED_EXPORT_ENCODING='utf-8'

2、 將scrapy爬蟲資料直接存入elasticsearch

  • settings.py裡面設定elasticsearch host
  • pipelines.py新增程式碼:
    這裡寫圖片描述

  • 需要注意在settings.py開啟 ITEM_PIPELINES選項