win10如何使用scrapyd部署爬蟲

阿新 • • 發佈：2018-11-09

win10如何使用scrapyd部署爬蟲

官方文件：http://scrapyd.readthedocs.io/en/stable/

scrapy爬蟲寫好後，一般需要用命令列執行。scrapyd部署能夠在網頁端檢視正在執行的任務，也能新建爬蟲任務，和終止爬蟲任務。優點：在網頁端管理爬蟲，可以控制多個爬蟲任務。

1.安裝

pip install scrapyd
pip install scrapyd-client

2.基本使用

2.1 執行scrapyd

在scrapy.cfg中，取消#url = http://localhost:6800/前面的“#” 。

首先切換命令列路徑到Scrapy專案的根目錄下，
開啟scrapyd服務，輸入scrapyd

，將scrapyd執行起來

然後新開一個終端切換路徑至scrapy工程根目錄，釋出scrapyd專案，執行命令：
scrapd-deploy -p projectName
驗證是否釋出成功：
scrapyd-deploy -l

2.2 釋出工程到scrapyd

上述命令已經開啟服務，並建立了爬蟲專案

2.3 建立爬蟲任務

命令列輸入

curl http://localhost:6800/schedule.json -d project=projectName -d spider=spiderName

3. 檢視爬蟲任務

在網頁中輸入：http://localhost:6800/

4.修改scrapyd的配置

scrapyd預設保留5條日誌。
預設繫結地址為127.0.0.1。如果是在伺服器部署爬蟲需要在其他主機訪問則修改地址為0.0.0.0
pip show scrapyd找到scrapyd的位置

一些常用命令：

檢視狀態：

scrapyd-deploy -l
啟動爬蟲：

curl http://localhost:6800/schedule.json -d project=PROJECT_NAME -d spider=SPIDER_NAME
停止爬蟲：

curl http://localhost:6800/cancel.json -d project=PROJECT_NAME -d job=JOB_ID
刪除專案：

curl http://localhost:6800/delproject.json -d project=PROJECT_NAME
列出部署過的專案：

curl http://localhost:6800/listprojects.json
列出某個專案內的爬蟲：

curl http://localhost:6800/listspiders.json?project=PROJECT_NAME
列出某個專案的job：

curl http://localhost:6800/listjobs.json?project=PROJECT_NAME

1、獲取狀態
http://127.0.0.1:6800/daemonstatus.json
2、獲取專案列表
http://127.0.0.1:6800/listprojects.json
3、獲取專案下已釋出的爬蟲列表
http://127.0.0.1:6800/listspiders.json?project=myproject
4、獲取專案下已釋出的爬蟲版本列表

http://127.0.0.1:6800/listversions.json?project=myproject
5、獲取爬蟲執行狀態
http://127.0.0.1:6800/listjobs.json?project=myproject
6、啟動伺服器上某一爬蟲（必須是已釋出到伺服器的爬蟲）
http://localhost:6800/schedule.json （post方式，data={"project":myproject,"spider":myspider}）
7、刪除某一版本爬蟲
http://127.0.0.1:6800/delversion.json （post方式，data={"project":myproject,"version":myversion}）
8、刪除某一工程，包括該工程下的各版本爬蟲
http://127.0.0.1:6800/delproject.json（post方式，data={"project":myproject}）

參考文章：https://www.cnblogs.com/zhongtang/p/5634545.html

重啟scrapyd的方法

（1）ps aux|grep scrapyd：找到scrapyd的pid

（2） kill -9 pid 或者kill pid

（3）screen -S scrapyd 新建一個程序

（4）在程序裡啟動scrapyd

/usr/bin/python /usr/local/bin/scrapyd

（5）ctrl+A+D退出程序

（6）改工程的scrapy.cfg檔案，如果url有#號，把url前的#去掉

（7）可以scrapyd-deploy工程了

screen參考：
https://www.ibm.com/developerworks/cn/linux/l-cn-screen/
http://man.linuxde.net/screen

殺死screen會話 screen -X -S pid quit 其中pid為screen程序號
screen -ls 列出現有screen會話列表
screen -r pid 恢復到某個screen會話
Ctrl+a +d 保留會話離開當前視窗

使用selenium+谷歌瀏覽器在centeos7無GUI部署爬蟲cookie更新

highlight 防止為我 tab info mys 關於配置 root 環境安裝 python3 安裝selenium　　 pip3 install selenium 安裝chrome瀏覽器+chromedriver驅動一.配置yum源 1.在目

Scrapyd部署爬蟲檔案

Scrapyd部署爬蟲專案 1、開啟命令列工具執行“pip install scrapyd” 2、安裝成功啟動scrapyd服務 3、瀏覽器輸入127.0.0.1:6800即可檢視 4、連線成功後在非c盤目錄下新建一個資料夾，shift加右鍵開啟命令列工具，輸入scra

win10如何使用scrapyd部署爬蟲

win10如何使用scrapyd部署爬蟲官方文件：http://scrapyd.readthedocs.io/en/stable/ scrapy爬蟲寫好後，一般需要用命令列執行。scrapyd部署能夠在網頁端檢視正在執行的任務，也能新建爬蟲任務，和終止爬蟲任務。優點：

mac 系統編寫的 scpayd部署爬蟲 sh指令碼伺服器上報錯：syntax error: unexpected end of file / no active project\n\nUnknown

一. 報錯描述 sh指令碼： sh指令碼報錯：報錯一： no active project\n\nUnknown (scrapy_env) [[email protected] FFF]$ sh run_base.sh run_base.sh: line 2: $

jenkins 自動打包部署爬蟲專案

最近因工作需要，負責看護公司的生產環境，有16臺生產服務節點，所以必須得引入自動化管理工具，不然我可不得累死啊。本文記錄一下在使用Jenkins釋出過程的整個過程。 1.啟動Jenkins服務 2.登陸網頁 3.配置

scrapyd部署爬蟲專案

功能：它就相當於是一個伺服器，用於將自己本地的爬蟲程式碼，打包上傳到伺服器上，讓這個爬蟲在伺服器上執行，可以實現對爬蟲的遠端管理。(遠端啟動爬蟲，遠端關閉爬蟲，遠端檢視爬蟲的一些日誌。) 1.服務端Scrapd的安裝:Pip install scrapyd（版本

scrapy入門教程()部署爬蟲專案

scrapyd部署爬蟲專案 1、scrapyd介紹它就相當於是一個伺服器，用於將自己本地的爬蟲程式碼，打包上傳到伺服器上，讓這個爬蟲在伺服器上執行，可以實現對爬蟲的遠端管理(遠端啟動爬蟲，遠端關閉爬蟲，遠端檢視爬蟲的一些日誌等)。 2、scrapyd安裝

部署爬蟲

安裝scrapyd: pip install scrapyd 安裝scrapyd-client : pip install scrapyd-client 安裝curl:[安裝地址](http://ono60m7tl.bkt.clouddn.com/curl.exe),安裝完

ubuntu下scrapyd部署爬蟲專案

scrapyd部署爬蟲的優勢： 1、方便監控爬蟲的實時執行狀態，也可以通過介面呼叫開發自己的監控爬蟲的頁面 2、方便統一管理，可以同時啟動或關閉多個爬蟲 3、擁有版本控制，如果爬蟲出現了不可逆的錯誤，可以通過介面恢復到之前的任意版本注意：在安裝scrapyd之前要確保你的環境能夠執行scrapy（無論整合

如何使用scrapyd部署爬蟲專案

功能：相當於一個伺服器，用於將自己本地的爬蟲程式碼，打包上傳到伺服器上，讓這個爬蟲在伺服器上執行，可以實現對爬蟲的遠端管理。(遠端啟動爬蟲、關閉爬蟲、檢視爬蟲的一些日誌) 1.scrapyd的安裝：在cmd中，輸入指令：pip install scrapyd

python之Scrapyd部署爬蟲專案（虛擬環境）

1、新建虛擬環境(方便管理)，在虛擬環境中安裝scrapy專案需要使用到的包進入虛擬環境使用pip將所需包安裝完成 2、開啟命令列工具執行pip install scrapyd 3、輸入scrapyd啟動scrapyd服務，在瀏覽器輸入127.0.0

scrapyd部署爬蟲專案所需配置

scrapyd部署爬蟲專案 1，安裝scrapy包 pip install scrapyd 在終端輸入scrapyd 檢視是否成功所在埠為6800即為成功（建議不要將這個關掉，後面需要這個服務，關掉會連線不到主機）在瀏覽器上輸入127.0

詳述Scrapyd部署爬蟲專案

Scrapyd部署爬蟲專案部落格目的：本部落格介紹瞭如何安裝和配置Scrapyd，以部署和執行Scrapy spider。 Scrapyd簡介 : Scrapyd是一個部署和執行Scrapy spide

scrapyd部署爬蟲遇到的問題

1.windows下 scrapyd-deploy無後綴檔案不能啟動：執行命令pip install scrapy-client，安裝完成後，在虛擬環境的scripts中會出現scrapyd-deploy無後綴檔案，這個scrapyd-deploy無後綴檔案

基於Python的-scrapyd部署爬蟲流程

1. 開啟命令視窗,新建一個虛擬環境:Mkvirtualenv --python=D:\python36\python.exe 虛擬環境名2. 安裝scrapy專案中所需要的包:例如pip install scrapy如果缺少win32 要進行pip install pywi

scrapyd 部署爬蟲專案

1.cmd進入虛擬環境下載scrapyd,即pip install scrapyd,安裝完成後輸入scrapyd，啟動scrapyd服務在瀏覽器輸入127.0.0.1：6800 即可檢視 2. 如果連線成功先關閉服務，自己在非C盤下新建一個資料夾，名稱自定義如:sc

Python 和 Scrapy 爬蟲框架部署

python scrapy 爬蟲框架 Scrapy 是采用Python 開發的一個快速可擴展的抓取WEB 站點內容的爬蟲框架。安裝依賴 yum install gcc gcc-c++ openssl mysql mysql-server libffi* libxml* libxml2 l

SAE 部署 bilibili 爬蟲

AC 訪問 with acc ESS OS python session .html layout: post title: sae部署bilibili爬蟲 categories: python tags: spider sae 前端效果 sae準備工作從本地上傳的

爬蟲在部署到定時任務是發生的問題

awl 爬蟲 line mman scrapy crawl 定時錯誤 anaconda 發生的錯誤信息為： ## crawl.sh: line 8: scrapy: command not found ## 解決措施： ## PATH=$PATH:/da

21.scrapy爬蟲部署

技術 script programs dmi .com target sys pro lan 1.啟用 scrapyd 2. 在瀏覽器打開127.0.0.1:6800/ 3. scrapy.cfg 設置 4. 遇到問題： scrapyd-deploy 不

win10如何使用scrapyd部署爬蟲

win10如何使用scrapyd部署爬蟲

1.安裝

2.基本使用

2.1 執行scrapyd

2.2 釋出工程到scrapyd

2.3 建立爬蟲任務

3. 檢視爬蟲任務

4.修改scrapyd的配置

一些常用命令：

相關推薦