在Python3中安裝Scrapy及常見錯誤

阿新 • • 發佈：2019-02-05

本文整理來自韋蘇恩老師的課程《Python大型網路爬蟲專案開發實戰》

Scrapy要求安裝python3.x版本，我安裝了3.5版本。

-1、安裝python3.x

0、安裝pip
一路cd索引到easy_install.exe所在的地方，執行指令“easy_install.exe pip”,安裝完成後輸入pip命令驗證是否安裝成功。
記得新增python.exe pip.exe到環境變數。

1、要求升級pip為最新版

網路安裝，cmd: python -m pip install --upgrade pip

2、升級wheel

網路安裝，cmd: pip install wheel。因為後面要安裝其他軟體包的whl安裝包

3、安裝vspro版

4、安裝lxml

本地安裝，進入到whl檔案的目錄，然後cmd: pip install lxml....whl

5、安裝twisted

本地安裝，進入到whl檔案的目錄，然後cmd: pip install twisted....whl

6、安裝scrapy

網路安裝，cmd: pip install scrapy，也可指定版本，比如: pip install scrapy==1.1.0rc3

7、驗證scrapy是否安裝成功

cmd: scrapy -h

Scrapy常用命令

分兩種：全域性命令和專案命令

全域性命令就是上面cmd: scrapy -h返回的命令，常用的有runspider, startproject

執行爬蟲檔案cmd: scrapy runspider abc.py

不顯示log: --nolog

建立爬蟲專案cmd: scrapy startproject projectname

進入爬蟲專案cmd: cd .\projectname\

輸入cmd: scrapy -h 返回的資訊包含的命令就是專案命令

cmd: scrapy bench檢視硬體環境，我的PC每分鐘大約爬2000多個網頁

cmd: scrapy genspider 建立爬蟲檔案

cmd: scrapy genspider -l 檢視爬蟲檔案模板: basic crawl csvfeed xmlfeed，我們一般用basic

建立爬蟲檔案爬取百度網頁：cmd: scrapy genspider -t basic fileBaidu baidu.com

檢查爬蟲檔案是否建立成功：cmd: scrapy check fileBaidu

執行爬蟲檔案cmd: scrapy crawl fileBaidu

列出當前專案中有的爬蟲檔案cmd: scrapy list

用編輯器開啟爬蟲檔案cmd: scrapy edit fileBaidu (windows 有問題）

獲取URL網址，並指用對應爬蟲檔案進行處理和分析 cmd: scrapy parse http：//www.baidu.com，不常用

Scrapy爬蟲專案的建立及爬蟲的建立

我運行了爬百度標題的指令碼，理論上不會有問題，但因為我的電腦之前編碼方式改成了850拉丁文，所以在獲取標題後編碼處理上報了錯，把電腦編碼方式改回936中文即可。

在Python3中安裝Scrapy及常見錯誤

本文整理來自韋蘇恩老師的課程《Python大型網路爬蟲專案開發實戰》Scrapy要求安裝python3.x版本，我安裝了3.5版本。-1、安裝python3.x0、安裝pip一路cd索引到easy_install.exe所在的地方，執行指令“easy_install.exe

WinPcap快速安裝步驟及常見錯誤總結

WinPcap 是網路抓包常用工具，新手入門的時候難免遇到一些C語法上的錯誤，在此小結一下常見的幾個錯誤及解決方法。 1. 錯誤提示：d:\c++\microsoft visual studio\myprojects\get_arp\1.cpp(20) : error C2011: 'in

JNI學習二之（C原始碼中Log輸出及常見錯誤）

瞭解jni JNI 即Java Native Interface ，Java本機介面。可以實現Java和C/C++之間的相互呼叫。為什麼使用JNI? 擴充套件了Java虛擬機器的能力，C語言可以進行驅動開發，比如wifi共享熱點的驅動 Native c

Python3環境安裝Scrapy爬蟲框架過程及常見錯誤

收錄待用，修改轉載已取得騰訊雲授權 Scrapy安裝介紹 Scrapy的安裝有多種方式，它支援Python2.7版本及以上或Python3.3版本及以上。下面說明Python3環境下的安裝過程。 Scrapy依賴的庫比較多，至少需要依賴庫有Twiste

在myeclipse中使用maven前常見錯誤及解決辦法

eclips aam lai loj yate ren err jar ued %E4%BD%BF%E7%94%A8CHttpFile%E4%BB%8E%E6%9C%8D%E5%8A%A1%E5%99%A8%E7%AB%AF%E6%AD%A3%E7%A1%AE%E7%9A%

Apache+php+MySQL 安裝注意細節及常見錯誤

1: 完成apache的安裝（一路預設） 1> 修改httpd.conf 中documentroot 為 E:\web server\Apache24\htdocs （即你的網站存放目錄）有的直接修改這一行的 Define SRVROOT "E:\web server\Apache24"，則

Apache （支援IPv6）安裝及常見錯誤

1：下載支援IPv6的Apache版本（http://www.apachehaus.com/cgi-bin/download.plx）可以找到你想要各種Apache支援IPv6的版本,記得安裝對應的vc9 和VC11。 2：下載後，解壓到你想要的目錄。（E:\web server\Apach

Anaconda下安裝pyecharts步驟及常見錯誤

（1）之前看了幾篇部落格，有人說用cmd命令在目錄C:\Users\Administrator\Anaconda3\Lib\site-packages下執行pip install pyecharts,執行之後沒有錯誤，顯示安裝成功。但是重新開啟JupyterNotebook執行from pyecha

Nginx安裝及常見錯誤

1.Nginx安裝環境 Nginx是C語言開發,建議在linux上執行,本教程使用Centos7.0作為安裝環境.1)gcc安裝nginx需要先將官網下載的原始碼進行編譯，編譯依賴gcc環境，如果沒有gcc環境，需要安裝gcc需要執行的命令:yum install gcc-c++ 2)

IOS開發-CocoaPods安裝和使用教程及常見錯誤

CocoaPods是iOS最常用的第三方類庫管理工具，絕大部分有名的開源類庫都支援CocoaPods。所以，作為iOS程式設計師，掌握CocoaPods的使用是必備技能。下面我們就來講一下CocoaPods的安裝流程。第一步：安裝cocoapods sudo gem

初識Linux（五）--vsftp的安裝及常見錯誤

安裝：可以到官方網站去下載 http://vsftpd.beasts.org 也可以用光碟安裝，RedHat 5的安盤裡自帶的，所以我選擇光碟安裝 (1)先把光碟掛載到系統上： mount /dev/cdrom /mnt 這樣光碟的內容就被掛載到/mnt的裝置上，現在可

Linux下安裝Nginx完整教程及常見錯誤解決方案

1.Nginx安裝環境 Nginx是C語言開發,建議在linux上執行,本教程使用Centos7.0作為安裝環境.1)gcc安裝nginx需要先將官網下載的原始碼進行編譯，編譯依賴gcc環境，如果沒有

git安裝詳細過程及常見錯誤解決過程

目的：通過Git管理github託管專案程式碼一、下載安裝Git1、下載Git 官方地址為：https://git-scm.com/download/win。根據自己的需要選擇對應的版本2、下載好之後點選安裝，可自定義安裝路徑，2.17版本可按照預設選項進行安裝，這裡講一講遇到的問題：安裝完成後可在開始選單

解析專案中Jenkins配置的常見錯誤及心得：

Jenkins的搭建檔案和配置過程，大家可以找我，簡單記錄一下對Jenkins的認識！關鍵兩個部分的理解： /t:ResolveReferences;Compile/t:_CopyWebApplic

CocoaPods 的解除安裝、安裝、更新及常見錯誤

原文地址一、CocoaPods 的解除安裝有的時候我們需要降低Cocoapods的版本來解決第三方庫的相容問題.1. 移除pod元件這條指令會告訴你Cocoapods元件裝在哪裡 :$ which pod你可以手動移除這個元件 :$ sudo rm -rf <path>2.移除 RubyGems

安裝mysql服務器及常見錯誤處理

exist 方式 com command chan server dev sel 密碼過期這是一篇在centos 6 Linux系統上安裝Mysql server的記錄。 https://dev.mysql.com/downloads 下載安裝mysql服務rpm

【轉】Anaconda下安裝pyecharts步驟及常見錯誤

name geo 步驟聲明安裝 ini href ech dash 本文轉載自：https://blog.csdn.net/skj1995/article/details/81187954 （1）之前看了幾篇博客，有人說用cmd命令在目錄C:\Users\Adm

Mongodb 參數說明及常見錯誤處理

spa 子目錄產生文件名 securecrt 添加 refused air 密碼在 CentOS7 上安裝 MongoDB 1 通過 SecureCRT 連接至 CentOS7 服務器； 2 進入到 /usr/l

WebLogic安裝使用及常見問題

1.4 為我 mic 電腦 jdk tps weblogic round images WebLogic的下載與安裝參考地址：http://blog.csdn.net/acmman/article/details/70093877 安裝常見問題： 1. 虛擬內存不足

VS2010中安裝Qt插件錯誤

qt安裝完QT插件，啟動VS2010時提示：Couldn‘t register all Qt4VSAddin commands:未能加載文件或程序集"stdole,version=7.0.3300.0......"一個很長的對話框，點擊確定後，進入VS2010 IDE界面後，沒有qt插件菜單。需要在windo

在Python3中安裝Scrapy及常見錯誤

相關推薦