Python3.5下安裝&測試Scrapy

阿新 • • 發佈：2018-01-18

版本過低如果 ems 編寫 esp bsp 分享圖片 spi 基礎

1、引言

　　Scrapy框架結構清晰，基於twisted的異步架構可以充分利用計算機資源，是做爬蟲必備基礎，本文將對Scrapy的安裝作介紹。

2、安裝lxml

　　2.1 下載地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted　　選擇對應python3.5的lxml庫

技術分享圖片

2.2 如果pip的版本過低，先升級pip：

python -m pip install -U pip

2.3 安裝lxml庫（先將下載的庫文件copy到python的安裝目錄，按住shift鍵並鼠標右擊選擇“在此處打開命令窗口”）

pip install lxml-4.1.1-cp35-cp35m-win_amd64.whl

看到出現successfully等字樣說明按章成功。

3、安裝Twisted庫

3.1 下載鏈接：https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted　　選擇對應python3.5的庫文件

　　技術分享圖片

3.2 安裝

pip install Twisted-17.9.0-cp35-cp35m-win_amd64.whl

　　看到出現successfully等字樣說明按章成功。

4、安裝Scrapy

twisted庫安裝成功後，安裝scrapy就簡單了，在命令提示符窗口直接輸入命令：

pip install scrapy

　　看到出現successfully等字樣說明按章成功。

5、Scrapy測試

5.1 新建項目

　　先新建一個Scrapy爬蟲項目，選擇python的工作目錄（我的是：H:\PycharmProjects 然後安裝Shift鍵並鼠標右鍵選擇“在此處打開命令窗口”），然後輸入命令：

scrapy startproject allister

　　技術分享圖片

　　對應目錄會生成目錄allister文件夾，目錄結構如下：

└── allister
├── allister
│ ├── __init__.py
│ ├── items.py
│ ├── pipelines.py
│ ├── settings.py
│ └── spiders
└── scrapy.cfg


簡單介紹個文件的作用：
# -----------------------------------------------
scrapy.cfg：項目的配置文件；
allister/ : 項目的python模塊，將會從這裏引用代碼
allister/items.py:項目的items文件
allister/pipelines.py:項目的pipelines文件
allister/settings.py ：項目的設置文件
allister/spiders : 存儲爬蟲的目錄

5.2 修改allister/items.py文件：

# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# https://doc.scrapy.org/en/latest/topics/items.html

import scrapy


class AllisterItem(scrapy.Item):
    name = scrapy.Field()
    level = scrapy.Field()
    info = scrapy.Field()

5.3 編寫文件 AllisterSpider.py

# !/usr/bin/env python
# -*- coding: utf-8 -*-
# @File  : ItcastSpider.py
# @Author: Allister.Liu
# @Date  : 2018/1/18
# @Desc  :

import scrapy
from allister.items import AllisterItem


class ItcastSpider(scrapy.Spider):
    name = "ic2c"
    allowed_domains = ["http://www.itcast.cn"]
    start_urls = [
        "http://www.itcast.cn/channel/teacher.shtml#ac"
    ]

    def parse(self, response):

        items = []

        for site in response.xpath(‘//div[@class="li_txt"]‘):

            item = AllisterItem()

            t_name = site.xpath(‘h3/text()‘)
            t_level = site.xpath(‘h4/text()‘)
            t_desc = site.xpath(‘p/text()‘)

            unicode_teacher_name = t_name.extract_first().strip()
            unicode_teacher_level = t_level.extract_first().strip()
            unicode_teacher_info = t_desc.extract_first().strip()

            item["name"] = unicode_teacher_name
            item["level"] = unicode_teacher_level
            item["info"] = unicode_teacher_info

            items.append(item)

        return items

編寫完成後復制至項目的 \allister\spiders目錄下，cmd選擇項目根目錄輸入以下命令：　　

scrapy crawl ic2c -o ic2c_infos.json -t json

　　抓取的數據將以json的格式存儲在ic2c_infos.json文件中；

技術分享圖片

如果出現如下錯誤請看對應解決辦法：

Python3.5下安裝&測試Scrapy

版本過低如果 ems 編寫 esp bsp 分享圖片 spi 基礎 1、引言　　Scrapy框架結構清晰，基於twisted的異步架構可以充分利用計算機資源，是做爬蟲必備基礎，本文將對Scrapy的安裝作介紹。 2、安裝lxml 　　2.1 下載地址：https://

在Python3.5下安裝和測試Scrapy爬網站

1. 引言 Scrapy框架結構清晰，基於twisted的非同步架構可以充分利用計算機資源，是爬蟲做大的必備基礎。本文將講解如何快速安裝此框架並使用起來。 2. 安裝Twisted 2.1 同安裝Lxml庫 2.2 安裝twi

關於在Python3.5下安裝MySQL-python模組的問題

近端日子在學習Python的Django框架的時候，有需要安裝MySQL-python模組，一開始百度到用pip安裝： pip install MySQL-python 但是在安裝的時候卻報錯了： mysql.c(42): fatal error C10

在Python3.5下成功安裝Scrapy框架

一、本地環境win10+64位作業系統二、安裝步驟1、升級pip1.1 開啟命令提示符視窗，輸入命令：python -m pip install --upgrade pip2、安裝Visual Studio 2015專業版，自行解決。本人從事.NET開發，本機一直都有安裝，未

centos6.5下安裝python3安裝、python3虛擬環境創建venv

替代品虛擬環境由於需要 tools python2.6 ipy模塊 python2 pip3 　　原因：在安裝完centos6.5後，通過命令行鍵入python時，默認為python2.6.6版本，系統並沒有安裝python3版本。又想學習python3，因此需要在c

如何解決python3.5.2安裝scrapy的無法查找到vsvarall的問題

python scrapy vs140comntools vsvarall.bat windows twisted 最近在使用python的Scrapy爬蟲框架進行相應爬蟲項目的開發和學些。但是在Windows環境下安裝Scrapy的運行環境時，一直vsvarall.bat無法找到（i

【python3爬蟲】Scrapy Win10下安裝與新建Scrapy專案

詳細安裝教程可參考： http://www.runoob.com/w3cnote/scrapy-detail.html https://segmentfault.com/a/1190000013178839 其他教程： https://oner-wv.gitbooks.io/sc

Win7 64位環境下python3.5.4安裝步驟

一.初始環境介紹然後從官網:python官網下載windows對應的python版本，二.安裝流程 1.將python-3.5.4-amd64.exe抓到本地後,右鍵選擇”以管理員身份執行”,這一步是必須的,不然後面安裝時會報執行錯誤. 2. 執行安裝包

CentOS6.5 下安裝Python3.6

CentOS 6.5上預設安裝的python版本是2.6.6，系統自帶的舊版本python被系統很多其他軟體環境依賴，不能解除安裝原Python，選擇Python3.6進行全新安裝。 1、首先先下載Python3.6的linux安裝包 2、root許可權登入Centos6

windons系統下Python3.5版本安裝IPython

ipython 是一個 python 的互動式 shell，比預設的python shell 好用得多，支援變數自動補全，自動縮排，支援 bash shell 命令，內建了許多很有用的功能和函式。一看

python3.5 tensorflow安裝簡明教程（Linux下Anaconda安裝）

1、準備工作： 1）安裝Anaconda，自行搜尋，bash 執行即可安裝 wget https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh bash Anaconda3-5.

python3.5+selenium3.4自動化測試7_selenium的Webdriver_API整理（下）

7.設定等待時間 #匯入time包 import time #新增智慧等待 driver.implicitly_wait(30) #新增固定休眠時間 time.sleep(5)

contos6下 python3.5手動安裝pip

1、更換centos的yum源： 1）備份老的yum源 mkdir /tmp/yum mv /etc/yum.repos.d/*.repo /tmp/yum 2）下載新的CentOS-Base.repo 到/etc/yum.repos.d/ #centos5 wget -O /e

Linux 下 pip 升級遇到的問題 python3.5 和安裝 python pip

You are using pip version 8.1.1, however version 9.0.1 is available.You should consider upgrading via the 'pip install --upgrade pip' com

windows10+python3.5下同時安裝caffe和tensorflow

這幾天需要安裝caffe，但是大部分教程都沒有說怎麼在已經有tensorflow的同時安裝caffe。在這裡記錄一下，主要寫一下整個安裝過程中的大致流程，忽略詳細步驟。首先需要安裝anaconda，這裡安裝anaconda的主要原因是，它能夠管理環境，也就是

Python3.X下安裝Scrapy （轉自魚c論壇作者lumber2388779）

相信很多同學對於爬蟲需要安裝Scrapy時候，不想特地去安裝2.X版本我也是這樣一個懶人，我從網上找到這篇文章在Python3.x下安裝和測試Scrapy爬網站根據上邊的教程可以在我的電腦上正確安裝Scrapy電腦環境:Win7 64位系統Python版本:3.6以下轉自h

Python3.7下安裝scrapy框架

環境：Python 3.7.0 ( Jun 27 2018) [Win10 64 bit] 現在是2018年9月11日，安裝python3.7和scrapy，記錄安裝過程中出現了一些可能會出現的報錯。首先是安裝Python, 對應自己的OS版本 Python fo

python3.5下sklearn包的安裝報錯

之前跟著書上安裝了numpy和scipy，版本如圖：然後某一天我需要一個sklearn的包根據某書，用管理員許可權開啟一個cmd終端，輸入命令： pip3 install -U scikit-learn11 然後就安裝成功了。然後當我匯入時： impor

python3.5+selenium3.4自動化測試3_下拉框迴圈選擇

這邊繼續講登陸和登出的介面，現在有越來越多的登陸介面設計中英文登陸介面，或多語言登陸介面，一般以下拉框的形式存在對這個介面使用firebug-firepath檢視老規矩先上下程式碼 # _*_ coding: utf-8 _*_ imp

window環境python3.5下paramiko模組的安裝

想要學習paramiko模組，要自己安裝，於是開始查閱資料，果真是查了半天，親測有效，來這裡分享一下！希望可以幫助解決有同樣問題的人。要安裝paramiko模組，先要安裝朋友crypto模組。而python3.5官網是沒有對應的模組。找到一個連線，是別人自己寫的。 pi

Python3.5下安裝&測試Scrapy

1、引言

2、安裝lxml

3、 安裝Twisted庫

4、安裝Scrapy

5、Scrapy測試

相關推薦

3、安裝Twisted庫