Mac os 下 python爬蟲相關的庫和軟體的安裝

阿新 • • 發佈：2019-08-31

由於最近正在放暑假，所以就自己開始學習python中有關爬蟲的技術，因為發現其中需要安裝許多庫與軟體所以就在這裡記錄一下以避免大家在安裝時遇到一些不必要的坑。

一. 相關軟體的安裝：

1. homebrew:

homebrew 是mac os系統下的包管理器由於功能齊全所以在這裡比較推薦大家安裝，安裝及使用教程在我的另一篇部落格中，在此附上鍊接 homebrew的安裝。

2. anaconda：anaconda是python下的包管理器，支援建立虛擬環境等功能，個人認為比自帶的pip好用，安裝anaconda可以前往其官網，連結如下：

https://www.continuum.io/downloads，選擇python3版本的安裝包下載即可。

二. 請求庫的安裝

requests：由於requests是第三方庫，所以需要手動安裝，安裝過程如下。

1 .相關連結

Github：https://github.com/requests/requests

PyPi：https://pypi.python.org/pypi/requests

官方文件：http://www.python-requests.org

中文文件：http://docs.python-requests.org/zh_CN/latest

2. 安裝庫，我們使用conda指令進行安裝，在終端中輸入如下指令即可成功安裝requests庫

conda install requests

Selenium：是一個自動化的測試工具，利用它可以驅動瀏覽器執行特定的動作，如過頁面的資料通過JavaScript動態載入則需要使用到它，其安裝過程如下。

1. 相關連結

官方網站：http://www.selenium.org

Github：https://github.com/seleniumHQ/selenium/tree/master/py

PyPi：https://pypi.python.org/pypi/selenium

官方文件：http://selenium-python.readthdocs.io

中文文件：http://selenium-python-zh.readthedocs.io

2. 安裝庫，我們同樣使用 conda指令進行安裝，在終端中輸入如下指令即可安裝selenium庫

conda install selenium

ChromeDriver：應為selenium需要瀏覽器配合使用，那麼如果預設使用的是chrome瀏覽器，則需要安裝chromeDrvier驅動(版本需要與你使用的chrome的版本相容)，其安裝過程如下。

1. 相關連結

官方網站：http://sites.google.com/a/chromium.org/chromedriver

下載地址: http://chromedriver.storage.googleapis.com/index.html

2. 安裝chromedriver，由於我們安裝了homebrew包管理器，我們就可以直接使用brew指令進行安裝，在終端中輸入下列程式碼即可進行安裝chromedriver了

brew cask install chromedriver

3. 安裝好後，我們可以在程式中進行測試，程式碼如下

from selenium import webdriver

browser = webdriver.Chrome()

若能正確彈出空白的chrome瀏覽器，則證明配置沒有問題啦！

三. 解析庫安裝

lxml：是python的一個解析庫，用於解析html和xml並且對xpath表示式提供了支援，是一個很基礎的解析庫，安裝方式如下。

1. 相關連結

官方網站：http://lxml.de

Github：https://github.com/lxml/lxml

PyPI：https://pypi.python.org/pypi/lxml

2.我們使用conda指令進行安裝，只需在終端中輸入以下程式碼安裝即可

conda install lxml

BeautifulSoup：你沒看錯，它叫美麗湯，它可以解析html和xml並支援多種方式操作網頁中的標籤和屬性，非常強大的解析庫並且官方文件也很友好，安裝方式如下。

1. 相關連結

官方文件：https://www.cremmy.com/software/BeautifulSoup/bs4/doc

中文文件：https://www.cremmy.com/software/BeautifulSoup/bs4/doc.zh

2. 我們依舊使用conda指令進行安裝，在終端中輸入如下程式碼安裝即可

conda install beautifulsoup4

3. 安裝好後，我們可以在程式中測試它的解析功能，程式碼如下

from urllib.request import urlopen
from bs4 import BeautifulSoup

if __name__ == "__main__":
    html = urlopen("http://www.cnblogs.com")   #urlopen 獲取html頁面
    bs_obj = BeautifulSoup(html)               #BeauitfulSoup解析後返回
    print(bs_obj.get_text)                     #返回除標籤外的純文字

PyQuery：也是解析工具，提供與jquery(幾年前非常火熱的JavaScript框架)類似的語法解析html同樣也支援css選擇器，安裝方式如下。

1. 相關連結

Github：https://github.com/gawel/pyquery

PyPI：https://pypi.python.org/pypi/pyquery

官方文件：http://pyquery.readthedocs.io

2. 我們仍然使用conda指令安裝，但同時也可以使用pip3指令安裝，在終端輸入如下程式碼中的一個安裝即可

#使用 conda安裝
conda install pyquery
#使用 pip3安裝
pip3 install pyquery

tesserocr：可以用來識別驗證碼或者圖片的OCR(光學字元識別)解析庫，它是對python API的封裝，所以安裝它需要先安裝tesseract，它們的安裝方式如下

1. 相關連結

tesserocr Github：https://github.com/sirfz/tesserocr

tesserocr PyPI：https://pypi.python.org/pypi/tesserocr

tesseract 下載地址：http://digi.bib.uni-mannheim.de/tesserocr

tesseract Github：https://github.com/tesseract-ocr/tesseract

tesseract 語言包：https://github.com/tesseract-oct/tessdata

tesseract 文件：https://github.com/tesseract-ocr/tesseract/wiki/Documentation

2. 我們現需要使用brew指令安裝ImageMagick和tesseract庫，然後再使用conda指令安裝tesserocr庫，在終端中按次序輸入以下程式碼即可

# 安裝ImageMagick
brew install imagemagick
# 安裝 tesseract
brew install tesseract --all-languages
# 安裝 tesserocr
conda install tesserocr

3. 安裝好後，我們可以在程式中測試它是否能正確執行，程式碼如下

import tesserocr
from PTL import Image

image = Image.open('example.jpeg')
print(tesserocr.image_to_text(image)) #將圖片中的文字轉換為字串

好了至此，與python爬蟲相關的基礎庫已經安裝完成了，本文中並未涉及scrapy庫的安裝。因為個人認為還是先不要使用框架自己編寫爬蟲更能提升自己的編碼能力，謝謝大家的閱讀！

Mac os 下 python爬蟲相關的庫和軟體的安裝

由於最近正在放暑假，所以就自己開始學習python中有關爬蟲的技術，因為發現其中需要安裝許多庫與軟體所以就在這裡記錄一下以避免大家在安裝時遇到一些不必要的坑。一. 相關軟體的安裝： 1. homebrew: home

Windows環境下python爬蟲常用庫和工具的安裝（UrlLib、Re、Requests、Selenium、lxml、Beautiful Soup、PyQuery 、PyMySQL等等）

本文列出了使用python進行爬蟲時所需的常用庫和工具的安裝過程，基本上只有幾行命令列的功夫就可以搞定，還是十分簡單的。一、UrlLib 與 Re 這兩個庫是python的內建庫，若系統中已經成功安裝了python的話，這兩個庫一般是沒有什麼問題的。驗證開啟命令列，進入

不用下載字型解決Mac系統下Python的matplotlib庫中文亂碼的問題

百度或谷歌matplotlib庫繪圖時產生中文亂碼問題，得到的最多的答案就是下面幾行程式碼： import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['SimHei'] 很明

Mac OS 下手動編譯靜態庫及Xcode中使用該靜態庫的例子（一）

第一部分 Mac OS 下建立靜態庫前言眾所周知，Mac OS實際上是基於UNIX來編寫的，因此它保留了眾多的UNIX原有的特性，就靜態庫而言，仍舊以libXXXX.a來命名。要編譯Mac下的靜態庫，方法有很多，如使用Xcode的建立和編譯，也可以直接使用命令列(可結合

python爬蟲相關庫的下載配置

BeautifulSoup4 : 解析HTML //安裝： pip install beautifulsoup4 lxml : 解析HTML 1.安裝lxml: pip install lxml 2.wheel下載找到lxml的位置，會看到一系列.wh

Mac OS 下手動編譯靜態庫及Xcode中使用該靜態庫的例子（二）

前言在使用Xcode建立app時，通常需要呼叫一些第三方提供的靜態庫，這部分將詳細講述如何呼叫前面我們建立的靜態庫libperson.a。啟動Xcode並建立一個新的Xcode專案選擇單示圖應用進行建立輸入專案名並設定好將要執行的裝置設定專案要儲存的目錄

MAC OS 下protobuf 2.6.1 版本編譯安裝及proto型別檔案編譯

由於工程中proto語法採用的是2.0的，所以選擇安裝2.6.1版本的protobuf。（3.0和2.0語法不同，如果安裝3.0以上版本的protobuf,在編譯的時候應該需要增加啥~~~）編譯安裝步驟： 1. 安裝 protobuf 依賴項，其依賴於autoconf、 a

Python爬蟲實習筆記 | Week1 軟體安裝及基礎知識學習

2018/10/15 1.所思所想：今天劉鳳成學長跟我介紹了公司情況，以及我們小組的主要任務，即網路資料的爬取，決定學好學深，不辜負半年時光。下午的主要任務就是配置環境，所謂“工欲善其事，必先利其器”，但還是不能花太多時間，後面的具體工作才是根本。 2.工作：（1）ubuntu系統的安裝，因為之前

MAC OS 下多版本python共存和切換

轉自：http://lovekaiyuan.iteye.com/blog/2214417 Mac OS裡面的python預設為2.7版本，但是現在隨著python3越來越普及，覺得還是需要轉移到python3.畢竟是未來的趨勢。不過遇到的麻煩就是系統很多還是

Mac OS下搭建python環境

1. 安裝須知 Mac OS自身其實已經帶有Python，版本為2.7.X，這個Python主要用於支援系統檔案和XCode，所以我們在安裝新的Python版本時候最好不要影響這部分。這裡就會出現一個十分困擾的問題，我們按照上述步驟安裝好了自己所需要Python版本，目前我們一般都會選擇安

Mac OS下使用pyenv管理Python版本

問題的由來在開發過程中，可能會遇到多個版本同時部署的情況。 Mac OS自帶的Python版本是2.x，自己開發需要Python3.x 系統自帶的是2.6.x，開發環境是2.7.x 由於Ma

python使用requests庫和re庫寫的京東商品資訊爬蟲

1 import requests 2 import re 3 4 def getHTMLText(url): 5 try: 6 r = requests.get(url, timeout=30) 7 r.raise_for_status()

python使用requests庫和re庫寫的京東商品信息爬蟲

fin 搜索 goods tle 爬取 val timeout stat for 1 import requests 2 import re 3 4 def getHTMLText(url): 5 try: 6 r = reques

關於MAC OS下UE（UltraEdit），執行Python除錯結果的設定

1.開啟選單項“工具”下的“工具配置” 2.按如下圖設定，命令列中找到自己的python版本，後面加上%n%e 3.工具配置下，輸出選擇捕獲輸出，輸出處理選擇輸出至輸出視窗,最後確認即可 4.工具下出現對應的執行選項即可 5.點選剛剛新增的“RunPy

Mac OS下 Anaconda Python2 和 Python3 配置

最近在跟cs231n，官方推薦的是Python 2.7，因為Python 3有些特性向下不相容。但另一方面感覺Python 3會是將來的主流，所以PC上要經常切換Python版本。 Mac本身自帶Python 2.7，但安裝numpy等等科學計算包又很麻煩

Mac OS下搭建python+selenium環境

哈哈，對於我這個菜鳥，搭建環境的第一步是問度娘，順利的找到了一篇很給力的文章，基本寫的很清楚。連結如下（https://www.zhihu.com/question/30496889）按照這篇文章給的提示，下載了pip9.0.1的壓縮包，解壓縮並cd到pip9.0.1資料

C／C++學習筆記第一天：MAC OS下搭建GCC和Sublime Text環境

本科的時候倒是學習了C／C++／Java 這一路搞研究，基本上就是網路模擬，也不太需要太多的程式設計，多半是演算法模擬，所以程式設計感覺越來越差。人生總是那麼陰差陽錯，本科畢業的時候本來是計算機／金融雙學位，打算不再搞什麼計算機了，投身銀行算了。不料未及大四校園招聘，便被

Mac下Python匯入第三方庫

Mac下的Python自帶easy_install，開啟terminal輸入： $ sudo easy_install pip #安裝pip，一個用來管理第三方Module的玩意兒下載過程的長短和所在地區有關。如果因為網路問題下載不了，解決方法：前往p

Linux環境下非root使用者安裝Python及相關庫

以前在使用Python的時候，都是使用root使用者安裝好的全域性python，現在，因為root使用者安裝的Python版本太低，同時自己沒有root許可權去對全域性Python升級，所以要在非root使用者下安裝自己指定的Python。因此，就重新整理了一份如何在Li

MAC OS 下使用Android Studio獲取開發版和釋出版SHA1證書

** 釋出版： ** 1、開啟終端 CD 到Android Studio的檔案路徑下 2、輸入 keytool -list 3、展示出祕鑰庫條目，第一次生成時，會提示你新建條目

Mac os 下 python爬蟲相關的庫和軟體的安裝

相關推薦