1. 程式人生 > >python從零開始寫爬蟲(1)-- 開發環境搭建

python從零開始寫爬蟲(1)-- 開發環境搭建

我是一點都不會python,但為了寫爬蟲,所以就硬幹了。。。

1.windows下搭建python環境直接參考這個就行了安裝指南

2.透過pip安裝套件:1)pip install requests;2)pip install BeautifulSoup4

     具體操作:自己開啟cmd,敲進pip install requests,等等片刻即可;然後再接著pip install BeautifulSoup4

BeautifulSoup4這個庫主要是用來解析網頁的

3.安裝python開發工具:jupyter notebook

具體操作:pip install jupyter 即可

安裝成功後cmd輸入jupyter notebook即可直接開啟

4.使用jupyter notebook

 1)點選右上角的new->python

2)進入使用in為輸入,out為輸出結果:

3)點選上面選單欄“+”可進行新增一個in;執行則點選那個類似播放按鈕那個

ok!開發環境搭建好了!

未完待續....

相關推薦

python開始爬蟲1-- 開發環境搭建

我是一點都不會python,但為了寫爬蟲,所以就硬幹了。。。 1.windows下搭建python環境直接參考這個就行了安裝指南 2.透過pip安裝套件:1)pip install requests;2)pip install BeautifulSoup4      具體操

Python開始爬蟲BeautifulSoup庫使用

Beautiful Soup 是一個可以從HTML或XML檔案中提取資料的Python庫, BeautifulSoup在解析的時候是依賴於解析器的,它除了支援Python標準庫中的HTML解析器,還支援一些第三方的解析器比如lxml等。可以從其官網得到更詳細的資訊:http://beau

Python開始爬蟲requests庫使用

requests是一個強大的網路請求庫,簡單易用-讓 HTTP 服務人類。可以參考這個網站的介紹:http://cn.python-requests.org/zh_CN/latest/index.html 直接使用pip install requests安裝此模組之後,開始吧。

python開始爬蟲5-- 資料入庫

寫好的爬蟲,現在就讓他跑起來,把資料load到資料庫 具體操作: 1.安裝python 連結mysql的庫:pip install PyMySql 2.新建資料庫及表: DROP TABLE IF

Python開始系列連載1——安裝環境

前言 人生苦短,我選Python! ★★★★直奔主題!!! 安裝環境 現在,我帶大家裝anaconda,而不是裝Python。因為Python英文是蟒蛇,anaconda是水蟒。大家和我一起搜尋一下anaconda: 在首頁我們可以看到: P

0開始爬蟲1—— 配置工作環境

時間:2018/12/7 內容:爬蟲環境配置 資源:https://pan.baidu.com/s/1ULd7H_9B-wiKH2manP9Inw     提取碼:k7nv 資源簡介: Python 程式包:https://www.python.or

Python開始系列連載2——jupyter的常用操作

前文說了學Python先安裝anaconda的環境 我們現在來看看安裝完之後怎麼用 我已經迫不及待寫程式碼了 洋洋灑灑幾千行 喂,烙鐵,你的口水都流出來了,快醒醒【用力拍】 有需要Python學習資料的小夥伴嗎?小編整理一套Python資料和PDF,感興趣者

Python開始系列連載5——Python的基本運算和表示式

變數 變數是什麼意思?還記得之前講過的裝菜的盤子和碗麼?不記得就回去看看咯 如果你學過其他語言,使用變數先要定義,或者在定義的同時賦值 而派森的變數不需要單獨定義,你直接在賦值的過程中完成了定義 有需要Python學習資料的小夥伴嗎?小編整理一套Python資料和PD

Python開始系列連載14——Python特色資料型別字典

字典的操作 字典提供了很多方法對字典操作: 1.dict.keys() 作用:返回包含字典所有key的列表 2.dict.values() 作用:返回包含字典所有value的列表 3.dict.items() 作用:返

Python開始系列連載18——Python特色資料型別函式

無返回值的函式 之前說了好多,都是有返回值的函式,那有沒有沒返回值的函式呢? 這個可以有! 函式中變數的作用域 變數的作用域就是在程式中能對這個變數操作的區域範圍 有點像初高中學的函式的定義域 Python允許同名變數的出現

Python開始系列連載17——Python特色資料型別函式

函式 說到函式,如果你沒有程式設計基礎,可能馬上會想到初高中學過的: y = f(x) 例如:y = x +1 當我們 x = 1時,y = 2 x = 2,y = 3 小明:老溼,我們不是初中生! 函式可以將問題簡化,我們可以重複使用這個函式解決

Python開始系列連載22——Python檔案操作

檔案寫入 之前講過了檔案開啟建立和關閉,我們接著來談談檔案寫入 之前我們說了使用open()加上檔案的絕對路徑或者相對路徑可以開啟檔案 這裡我們講一個更簡單的方法 我們匯入os模組 os模組是和作業系統相關的模組 在Python中這樣操作:

Java 開始爬蟲gecco

廢話:    第一次學習並嘗試分析、爬取一個網站的資料,全部是從零開始的經驗,希望對各位看官有幫助,當然,本次爬取的是一個比較簡單的網頁,沒有任何反爬蟲措施的網頁。    網上查了一下Java爬資料,最原始的方式是用請求網頁的字串然後用正則解析標籤,再查了一下有什麼爬蟲、解析

Python開始系列連載24——Python的time模組簡單使用

time模組 在之前的課程中我們已經匯入過常用模組,比如 os 模組 我們在這節課中,要學習time模組的匯入和使用 time,顧名思義,是時間相關的模組~ 和 os 模組匯入方法相同 import 模組名 即可匯入模組 那什麼是模組

開始使用tensorflow1——安裝

1.      Python和jdk1.8之前已經安裝好了。 報平臺不支援這個whl檔案。 下載get-pip.py之後, python2.7 get-pip.py重新安裝pip後,再執行上面的命令,tensorflow就安裝好了。 3.      剛安裝完0.8.0

開始-vue.js1登入介面

一、利用Vue cli快速搭建專案(這裡假設已經安裝好所有webpack工具)進入工程資料夾(自己建的),在終端輸入:Vue init webpack toLogin2其中:toLogin2是專案名,可自定義,終端將自動載入和下載必要的包,然後有一些項需要自己選擇,如下圖:注

開始人工智慧01】人工智慧執行開發環境搭建

人工智慧執行開發環境搭建 一、系統要求 作業系統為Win10。如果有條件的話,建議還是在Linux系統下搭建人工智慧環境。 二、軟體安裝 由於使用Win10作業系統,環境搭建選定Anaconda軟體為基礎,人工智慧元件選擇了當前最熱的兩類:tensorflow和gym。

基於MT7688的OpenWrt學習筆記1——開發環境搭建

                                          &

區塊鏈1開發環境搭建及Hello World合約展示

開發環境搭建 如果你對於以太坊智慧合約開發還沒有概念,請先閱讀以太坊智慧合約入門,本文基於windows平臺開發。 Geth 安裝 以太坊的客戶端有很多,我們選擇開發過程中最為流行的Geth,其基於Go語言開發。 到官方地址下載相應的安

android學習之1----開發環境搭建

1.安裝JDK    JDK(Java Development Kit) 是 Java 語言的軟體開發工具包(SDK),通常安裝SE(Standerd Edition)版本。     安裝之後需設定系統環境變數:計算機---->右鍵---->屬性----&g