Python3爬蟲入門第一課

阿新 • • 發佈：2018-11-09

在印象中Python就是用來抓資料的，這次用的Python3.7，發現和以前的2.x的版本語法差別還是很大的，因為沒有進行版本相容。

# coding:utf-8
import urllib.request 
import re

def get_html(url):
	page = urllib.request.urlopen(url)
	html = page.read() #注意read和write方法都是獲取到位元組碼的
	return html
	
def get_image(htmlcode):
	reg = r'src="(.+?\.jpg)" width' #正則表示式 惰性匹配是從左側第一個字元開始向右匹配
	reg_img = re.compile(reg) #編譯
	imglist = reg_img.findall(htmlcode.decode('utf-8'))
	x = 0
	for img in imglist:
		urllib.request.urlretrieve(img, 'C:\\Users\\10129\\Desktop\\python\\img\\%s.jpg' %x)
		print(img)
		x += 1	
	
#寫到txt裡面去
def write2txt(htmlcode):
	pageFile = open("C:\\Users\\10129\\Desktop\\python\\pageCode.txt","wb+")
	pageFile.write(htmlcode)
	pageFile.close()

print ("--------網頁圖片抓取---------")
print ("請輸入url："),
url = input()
if url:
	pass  # 不做任何事情，用作佔位符
else:
	print ("-----沒有地址使用預設地址-------")
	url = 'http://tieba.baidu.com/p/1753935195'
htmlcode = get_html(url)
write2txt(htmlcode)
get_image(htmlcode)
print("FINISH!!!")

Python3爬蟲入門第一課

在印象中Python就是用來抓資料的，這次用的Python3.7，發現和以前的2.x的版本語法差別還是很大的，因為沒有進行版本相容。 # coding:utf-8 import urllib.request import re def get_html(url): page = url

Python3爬蟲入門第二課

前面用的一直是Python內建的urllib庫進行爬蟲實驗，後面發現原來用第三方庫requests更佳下面這個是對糗事百科的段子爬取，程式碼更加規範，符合面向物件，而且特別是requests用起來更方便在windows系統下只需要在命令列輸入命令 pip install requests 即

0x00-Kali Linux 系列入門第一課

bug 培訓追蹤社區架構 track lease 中心 image Kali Linux介紹篇 Kali Linux 官網：https://www.kali.org/ Kali Linux 前身是著名滲透測試系統BackTrack ，是一個基於 Debian 的 L

HTML 入門第一課

amp 查看獲得激活組成 lan 順序全面 lang HTML 簡單認識HTML（HyperText Markup Language）即超文本標記語言，是一種用來制作超文本文檔的簡單標記語言，也是制作網頁的最基本的語言，它可以直接由瀏覽器執行。1.HTML 是用來描

楊老師課堂之JavaEE三大框架Hibernate入門第一課

對象關系映射字段名過程回滾了解 property 測試存在 .org 本篇任務 1. 使用Hibernate框架完成對客戶的增刪改查的操作教學導航 1. 能夠說出Hibernate的執行流程 2. 能夠獨立使用Hibernate框架完成增刪改查的操作框架和

潭州課堂25班：Ph201805201 爬蟲基礎第一課 (課堂筆記)

這一變化提交數據 http 正常的分類求和風險 tls 爬蟲的概念：其實呢，爬蟲更官方點的名字叫數據采集，英文一般稱作spider，就是通過編程來全自動的從互聯網上采集數據。比如說搜索引擎就是一種爬蟲。爬蟲需要做的就是模擬正常的網絡請求，比如你在網站上點擊一個網

Java入門第一課：資料型別

Java入門第一課：資料型別文章目錄 Java入門第一課：資料型別 1. 科普類 2.資料型別 2.1整型 2.2浮點型別 2.3 char型別 2.4布林型別 2.5變數

python3爬蟲入門（urllib和requests簡單使用）

知道python有強大的的爬蟲庫，但是對於我們普通小白來說，寫一個完整的爬蟲需要知道什麼甚至瞭解什麼都是很重要的。掌握了這些基本點，才能夠熟悉爬蟲的構成和獲取有用的資訊。編寫一個小爬蟲個人感覺可以分為三個階段： 1：請求，這個就是使用urlib2或者requests

Python3爬蟲入門實戰系列（二）爬取貓眼電影排行榜

在進行本節實戰之前，希望您對requests庫以及正則表示式有所瞭解。執行平臺：windows Python版本： Python3.x 一、依賴庫的安裝在本節實戰之前，請確保已經正確安裝了requests庫 requests庫的安裝 pip3 instal

Android入門第一課之Java基礎

　　　　通知：由於本週六場地申請沒通過，所以本週的培訓臨時取消。今天給大家帶來的是Android入門的第一課，由於教室申請的不確定性，因此，每次培訓的內容都會在部落格先提前釋放出來。首先Androi

python3爬蟲入門程式

適用於有且只有一點Python3和網頁基礎的朋友,大牛&路人請繞道 (本文很多廢話,第一次在網上長篇大論,所以激動的停不下來,如果有大佬路過,也希望不要直接繞道,煩請指點一二) 感謝部落格園給了我一個機會,我喜歡的id還沒有被搶注,真的是太可怕了注:這是一段廢話,正文請直接跳過這一段. 大二的

day01-python入門第一課，python簡介

一、開發：　　1.開發語言　　　(1)高階語言：實現效率高，執行效率低，可移植性好 Python、Java、PHP、C++、C#、GO、ruby…　　生成==》位元組碼：通常指的是已經經過編譯，但與特定機器碼無關，需要直譯器轉譯後才能成為機器碼的中間程式碼

Hibernate入門第一課——遇到的問題

筆者在學習hibernate遇到了兩個問題第一個問題資料庫連結錯誤，報錯資訊如下 Exception in thread "main" org.hibernate.exception.JDBCConnectionException: Error calling Driv

JavaScrip 入門第一課

一、程式碼引入的三種方式　　1、直接在head中書寫在head標籤裡面可以寫，在body標籤裡面也可以寫，放到head標籤裡面和放到body標籤裡面到底有什麼區別，我們後續在講~ <head> <meta charset="UTF-8"> <tit

python3 [爬蟲入門實戰]爬蟲之mongoDB資料庫的安裝配置與視覺化

從安裝過程到視覺化工具可檢視資料資訊，歷時兩天，昨天坐了一天的火車，今天早上才到的青島–> 來放鬆心情。前天說是要學習如何使用mongoDB的連結與安裝。到今天過去了將一天，不過還是在函兮的嘮叨下慢慢的安裝好了，確實來之不易，一臉懵逼

Python入門第一課——Python的起源、發展與前景！

困難參數行集 caption 創業者是你七夕 python lin 我們在做任何一件事情之前，我們都會通過各種渠道去搜集事情的信息，了解事情的來龍去脈，學習一門編程語言也是如此，只有知根知底，我們才能有明確的方向和目標，以及底氣去完成這件事情，今天我帶大家來看看P

TensorFlow 入門第一課--基本函式學習（2）：tf.nn.conv2d 、tf.contrib.layers.flatten、tf.nn.max_pool 詳解

Tensorflow 提供了一些內建的API實現了CNN網路結構中的卷積，池化，全連線網路等運算操作。tf.nn.conv2d(input,filter, strides, padding, data_

Python3爬蟲入門之selenium庫的用法

Selenium 基本使用 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys

python3 [爬蟲入門實戰]爬蟲之scrapy爬取中國醫學人才網

自己第一次試著用scrapy進行爬取網頁，總共爬下9240條資料，也就兩分鐘不到，400多頁吧。用的比較簡單，但是爬取成功後感覺成就感滿滿的。來張爬取結果圖爬取欄位： “hospitalName”: “hospitalDesc”

菜鳥的Python入門第一課--Pycharm安裝和簡單使用

話不多說，直接開始。1.在OS平臺上安裝pycharm 首先確認你的系統是OS系統，然後去官網下載最新的pycharm，連線地址：Pycharm 然後選擇macOS的下載項，和你平時安裝一般mac上的軟體一樣，按步驟進行。安裝過程中注意選擇如下選項：Do

Python3爬蟲入門第一課

相關推薦