1. 程式人生 > >python初級實戰系列教程《一、爬蟲之爬取網頁、圖片、音視訊》

python初級實戰系列教程《一、爬蟲之爬取網頁、圖片、音視訊》

python基礎知識可以到廖雪峰大佬的官網學習哦!
廖雪峰官網網址

學完python就開始我們的實戰吧!首先我們就來學習下python爬蟲
學習Python爬蟲,先是介紹一個最容易上手的庫urllib,非常適合學習爬蟲。

**

1、爬取網頁

**

import urllib.request
#爬取百度網頁html
baidu_url = "http://www.baidu.com"
result = urllib.request.urlopen(baidu_url)
#讀取
html = result .read()
#解碼並打印出來
print(html.decode('utf-8'
)) # url中包含漢字是不符合URL標準的,需要進行編碼 # 編碼後:http%3A//www.%E7%88%AC%E8%99%AB.com urllib.request.quote('http://www.爬蟲.com') # 解碼後:http://www.爬蟲.com urllib.request.unquote('http%3A//www.%E7%88%AC%E8%99%AB.com')

**

2、爬取二進位制檔案

**

1)爬取圖片

import urllib.request
#圖片url,我們百度首頁logo下載下來
picture_url = "https://www.baidu.com/img/bd_logo1.png"
result = urllib.request.urlopen(picture_url) picture = result.read() #建立圖片檔案 with open("baidu_logo.png", "wb") as f: #寫入二進位制資料 f.write(picture)

2)爬取音訊

import urllib.request
#歌曲url,我們就下載一首王力巨集的改變世界吧
audio_url = "http://m10.music.126.net/20180302001718/2da3721ebef7f851cf8e39a9ebe30327/ymusic/cd72/f24d/bd25/ccd471214e64e65f541297a7bdf1cd62.mp3"
result = urllib.request.urlopen(audio_url) audio = result.read() #建立mp3檔案 with open("change_word.mp3", "wb") as f: #寫入二進位制資料 f.write(audio)

順便告訴大家一個獲得音樂下載連結的方法,以後想聽什麼歌都可以免費下載了
順便告訴大家一個獲得音樂下載連結的方法,以後想聽什麼歌都可以免費下載了

3)爬取視訊

import urllib.request
#視訊url,就下載下人人車的廣告視訊吧(因為它比較小)
video_url = "http://113.113.73.41/r/baiducdngdct.inter.iqiyi.com/videos/other/20180212/07/5c/8747c90718618294a6d122f6b02ee090.f4v"
result = urllib.request.urlopen(video_url)
video = result.read()
#建立視訊檔案
with open("ad.f4v", "wb") as f:
    #寫入二進位制資料
    f.write(video)

今天就到這吧,是不是很簡單呀!哈哈…
如果覺得對您有幫助
我,秦始皇,打賞!

這裡寫圖片描述

這裡寫圖片描述