1. 程式人生 > >python例項2-寫一個爬蟲下載小功能

python例項2-寫一個爬蟲下載小功能

主要是通過url,和re兩個模組對一個網頁的固定圖片進行模糊匹配後下載下來。

#! /usr/bin/python
import re
import urllib

def gethtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getimg(html):
    reg = r'src="(.*?\.jpg)" width'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1

html = gethtml("http://www.zhuoku.com/")
print getimg(html)
~                        
程式碼比較簡單,定義了兩個模組,使用url獲取到網頁資訊,使用re模組匹配到jpg的檔案,最後下載下來。

相關推薦

python例項2-一個爬蟲下載功能

主要是通過url,和re兩個模組對一個網頁的固定圖片進行模糊匹配後下載下來。 #! /usr/bin/python import re import urllib def gethtml(url):

我的第一個python web開發框架(2)——一個簡單的外包

span 技術 進行 target 最好 自己 blog height 描述   第一部分說明   第一部分大概有20來章,主要講的是一些開發常識、開發前中後期準備內容、開發環境與服務器部署環境安裝設置、python基礎框架結構與功能等內容,代碼會比較簡單。   

python練習題,一個方法 傳進去列表和預期的value 求出所有變量得取值可能性(例如list為[1,2,3,4,5,6,12,19],value為20,結果是19+1==20只有一種可能性),要求時間復雜度為O(n)

num bubuko com pri def 代碼 data- 取值 .com 題目:(來自光榮之路老師)a+b==valuea+b+c=valuea+b+c+d==valuea+b+c+d+...=valuea和b....取值範圍都在0-value寫一個方法 傳進去列

還沒爬蟲白點進來,一文帶你入門python爬蟲白福利)

入門 準備工作 需要準備的東西: Python、scrapy、一個IDE或者隨便什麼文字編輯工具。 隨便建一個工作目錄,然後用命令列建立一個工程,工程名為miao,可以替換為你喜歡的名字。 scrapy startproject miao 隨後你會得到如下的一個由scrapy建立

一天時間入門python爬蟲,直接一個爬蟲案例,分享出來,很簡單

經過兩天的摸索,終於寫出了一個小小小爬蟲。我的電腦是沒有配置python環境的,所以首先要上官網下載python的環境檔案。   點選點頭指向的按鈕,下載到桌面,它是一個這樣的檔案“python-3.6.5.exe”,下載成功後直接點選安裝,安裝成功後,那接下來就是配置環境變數啦。 &

經典案例:利用表單(models.Model)一個登入註冊例項

1、models.py檔案: from django.db import models class User(models.Model): username = models.CharField(max_length=100) password = mode

Python一個男女相親程式|碼農的情人節

碼農這個群體,高學歷,高工資,高智商,但是不善於交流,圈子也很小,相信很多小夥伴或者周圍的小夥伴,都有相親的經歷,或者被父母逼去相親的經歷,一般都是問年齡,你要找什麼樣的,有的還特講究生肖匹配,記得網上有一個段子,說男的20-60歲都只喜歡一種型別的女孩,而20歲到60歲的女孩相親需求卻不斷

使用nodeJS一個簡單的爬蟲

需要安裝的依賴: requset 使用request向需要爬取的網站發起一個請求,在回撥裡使用body接收資料 我選取百度相簿,作為本次爬取的網站 使用百度搜素二次元萌妹子,然後在位址列裡將URL複製下來 const request = require('request'); const

python一個猜數字遊戲

print('歡迎您來到猜數字小遊戲,請猜出在0到500的範圍的數字!') import random number=random.choice(range(500)) guess=-1 while guess!=number: guess=int(input("請輸

python一個搶票程式(無驗證碼)

準備工作:利用到的庫: requests、time、re、threading、wx利用chrome抓包模擬校園網登入的python指令碼:開啟瀏覽器的開發者工具,在network中找到 所有場館頁面資訊的url 和 傳送訂票請求的url。我在這次用到的有:url、reques

python 一個年會抽獎程序

搜索路徑 ole 含義 讓其 找到 python .py console 參數 使用 pyinstaller 打包工具常用參數指南 pyinstaller -F demo.py 參數 含義 -F 指定打包後只生成一個exe格式的文件 -D –onedir 創建一個

Python零基礎入門學習 pdf下載 甲魚

《Python零基礎入門學習-水木書薈》適合學習Python3的入門讀者,也適用對程式設計一無所知,但渴望用程式設計改變世界的朋友們!《Python零基礎入門學習-水木書薈》提倡理解為主,應用為王。因此,只要有可能,小甲魚(作者)都會通過《Python零基礎入門學習-水木書薈》中生動的例項來讓

Python中自己一個計時器,計算一個過程所需秒數

import time import sys import numpy as np i = np.arange(1, 5000) def k_timer(bool_start_end, start_time): if bool_start_end: return tim

開始一個爬蟲(1)

net 興趣 可能 pytho pycha 備註 其他 nco 編碼方式 因為是作為筆記寫的,所以會很啰嗦,而且代碼不會全部展示。。 首先,你要確定一個目標,就是你要爬的網站。我選的就不說了,比較邪惡,需要18歲以下的小僵屍繞路。 選好之後,構思下整個腳本的大致結構。 1.

ES6 手一個“辨色”遊戲

1. 前言 依稀記得幾年前朋友圈流行的辨色小遊戲,找出顏色不同的矩形。前些天突發奇想,打算自己手寫一個類似的遊戲,話不多說,先上 Demo . 本例項基於 ES6 實現,併兼容 ie9及以上。 2. 專案結構 index.html index.css index

微信程式——手把手教你一個微信程式

前言   微信小程式年前的跳一跳確實是火了一把,然後呢一直沒有時間去實踐專案,一直想搞但是工作上不需要所以,嗯嗯嗯嗯嗯emmmmm..... 需求   小程式語音識別,全景圖片觀看,登入授權,獲取個人基本資訊 一:基礎框架 跟著官方文件一步一步來,新建一個小程式專案就好 然後呢,畢竟預設的只是基本骨架

Flutter實戰2 --- 一個天氣查詢的APP

程式碼github地址:github.com/koudle/GDG_… 前面一篇文章Flutter實戰1 --- 寫一個天氣查詢的APP ,實現了一個顯示城市、溫度、天氣、溼度的介面,但是這個介面只有一個顯示的功能,沒有任何可互動的地方,本篇文章繼續完善查詢天氣的APP的功能。 增加兩個功能: 新

使用node一個爬蟲(原來使用node.js做爬蟲如此簡單!)

npm中有一個crawler模組是專門用來爬取資料的,可以上別人的網站爬取的資料儲存在資料庫中,程式碼使用過程如下: // 匯入模組 mysql const mysql=require('mysql'); // 匯入模組 Crawler const Crawler=require('Cr

Python-Matplotlib(2)打造一個完整的折線圖

import pandas as pd import matplotlib.pyplot as plt unrate = pd.read_csv('unrate.csv') unrate['DATE'

一個微信程式自定義公共元件

微信小程式已經推出一段時間了,官方也提供很多元件,但是有些業務場景,官方元件難免有些捉襟見肘,這時候,就需要自己開發一個自定義元件了。但是微信小程式其實是做了很多限制的,本文記錄了開發(踩坑)一個公共登入彈出框元件的過程,僅供參考。 1. 一個元件的組成部分 一個微信