python爬取豆瓣網頁短評實戰！

阿新 • • 發佈：2019-02-13

首先我們開啟我的父親母親的網頁介面：連結（https://book.douban.com/subject/20389038/comments/），可以觀察到如下介面以及讀者對本書的評價：

接下來我們直接附上程式碼：

# 書名：我的父親母親
# 作者:  [英] 多麗絲·萊辛
# 出版社: 南海出版公司
# 原作名: Alfred and Emily
# 譯者: 匡詠梅
# 出版年: 2013-1
# 頁數: 238
# 定價: 29.50元
# 裝幀: 精裝
# 叢書: 新經典文庫·萊辛作品
# ISBN: 9787544263863


import requests
from lxml import etree
import pandas as pd
#通過觀察的url翻頁的規律，使用for迴圈得到10個連結，儲存到urls列表中
urls=['https://book.douban.com/subject/20389038/comments/hot?p={}'.format(str(i)) for i in range(1, 11, 1)]

comments = [] #初始化用於儲存短評的列表
for url in urls: #使用for迴圈分別獲取每個頁面的資料，儲存到comments列表
    r = requests.get(url).text
    s = etree.HTML(r)
    file = s.xpath('//div[@class="comment"]/p/text()')
    comments = comments + file

df = pd.DataFrame(comments) #把comments列表轉換為pandas DataFrame
df.to_excel('190.xlsx') #使用pandas把資料儲存到excel表格

結果如下：

大家可以嘗試更換網址對其它書籍的爬取，多動手實踐，就可爬取更多公開的資料，並對其進行分析，不一樣的驚喜等著你，只要你可努力。

python爬取豆瓣網頁短評實戰！

首先我們開啟我的父親母親的網頁介面：連結（https://book.douban.com/subject/20389038/comments/），可以觀察到如下介面以及讀者對本書的評價：接下來我們直接附上程式碼：# 書名：我的父親母親 # 作者: [英] 多麗絲·萊辛 #

詳解使用Python爬取豆瓣短評並繪製詞雲

使用Python爬取豆瓣短評並繪製詞雲成果如下(比較醜，湊合看) 1.分析網頁開啟想要爬取的電影，比如《找到你》，其短評如下: 檢視原始碼發現短評存放在<span>標籤裡並且class為short，所以通過爬取其裡邊的內容即可

Python爬取豆瓣電影的短評資料並進行詞雲分析處理

前言對於爬蟲很不陌生，而爬蟲最為經典的案例就是爬取豆瓣上面的電影資料了，今天小編就介紹一下如果爬取豆瓣上面電影影評，以《我不是藥神》為例。基本環境配置版本：Python3.6 系統：Windows 本人對於Python學習建立了一個小小的學習圈子，為各位提供了

Scrapy實戰篇（三）之爬取豆瓣電影短評

地址 pad __init__ {} 爬取 opera -m range pytho 今天的主要內容是爬取豆瓣電影短評，看一下網友是怎麽評價最近的電影的，方便我們以後的分析，以以下三部電影：二十二，戰狼，三生三世十裏桃花為例。由於豆瓣短評網頁比較簡單，且不存在動態加載的內

python爬取豆瓣小組700+話題加回復啦啦啦python open file with a variable name

技術分享 ash 寫入 blog ima ron tar 回復 -128 需求：爬取豆瓣小組所有話題（話題title，內容，作者，發布時間），及回復（最佳回復，普通回復，回復_回復，翻頁回復，0回復）解決：1. 先爬取小組下，所有的主題鏈接，通過定位nextp

關於html的多行匹配，正則re.S的使用（爬取豆瓣電影短評）

htm detail 3.1 port encoding 關於 color tel frame 參考鏈接：http://www.python(tab).com/html/2017/pythonhexinbiancheng_0904/1170.html(去除括號) 　　　　

python爬取豆瓣250存入mongodb全紀錄

xpath author cli content call function 取出 pycha 出版社用了一周的時間總算搞定了，跨過了各種坑，總算調試成功了，記錄如下： 1、首先在cmd中用命令行建立douban爬蟲項目 scrapy startproject douba

python 爬取豆瓣電影案例

數據 odin span content html temp com str self # conding=utf-8 from parse import parse_url import json class DoubanSpider: def __init

誰當年還沒看過幾本小說！我用Python爬取全站的的小說！

nec 打印 b數技術分享 mon 結果鏈接 ons ide 然後再將請求發送出去，定義變量response，用read（）方法觀察，註意將符號解碼成utf-8的形式，省的亂碼：打印一下看結果：看到這麽

利用Python爬取了1600個崗位！原來一個程式設計師的年薪可以這麼高！

Python學了這麼久，相信很多小夥伴都想知道錢途如何，全國各大城市招聘Python的崗位有多少，都招哪些職位，年薪如何等等，我爬取了拉勾近1600個Python相關的職位，我們用資料說話！進群：548377875 即可獲取數十套PDF哦！ &nb

python 爬取靜態網頁

# python 3.6.3 import re from urllib import request # '''網址''' 圖片_百度百科獲取整個網頁的程式碼 url = 'https://baike.baidu.com/item/%E5%9B%BE%E7%89%87/372416?fr

python 爬取動態網頁（百度圖片）

# python 3.6.3 import re import os from urllib import parse from urllib import request ################################################### # 搜尋關鍵字

爬取豆瓣電影短評並使用詞雲簡單分析top50

先使用程序池爬取豆瓣電影短評 import requests import re import random import time import pandas as pd from pymongo import MongoClient from multiprocessing import

python爬取豆瓣電影Top250的資訊

python爬取豆瓣電影Top250的資訊 2018年07月25日 20:03:14 呢喃無音閱讀數：50 python爬取豆瓣電影Top250的資訊。初學，所以程式碼的不夠美觀和精煉。如果程式碼有錯，請各位讀者在評論區評論，以免誤導其他同學。（

python 爬取豆瓣網搜尋結果同城活動資料

主要使用的庫： requests:爬蟲請求並獲取原始碼 re：使用正則表示式提取資料 json:使用JSON提取資料 pandas：使用pandans儲存資料 bs4:網頁程式碼解析以下是原始碼： #!coding=utf-8 import requests

教你用Python爬取豆瓣圖書Top250

質量、速度、廉價，選擇其中兩個這篇文章將會用到上一篇文章所講的內容，如果沒有看過可以去看一下教你用Python寫excel 今天我們要做的就是用Python爬取豆瓣圖書Top250，先開啟網站看一下今天不談這豆瓣圖書top250垃圾不垃圾的問題，只看看怎麼用p

Python爬取豆瓣TOP250圖書排行榜

# -*- coding: utf-8 -*- import bs4 import requests def open_url(url): # url = 'https://movie.douban.com/top250' hd = {}

python爬取豆瓣影評

看的別人的程式碼爬取某部影片的影評沒有模擬登入只能爬6頁 # -*- encoding:utf-8 -*- import requests from bs4 import BeautifulSoup import re import random import io

Python 爬取豆瓣

... import urllib.request import time from bs4 import BeautifulSoup def url_open(url): response = urllib.request.urlopen(url) return response

[轉載]Python爬取豆瓣影評並生成詞雲圖程式碼

# -*- coding:utf-8 -*- ''' 抓取豆瓣電影某部電影的評論這裡以《我不是潘金蓮為例》網址連結:https://movie.douban.com/subject/26630781/comments 為了抓取全部評論需要先進行登入 '''

python爬取豆瓣網頁短評實戰！

相關推薦