1. 程式人生 > >豆瓣小王子短評抓取——學習筆記(一)

豆瓣小王子短評抓取——學習筆記(一)

# -*-coding:utf-8-*-
import requests

r = requests.get('https://book.douban.com/subject/1084336/comments/').text

from bs4 import BeautifulSoup
soup = BeautifulSoup(r,'lxml')
pattern = soup.find_all('p','comment-content')
for item in pattern:
    print(item)  #加上string ,程式執行不了,報錯,找不到,define

import pandas
comments = []

for item in pattern:
    comments.append(item)  #加上string 執行不了
df = pandas.DataFrame(comments)
df.to_csv('comments.csv')

<p class="comment-content">漫山遍野的玫瑰,但真的,我最喜歡最初的那一朵,帶刺兒的那一朵。我能不能回去繼續澆灌那朵玫瑰⋯⋯</p>
<p class="comment-content">長這麼大,讀過次數最多的書就是《小王子》,我是那麼的愛這本書,可是我都沒有一本屬於我的小王子,每次想讀了就去圖書館借他,讀過很多版本的小王子,但是每次讀他,小王子在我心中都不一樣。我在我的612星球等我的小王子回家,但有時候我也不確定我是玫瑰還是狐狸或是那條毒蛇,可能我也是小王子。</p>

<p class="comment-content">原來在我還不懂愛情的時候就愛上了你</p>

怎麼把<p class="comment-content"> 去掉呢?

相關推薦

豆瓣王子短評——學習筆記

# -*-coding:utf-8-*- import requests r = requests.get('https://book.douban.com/subject/1084336/comments/').text from bs4 import Beautifu

Pyhon網路爬蟲學習筆記本地網頁

如何用Python爬取本地網頁   一、寫出一個簡單的靜態網頁,下面是我隨便寫的一個 網頁原始碼如下 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UT

機器學習筆記:最二乘法和梯度下降

一、最小二乘法 1.一元線性擬合的最小二乘法 先選取最為簡單的一元線性函式擬合助於我們理解最小二乘法的原理。 要讓一條直接最好的擬合紅色的資料點,那麼我們希望每個點到直線的殘差都最小。 設擬合直線為

微信程式入門學習筆記

入門級的跳轉格式: wx.redirectTo():不能返回上一層頁面 wx.navigateTo():用於頁面的跳轉 以上兩個不能跳轉於"tabBar" 因此跳轉"tabBar": wx.switchTab 感謝大佬的教程解答 了我的問題 以下附上原文連結 作者

微信程式——學習筆記:json

json配置檔案—— 1> app.json:作用於整個小程式全域性配置   頁面路徑——page(陣列[字串="路徑+檔名"])      "pages":["pages/index/index","pages/log/index"]

微信程式學習筆記之框架及工具

文章目錄 一、app.json的配置 1. 決定頁面檔案路徑 2. 配置視窗表現 3. 配置tab標籤導航 4. 設定網路超時時間 5. 配置debug模式 二、App()函式使用

python新人白學爬蟲,學習筆記——前期的環境準備

前幾天,我剛剛進行了爬蟲基本知識和學習背景的總結和筆記,今天記錄的是Python的爬蟲入門實踐須知。 首先,是環境的配置 學習python網路爬蟲技術當然需要在Python的環境下,對此,我們可以直接使用Python官網提供的各種不同版本的Python3,當

微信程式學習筆記----微信程式入門簡介,開發者工具基礎使用

到現在學習小程式已經不早了,但是無論什麼時候開始都不晚,只要學就OK。 看到所有小程式開發的教程全部都是以註冊賬號開始的,但是註冊賬號的過程無論是官方文件還是其他的經驗帖子都已經有一堆了,而且本身這個過程也並不具有什麼技術性,實在是很多收費的教程視訊用來前期拖時間的一種方式

程式學習筆記

關於小程式的認知,   小程式作為微信為載體的負載應用,擁有廣大的潛在流量群,在現在app氾濫與手機記憶體嚴重被閒置app佔用的浪潮中,輕量化的整合應用成為主流,而小程式集合了廣流量平臺、輕應用以及web App的優勢於一身,必將擁有廣闊的前景,所以對於我們這些猿猿來說,學習小程式能讓我們在行

白 Laravel 學習筆記

前言:大二(2016)的時候就接觸了PHP,語法學到一定程度之後開始學習框架,在網上比較一番之後決定先學習 ThinkPHP ,因為據說對新手友好。但是一直知道 Laravel 是 PHP 眾多框架中最火熱的一款,之前有看視訊學習,但視訊一上來就給我整一堆不知道具體有什麼用的新概念腦子都是懵

python爬蟲學習筆記—— 爬騰訊視訊影評

       前段時間我忽然想起來,以前本科的時候總有一些公眾號,能夠為我們提供成績查詢、課表查詢等服務。我就一直好奇它是怎麼做到的,經過一番學習,原來是運用了爬蟲的原理,自動登陸教務系統爬取的成績等內容。我覺得挺好玩的,於是自己也琢磨了一段時間,今天呢,我為大家分享一個爬蟲

java安全框架-Shiro學習筆記-入門案例

Apache Shiro是一個強大且易用的Java安全框架,執行身份驗證、授權、密碼學和會話管理。 我們先來一個簡單的示例 1、建立maven專案 2、將依賴jar包引入專案中,包括shiro和sl

前端技術JQuery學習筆記JQuery文件準備就緒事件、JQuery事件處理、JQuery物件與DOM物件的、JQuery

一、JQuery,是一套JavaScript的函式庫(類庫),可以很大程度上簡化js程式碼。所以,利用Jquery對HTML元素的操作更加的便捷。 1、JQuery的核心函式:jQuery()函式,利用這個核心函式可以完成html元素的選取功能

學習筆記C#基礎和泛型List和DataTable和HashTable和Dictionary的簡單用法--存值

<pre name="code" class="csharp">//Dictionary Dictionary<string, string> dic = new Dictio

人工智慧中小樣本問題相關的系列模型演變及學習筆記:元學習樣本學習

【說在前面】本人部落格新手一枚,象牙塔的老白,職業場的小白。以下內容僅為個人見解,歡迎批評指正,不喜勿噴![握手][握手] 【再囉嗦一下】本來只想記一下GAN的筆記,沒想到發現了一個大宇宙,很多個人並不擅長,主要是整理歸納! 一、Meta Learning 元學習綜述 Meta Learning,又稱為 l

python框架之 Tornado 學習筆記

tornado pythontornado 一個簡單的服務器的例子:首先,我們需要安裝 tornado ,安裝比較簡單: pip install tornado 測試安裝是否成功,可以打開python 終端,輸入: import tornado.https

Scala學習筆記編程基礎

大數據 上一個 extends 移除 condition api arr 調用方法 tab 強烈推薦參考該課程:http://www.runoob.com/scala/scala-tutorial.html 1. Scala概述 1.1. 什麽是Scala Scala

3D Game Programming withDX11 學習筆記 數學知識總結

表示 圖形 http 根據 轉置 元素 material -s com   在圖形學中,數學是不可或缺的一部分,所以本書最開始的部分就是數學知識的復習。在圖形學中,最常用的是矢量和矩陣,所以我根據前面三個章節的數學知識,總結一下數學知識。 一、矢量   數學中的矢量,擁有

系統分析與設計學習筆記

學習 掌握 應該 溝通 基本 最終 表示 對象 毫無 為什麽要學習這門課程?   “擁有一把錘子未必能成為建築師”。 這門課程學習的是面向對象分析和設計的核心技能的重要工具。對於使用面向對象技術和語言來,創建設計良好、健壯且可維護的軟件來說,這門課程所

最大熵學習筆記預備知識

color wrap targe dsm entropy plus 文件 eight 相關鏈接 生活中我們常常聽到人們說“不要把雞蛋放到一個籃子裏”。這樣能夠減少風險。深究一下,這是為什麽呢?事實上,這裏邊包括了所謂的最大熵原理(The Maxim