python 爬蟲資料存入csv格式方法

阿新 • • 發佈：2018-11-09

命令儲存方式：
scrapy crawl ju -o ju.csv

第一種方法：
with open("F:/book_top250.csv","w") as f:
f.write("{},{},{},{},{}\n".format(book_name ,rating, rating_num,comment, book_link))
複製程式碼

第二種方法：
with open("F:/book_top250.csv","w",newline="") as f: ##如果不新增newline="",爬取資訊會隔行顯示
w = csv.writer(f)
w.writerow([book_name ,rating, rating_num,comment, book_link])
複製程式碼

方法一的程式碼：
import requests
from lxml import etree
import time

urls = ['https://book.douban.com/top250?start={}'.format(i * 25) for i in range(10)]
with open("F:/book_top250.csv","w") as f:
for url in urls:
r = requests.get(url)
selector = etree.HTML(r.text)

books = selector.xpath('//*[@id="content"]/div/div[1]/div/table/tr/td[2]')
for book in books:
book_name = book.xpath('./div[1]/a/@title')[0]
rating = book.xpath('./div[2]/span[2]/text()')[0]
rating_num = book.xpath('./div[2]/span[3]/text()')[0].strip('()\n ') #去除包含"(",")","\n"," "的首尾字元
try:
comment = book.xpath('./p[2]/span/text()')[0]
except:
comment = ""
book_link = book.xpath('./div[1]/a/@href')[0]
f.write("{},{},{},{},{}\n".format(book_name ,rating, rating_num,comment, book_link))

time.sleep(1)
複製程式碼

方法二的程式碼：
import requests
from lxml import etree
import time
import csv

urls = ['https://book.douban.com/top250?start={}'.format(i * 25) for i in range(10)]
with open("F:/book_top250.csv","w",newline='') as f:
for url in urls:
r = requests.get(url)
selector = etree.HTML(r.text)

books = selector.xpath('//*[@id="content"]/div/div[1]/div/table/tr/td[2]')
for book in books:
book_name = book.xpath('./div[1]/a/@title')[0]
rating = book.xpath('./div[2]/span[2]/text()')[0]
rating_num = book.xpath('./div[2]/span[3]/text()')[0].strip('()\n ') #去除包含"(",")","\n"," "的首尾字元
try:
comment = book.xpath('./p[2]/span/text()')[0]
except:
comment = ""
book_link = book.xpath('./div[1]/a/@href')[0]

w = csv.writer(f)
w.writerow([book_name ,rating, rating_num,comment, book_link])
time.sleep(1)

python 爬蟲資料存入csv格式方法

python 爬蟲資料存入csv格式方法

python爬蟲資料儲存到本地各種格式的方法

Python爬蟲資料的幾種儲存方法

python中把資料存入csv中

Python資料寫入csv格式檔案

python爬蟲#資料儲存#JSON/CSV/MYSQL/MongoDB/

Python處理 txt 、csv 格式資料

python爬蟲--解析網頁幾種方法之正則表達式

python爬蟲--解析網頁幾種方法之BeautifulSoup

python爬蟲神器PyQuery的使用方法

python 中資料結構的儲存方法

python爬蟲資料處理

風火程式設計--python爬蟲幾個xpath解析方法

python 儲存資料為excel格式和txt格式

Python中資料的CSV檔案存取

建站四部曲之Python爬蟲+資料準備篇(selenium)

用spark分析北京積分落戶資料，整理北京積分落戶名單資料成csv格式

python常見資料儲存 csv txt pickle

[Python爬蟲]requests模組使用post方法提交表單

利用正則表示式處理爬取的今日頭條內容資料（Python爬蟲資料清洗）

python 爬蟲資料存入csv格式方法

相關推薦