資料分析？小意思！python幫你搞定

阿新 • • 發佈：2018-12-15

資料分析？小意思！python幫你搞定

前言

如果大家經常閱讀Python爬蟲相關的公眾號，都會是以爬蟲+資料分析的形式展現的，這樣很有趣，圖表也很不錯，今天了，我就來分享上一次在培訓中的一個作品：貓眼電影爬蟲及分析。

通過貓眼電影TOP100榜的爬蟲，然後進行視覺化，讓學員體會到，小資料爬蟲也能玩出這樣的花樣來。

爬蟲

爬蟲分析

這裡是獲取的是top100的電影資料，進行了跨頁爬蟲，獲取的欄位：電影名，主演，上映時間，評分，電影型別和時長。最後儲存在csv檔案中。

爬蟲程式碼

import requests
from lxml import etree
import csv
headers = {
 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
}
def get_url(url):
 res = requests.get(url,headers=headers)
 html = etree.HTML(res.text)
 infos = html.xpath('//dl[@class="board-wrapper"]/dd')
 for info in infos:
 name = info.xpath('div/div/div[1]/p[1]/a/text()')[0]
 info_url = 'http://maoyan.com' + info.xpath('div/div/div[1]/p[1]/a/@href')[0]
 star = info.xpath('div/div/div[1]/p[2]/text()')[0].strip()
 release_time = info.xpath('div/div/div[1]/p[3]/text()')[0].strip()
 score_1 = info.xpath('div/div/div[2]/p/i[1]/text()')[0]
 score_2 = info.xpath('div/div/div[2]/p/i[2]/text()')[0]
 score = score_1 + score_2
 # print(name,star,release_time,score,info_url)
 get_info(info_url,name,star,release_time,score)
def get_info(url,name,star,time,score):
 res = requests.get(url, headers=headers)
 html = etree.HTML(res.text)
 style = html.xpath('/html/body/div[3]/div/div[2]/div[1]/ul/li[1]/text()')[0]
 long_time = html.xpath('/html/body/div[3]/div/div[2]/div[1]/ul/li[2]/text()')[0].split('/')[1].strip()
 print(name,star,time,score,style,long_time)
 writer.writerow([name,star,time,score,style,long_time])
if __name__ == '__main__':
 fp = open('maoyan_2.csv','w',encoding='utf-8',newline='')
 writer = csv.writer(fp)
 writer.writerow(['name','star','time','score','style','long_time'])
 urls = ['http://maoyan.com/board/4?offset={}'.format(str(i)) for i in range(0, 100, 10)]
 for url in urls:
 get_url(url)

資料分析？小意思！python幫你搞定

資料分析

資料分析我做成了PPT的樣子，大家可以看看~

總體情況

100部電影，平均得分9.0，平均電影時長128.63。

資料分析？小意思！python幫你搞定

電影年份趨勢

電影年份趨勢不大，規律不太明顯。

資料分析？小意思！python幫你搞定

電影月份

大家看電影都知道，電影基本在假期上映更有熱度，這裡統計出來，發現下半年的電影比上半年電影好很多~

資料分析？小意思！python幫你搞定

地區

中國和美國還是佔了很多的，韓國和日本電影也很不錯~

資料分析？小意思！python幫你搞定

電影型別

電影大部分都是劇情的，愛情才是真諦啊。

資料分析？小意思！python幫你搞定

演員

小哥和星爺承載了我們的清楚呀~

資料分析？小意思！python幫你搞定

總結

別看這小小的100條資料，是不是也可以玩出不一樣的花樣來。

資料分析？小意思！python幫你搞定

前言如果大家經常閱讀Python爬蟲相關的公眾號，都會是以爬蟲+資料分析的形式展現的，這樣很有趣，圖表也很不錯，今天了，我就來分享上一次在培訓中的一個作品：貓眼電影爬蟲及分析。通過貓眼電影TOP100榜的爬蟲，然後進行視覺化，讓學員體會到，小資料爬蟲也能玩出這樣的

手把手：掃描圖片又大又不清晰？這個Python小程式幫你搞定！

大資料文摘作品編譯：HAPPEN、於樂源、小魚一位樂於分享學生精彩筆記的大學教授對於掃描版的檔案非常不滿意——顏色不清晰並且檔案巨大。他因此用python自己寫了一個小程式來解決這個問題。這個程式可以用來整理手寫筆記的掃描件哦，輸出的圖片不僅很清晰，而

你心中理想的婚禮什麽樣？別擔心！python幫你完成你的浪漫之旅！

python 爬蟲 web 科技編程 2017年9月3日，對世界上的大多數人來說，或許就只是普普通通的一天，但對我而言，將會是一個難忘的日子，因為在那一天，我結婚了。在規劃婚禮時，要考慮許多不同的方面。食物、裝飾、桌子裝置（啊，是噠，這獨立於裝飾）、鮮花、住宿、交通、娛樂和位置。雖然在規劃婚禮時有許許多多未

房價精準預測，大資料+機器學習幫你搞定

“ 一提到房價，就“壓力山大”！無論是首套房還是改善性需求，買在低點賣在高點都是一個可遇不可求的事兒，所以如果有位資料大俠能幫助設計一個預測房價的神器，豈不是“人生很值得”！本期DT資料俠與紐約資料科學學院合作的資料線專欄中，四位資料俠通過“資料超能力”試圖利用Python通過機器學習方式來預測

如何刪除Word頁首下橫線？只需1招即可輕鬆幫你搞定！

在我們職場辦公時候經常會處理各種Word文件，這時候總會遇到各種型別的問題，就比如頁首下討人厭的橫線，經常為這個莫名其妙的橫線而感到頭疼，關鍵它還刪除不掉！針對這個問題，特意為大家整理了幾個小技巧，希望能夠幫上你！方法一：設定正文樣式去除其實頁首下橫線也沒有你想象的那麼難去除，只需要這是正文樣式即

會議記錄記不完整？別急，手機錄音轉文字分分鐘幫你搞定！

日常工作中，各種會議記錄是必不可少的，但是手寫上的速度永遠跟不上說話的速度，所以會議記錄經常記不完整，老闆還說你效率低，該怎麼辦呢？下面小編教大家一招，用手機錄音就可以做一個完整的會議記錄，一起來學習一下吧！使用工具：錄音轉文字助手APP，一款可以將語音檔案、錄音檔案轉換為文字的軟體。使用裝置：安卓、

春運來啦！Python幫你搶回家的火車票哦

兜兜轉轉又到了一年的年關，身在遠方的你還在為了一張回家的火車票搶不到而回不了家嗎？讓小編來幫幫你吧。 Python編寫12306自動搶票資料介紹小編推薦大家可以加我的扣扣群 735934841 。裡面有海量視訊教程和學習資料免費領取，不失為是一個學習的好地方，歡

過年想有人跟著回家？Python智慧化“天氣提醒”幫你搞定小姐姐

前輩前幾天發的文章，操作python那可是一流的666，分享過小編的可愛的小夥伴們，對沒有學python和在學python的小夥伴來說，那絕對是精品中的精品。優秀上的優秀。最重要是教單身程式設計師怎麼撩小姐姐哦！程式設計師和未來的程式設計師必學，跟著小編這個有了21年經驗的小姐姐，一起學

杭州專業的SEO公司清法網絡，三招幫你搞定新聞稿網站優化！

今天口碑 ges 最有拓展 tex 輕松推廣間接對於企業來說，新聞稿發布能起到宣傳品牌價值的作用，是企業公關活動最為重要的內容之一。不過，搜索公關專家清法註意到，很多人在發布新聞稿時，都只會看到它的品牌宣傳價值，而忽略另外一層意義——關鍵詞排名。因為新聞稿的發布是

Java如何播放音訊檔案，4行程式碼幫你搞定（不，1行）！

首先在這給各位看官姥爺道個歉，這個程式碼是很久以前的寫Swing的時候寫的了，現在也回憶不起了，試了一下的確有問題，放不出來聲音，重新給大家寫一個簡單的用AudioClip介面來播放音訊軟體[捨棄，

這一份MySQL書單，可以幫你搞定90%以上的面試題！

![](https://img2020.cnblogs.com/other/1813797/202005/1813797-20200513215639876-242058756.jpg)![](data:image/gif;base64,R0lGODlhAQABAPABAP///wAAACH5BAEKAAAA

10 張圖幫你搞定 TensorFlow 數據讀取機制

小夥伴圖片文章網上如何導讀在學習tensorflow的過程中，有很多小夥伴反映讀取數據這一塊很難理解。確實這一塊官方的教程比較簡略，網上也找不到什麽合適的學習材料。今天這篇文章就以圖片的形式，用最簡單的語言，為大家詳細解釋一下tensorflow的數據讀取機制，文章的最後還會給出

10個方法幫你搞定Web設計風格指南

今時今日，網站的建立正變得越來越複雜，而且一般都不是一個人就能幹的了的。在建立網站過程中，我們需要保證設計前後一致，並符合業務目標，同時還要盡全力為使用者打造有趣的使用體驗。為了確保整個團隊在設計網站各個組成部分或在改善開發人員設計成果時彼此之間能夠充分協調一致，你需

還在為基於javaweb畢業設計發愁？我們幫你搞定

一、一、服務專案服務流程二、畢業將至，答辯難過。而我們提供基於java,基於web,基於ssh,基於ssm,基於j2ee的管理系統的設計與實現之類的題目的作品代做服務。三、四、二、通過扣·扣聯絡我們之後，我們可以根據您提供的作品設計要求來商定價格，然後×××，商定之後即刻開工，作品完成之後我們將發給您

遇到跨域別害怕,我來幫你搞定它

同源策略同源策略/SOP（Same origin policy）是一種約定，由 Netscape 公司 1995 年引入瀏覽器，它是瀏覽器最核心也最基本的安全功能

幫你搞定JS混淆的apply,call,bind~~

this物件指向會經常改變的，這會造成一些意想不到的影響。JavaScript提供了call、apply、bind這三個方法，來切換/固定this的指向。首先說說他們三個之間的區別~ 相同點： 1、apply 、 call 、bind 三者都是用來改變函式的this物

用色環圖幫你搞定配色

不管是在平面設計或網頁製作中，還是在平常生活中的衣服穿搭和室內裝潢中，要想打造出非凡的視覺效果，合理的顏色搭配非常重要。下面介紹幾種色彩搭配方案供您參考，讓你輕易地一靶中的。方案1. 補色搭配（A complementary combination）互補（或稱對比）色

還在為垂直居中苦惱？CSS 佈局利器 flexbox 輕輕鬆鬆幫你搞定

傳統的 CSS 佈局方式是基於**盒模型**（它是根據盒子與父盒子以及兄弟盒子的關係確定**大小**和**位置**的演算法），實現時依賴於 *block*, *inline*, *table*, *position*, *float* 這些屬性，但對於一些特殊佈局不易實現，比如**垂直居中**。 **Fle

Idea+Git+GitHub圖文教程，一篇教程幫你搞定

## 導語 > 該文章主要記錄如何在GitHub上建立遠端倉庫、如何建立本地倉庫並把程式碼提交到GitHub、如何建立分支以及分支合併到主幹的操作。 ## 一、在GitHub上建立遠端倉庫 (前提：已經註冊過github賬號) #### 1.點選下面GitHub官網連結，使用已有的GitHub

共享單車專案的Python視覺化分析，教你成為資料分析大師！

Python對資料的處理能力，很多人是抱著一定的懷疑的，不過在看完這篇文章之後，我相信你一定不會再懷疑的。一、背景：共享單車想必大家一定不會陌生，共享單車在國內的興起，應該是2014年ofo的創立。截止到2017年3月，中國共享單車數量已經達到400萬輛，成為大城市居民出行

資料分析？小意思！python幫你搞定

相關推薦