1. 程式人生 > >上映 10 天,票房就突破 10 億的《海王》真的有那麼好看?

上映 10 天,票房就突破 10 億的《海王》真的有那麼好看?

640?wx_fmt=gif

640?wx_fmt=jpeg


640?wx_fmt=png

寫在前面


本文將主要通過Python加上一些資料分析,來證明《海王》好看。

640?wx_fmt=jpeg

《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的遊戲》《異形》可能還借鑑了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠》的味道,配上一丟丟溫子仁式恐怖片套路,優秀的商業片,應該是DC年度最佳了。溫子仁,優秀的集大成者。

上映 10 天,票房就達到了 10 億。

在做資料分析之前,我們需要先對資料做清洗,將資料處理到最佳

讀取資料,讀取資料的時候記住,需要把header=None然後增加names

# 讀取資料

def get_data():
    df = pd.read_csv("haiwang.csv",sep=",",header=None,names=["nickName","cityName","content","approve","reply","startTime","avatarurl","score"],encoding="utf-8")
    return df

清洗資料

  1. 檢視資料是否有重複,採用drop_duplicates刪除資料

  2. 刪除資料之後,需要重置索引 reset_index

  3. 處理時間欄位為datetime型別

  4. 增加一個欄位為content_length查閱使用者評論數量

# 清洗資料
def clean_data():
    df = get_data()
    has_copy = any(df.duplicated())
    data_duplicated = df.duplicated().value_counts()
    #print(data_duplicated) # 檢視有多少資料是重複的
    data
 = df.drop_duplicates(keep="first")  # 刪掉重複值
    data = data.reset_index(drop=True)  # 重置索引
    data["startTime"] = pd.to_datetime(data["startTime"])
    data["content_length"] = data["content"].apply(len)
    # print(data.isnull().any()) 判斷空值
    # print(data[data.isnull().values == True])
    # print(data[data.nickName=="."])
    return data


640?wx_fmt=png

檢視所有資料情況


點讚的最高數目是2783 非常高了,但是平均值才0.25 可見,貓眼上人們並不是很喜歡點贊。回覆數最高的才 43 可以說非常低了。

《海王》50%以上的人給了5分,肯定是很好看了。

640?wx_fmt=png


640?wx_fmt=png

看一下點贊最高的一些資料


“幻影XL”獲得了最多的點贊,可以看一下他的評論內容。恩,寫的確實不錯,誇了一下導演,這個地方出現一點小的疏漏,我看到貓眼點贊最高的,我竟然沒有抓取到資料,應該是給遺漏掉了,疏忽啊!

640?wx_fmt=png


640?wx_fmt=png

點贊排名


640?wx_fmt=png


640?wx_fmt=png

回覆排名


640?wx_fmt=png

# 檢視資料基本情況
def analysis1():
    data = clean_data()
    print(data.describe())
    # 刪除.
    # need_delete = data[data["nickName"]=="."]
    data = data[~(data['nickName']==".")]
    # data = data[~data['nickName'].isin(["."])]
    # data.drop(need_delete,axis=1,inplace=True)

    print(data["nickName"].describe())
    print(data["cityName"].describe())

檢視nickName的描述,發現竟然有個“.” ,需要把資料過濾掉,觀影此處最多的城市是北京。

640?wx_fmt=png

去除 “.” 資料的辦法是 data = data[~(data['nickName']==".")]

count 57838
unique 55934
top qzuser
freq 57
Name: nickName, dtype: object

看一下qzuser這個人發了57條都是啥?

這位老鐵還真的發了很多,一個勁的誇這個電影。

640?wx_fmt=png


640?wx_fmt=png

看評分


5分遙遙領先,週末的票已經買好,準備去看啦~

640?wx_fmt=png

圖表的實現用的是pychats,官方文件詳見:http://pyecharts.org/#/zh-cn/prepare。

你可以去查閱文件,看一下詳細的引數設定:

# 分析打分score情況
def analysis2():
    data = clean_data()
    grouped = data.groupby(by="score")["nickName"].size()
    grouped = grouped.sort_values(ascending=False)
    index = grouped.index
    values = grouped.values
    # 柱狀圖
    bar = Bar("柱狀圖",title_pos="left",width=240)
    bar.add("",index,values,is_label_show=True,is_legend_show=True,mark_line=["min","max"])

    # Pie圖
    pie = Pie("餅圖",title_pos="right",width=240)
    pie.add("",index,values,radius=[45,65],center=[70,50],is_label_show=True,legend_pos="90%",legend_orient= "vertical")

    grid = Grid(page_title="《海王》評分詳情",width=1200,height=500)
    grid.add(bar,grid_right="50%")
    grid.add(pie, grid_left="70%")

    grid.render("html/score.html")
    print(data)
    print(data[data["score"]==0])


640?wx_fmt=png

看評語


def analysis3():
    data = clean_data()
    sort_data = data.sort_values(by="content_length",ascending=False)
    print(sort_data.head(10)["content"])

節選幾個,可以看看,順便我還可以學習一下語文:

  • 劇情和特效在科幻片中的精彩佳作。劇情延續著海神波塞冬用的玄鐵打造的三叉戟鋪開,影片中的海王的身世讓力量成為了傳奇,他有其它亞特蘭蒂斯人不具備的亞特蘭王的能力。海王在漫畫中和其他很多英雄不一樣的是,他並不反感殺戮,甚至有些渴望鮮血,這使得他在外型和性格上很難討喜。溫子仁對海王的性格做了一定程度上的改編,弱化了他的殘忍,突出了他自卑的性格。整部《海王》表面看上去是一場王位爭奪戰,實際是亞瑟戰勝自卑的成長史,而獲得三叉戟就是他性格極為重要的轉折點。

  • “溫子仁真的厲害,在這部電影的鏡頭上和音效上真的是下了功夫,影片中適時響起的音效結合畫面,很加分,影片大的方向來看是一部英雄成長史,有主角的披荊斬棘也有活潑溫情, 擅長拍恐怖驚悚題材的他,在有些鏡頭的處理上能讀到驚悚的味道,用最擅長的恐怖元素牢牢把握住觀眾的注意力,但點到為止沒破壞電影的整體氛圍,度把握的很不錯 ,DC這次請溫子仁操刀算是做對了一件事,而且海底世界的特效也相當給力,故事劇情上有幾個點的設計很靈性,我覺得比毒液好看,因為毒液前面殺人的驚悚畫面嚇到我了,當然這部電影不是沒有缺點,比如有幾個地方我覺得節奏程序過快,劇情套路容易被猜中等等,但畢竟放眼整部影片來看,我給出四個字——瑕不掩瑜”

  • 特效還可以的啦,但是劇情真的細碎,就本人而言槽點滿滿,起因在於海網的母親因為生下海王而死,也沒在海王小時候就派人弄死他,之後奧姆因為陸地人伏擊他們決定發起戰爭(也有可能是奧姆的陰謀,但是海底人被各種殘害是事實)結果眉拉,作為奧姆的青梅竹馬就背叛奧姆了,就去找海王了,也不知道怎麼一牽手,一擁抱,就擦起了愛情的火花(很多人說女主超級美,我看到了寡姐的影子,一頭紅髮,犀利的眼神,個人感覺像寡姐的山寨)然後海王就找到了三叉戟,開啟了主角光環之嘴炮無敵,拿到三叉戟,噼裡啪啦的先弄死一堆海族人,然後成了海族人的王,奧姆被綠了,王位被搶。海王還說我是海洋的領主,你怕不是翻譯官的頭頭。海族人也悽慘,打不過啊。

  • 先說優點特效很足!特效很足!特效很足!劇情全程沒有挖坑。但是不知道為什麼!看得不過癮感覺就跟一般,男女主角愛得莫名其妙,感覺亞特蘭蒂斯的女人都有一個特點:喜歡陸地上的男人,不喜歡本土的。挺同情海里的男人的,自己未婚妻和陸地上的男人跑了,還生了個兒子。把老婆搶回來後不是寵愛,而是生完孩子女兒後,拿去祭獻給醜陋的退化的海怪???女兒長大後上陸地又愛上了同母異父的哥哥???背叛得莫名其妙。最後男主拿到了自己的武器不是因為自己有多勇敢多牛逼,而是因為男主能和海里的動物對話???那我倒是奇怪了海里的動物怎麼聽得懂英語。離題了就回來,有點鑽牛角尖了。要我說海神三叉戟就是個大型訊號擴散器,幫助擴散命令罷了。


640?wx_fmt=png

看一下評論時間


對於《海王》我只獲取了4天的資料,看一下大家都在什麼時間進行評論吧,晚上10點以後寫評論的比較多,估計是大家看完電影,回家沒啥事情才開始寫評論。

640?wx_fmt=png

def analysis4():
    data = clean_data()
    # 獲取時間
    # 新增小時
    data["hour"] = data["startTime"].dt.hour
    data["startTime"] = data["startTime"].dt.date
    need_date = data[["startTime","hour"]]
    def get_hour_size(data):
        hour_data = data.groupby(by="hour")["hour"].size().reset_index(name="count")
        return hour_data
    data = need_date.groupby(by="startTime").apply(get_hour_size)

    data_reshape = data.pivot_table(index="startTime",columns="hour",values="count")

    bar = Bar("分時評論分析",width =1200,height=600,title_pos ="center")
    data_reshape.fillna(0,inplace=True)
    print(data_reshape)
    for index,row in data_reshape.T.iterrows():
        print(data_reshape.index)
        v1 = list(row.values)

        bar.add(str(index)+"時",row.index,v1,is_legend_show=True,legend_pos="80%",legend_text_size=8)

    bar.render("html/1.html")


640?wx_fmt=png

粉絲分佈


640?wx_fmt=png

# 處理地名資料,解決座標檔案中找不到地名的問題
def handle(cities):
    # 獲取座標檔案中所有地名
    data = None
    with open(
            'city_coordinates.json檔案地址',
            mode='r', encoding='utf-8') as f:
        data = json.loads(f.read())  # 將str轉換為json

    # 迴圈判斷處理
    data_new = data.copy()  # 拷貝所有地名資料
    for city in set(cities):  # 使用set去重
        # 處理地名為空的資料
        if city == '':
            while city in cities:
                cities.remove(city)
        count = 0
        for k in data.keys():
            count += 1
            if k == city:
                break
            if k.startswith(city):
                # print(k, city)
                data_new[city] = data[k]
                break
            if k.startswith(city[0:-1]) and 

相關推薦

上映 10 票房突破 10 的《》真的那麼好看

寫在前面 本文將主要通過Python加上一些資料分析,來證明《海王》好看。 《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的遊戲》《異形》可能還借鑑了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠

上映4票房7.4的《用Python分析資料看大片!

寫在前面 今天我要蹭個熱點,我要用Python加上一些資料分析,來證明《海王》好看。 《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的遊戲》《異形》可能還借鑑了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠》的味道,配上一丟丟溫子仁式恐怖片

90後女子躺家10用100元存款刷出10萬收入

A96-11-26有人用Q-Q聊天,有人卻在Q-Q中月兼--錢我是加入一個網上團隊的,而且,這些都是免費的!足不出戶,輕鬆月兼--錢,當天操--作,當天收--款,免-學-費,無-押jin,不-收-任-何-費-用,網際網路史無前例的驚人做法——10分鐘學會操--作流程,半小時開始獲得收益!這是我加入美麗人生的月

Java入門 第10 理解數組

image string inf myarray http java java入門 .com 分享圖片 String [ ] myArray = new String [5];

10年前用 SQL注入漏洞黑了學校網站

> 我是風箏,公眾號「古時的風箏」,一個兼具深度與廣度的程式設計師鼓勵師,一個本打算寫詩卻寫起了程式碼的田園碼農! 文章會收錄在 [JavaNewBee](https://github.com/huzhicheng/JavaNewBee) 中,更有 Java 後端知識圖譜,從小白到大牛要走的路都在裡面。 標

入門十用50行Python程式碼爬到了整個網站

  這篇文章是利用aiohttp這個庫來進行說明的。 如果爬蟲需要展現速度,我覺得就是去下載圖片吧,原本是想選擇去煎蛋那裡下載圖片的,那裡的美女圖片都是高質量的,我稿子都是差不多寫好了的,無奈今天重新看下,妹子圖的入口給關了,至於為什麼關呢,大家可以去看看昨天好奇心日報的關停

責任鏈模式完成公司的審批流程。金額小於5萬主任審批;5萬~10經理審批了10~20副總審批;大於20萬總經理審批

/** * 封裝採購資訊 * */ public class PurchaseRequest { private double Money; private String reason;

【C語言】猴子吃桃問題。猴子第一摘下若干個桃子每天都吃了前一天剩下的一半零一個到第10早上想再吃的時候剩下一個桃子. 求第一共摘多少個桃子。

//猴子吃桃問題。猴子第一天摘下若干個桃子,當即吃了一半,好不過癮,又多吃了一個. //第二天早上又吃了剩下的桃子的一半,又多吃了一個。以後每天都吃了前一天剩下的一半零一個,到第10天早上想再吃的時候

在家能賺錢每天花上10分鐘可日入過百

時間 出現 知名度 全世界 ica f2c 真的是 品牌 ans http://www.3agpl.com現在科技如此發達,足不出戶便可暢遊全世界,有的還可以在家中辦公!所以現在越來越多的人開始選擇自由職業來作為自己的主要收入來源,自由職業的特點就是不用待在辦公室裏也能有足

10.獲取某個月的最後一或者說是計算某個月的天數

settime pla ole display mon std cti col none 最近有用到,特此做個標記、下次用的時候好找。 /* 獲取指定月份的最後一天 */ function getMOnthLastDay(year, month) { va

spring Boot 上傳檔案10不能上傳的bug

起因           公司研發人員 部署服務在阿里雲 ecs 伺服器; 上傳檔案過1周左右檔案自動丟失; 排查思路:     (1).查詢tomcat 啟動日誌出現如下資訊:   

10----類的三大關係Object內部類異常的簡介

* 昨天知識總結: 1.abstract 抽象類 抽象方法 2.interface 比較介面與抽象類 介面可以實現多繼承 抽象類除了抽象方法還可以有普通方法—可以有方法的呼叫 介面的定義 介面的構成 介面的注意點 介面中的新特性—正在jdk1.

加速版本更新Nacos 10 釋出 3 個版本

   繼9天前釋出0.6.0版本,支援 Dubbo 和 Docker 部署後,Nacos隨後又釋出了0.6.1和0.7.0版本,網友直呼:真是拼命,昨天看到的還是0.6.0,睡一覺醒來已經是0.7.0版本了。 此次釋出的0.7.0,主要解決了以下 issue: [#461] 當

10100小時學資料科學我推薦你這樣學!

【伯樂線上導讀】:有位網友在 Quora 提問,並補充說「我有10天空閒時間,每天想花十個小時學習資料科學入門知識,應該學點什麼呢?謝謝」伯樂線上摘編了 Roman Trusov 的回覆,非常值得新手參考。 哥們我太羨慕你了,不是誰都有像你這樣的機會的。 10天100小時的學

學人工智慧10本書精讀一本夠!

什麼是人工智慧?簡單來說,人工智慧就是研究如何讓計算機去完成以往需要人的智力才能勝任的工作,通過生產能像人類一樣做出智慧反應的智慧機器,來代替人類從事一些腦力或體力勞動。學人工智慧10本必看書是這些: 1.《深度學習》 AI聖經!深度學習領域奠基性的經典暢銷書!長期位居美

10時間淨賺20多萬她成功創業什麼祕訣?

25歲的王鶴潼被親戚稱為成功創業的典例,在2014年,她給父母買了房子,還給自己換了輛越野車。 從上大學起王鶴潼就逮住各種機會,拼命賺錢,並且樂此不疲。期間父親的一場重病,花盡了家中的積蓄和她大學期間賺的錢。王鶴潼要繼續賺錢為父母的生活和醫療提供物質保障,但也意識到自己的生活若只是重複著賺錢和花

白話AI:看懂深度學習真的那麼難嗎?初中數學10分鐘

如果在這個人工智慧的時代,作為一個有理想抱負的程式設計師,或者學生、愛好者,不懂深度學習這個超熱

記住這10大程式設計原則程式設計能事半功倍!

1.想清楚,再動手寫程式碼   剛入行的新手,為了展示自己的能力,拿到需求迫不及待地就開始上手寫程式碼,大忌!   2.不交流,就會頭破血流   不愛說話和溝通,需求都理解錯誤了,最後做出來才發現,只能加班返工!  【加入程式設計學習群(C/C++群:892643663;

詞雲制作沒那麽難Python 10 行代碼實現了!

修改 tex 源碼 空格 upan ims image bsp 分布 寫在前面 想必大家有一個問題。什麽是詞雲呢? 詞雲又叫名字雲,是對文本數據中出現頻率較高的“關鍵詞”在視覺上的突出呈現,形成關鍵詞的渲染形成類似雲一樣的彩色圖片,從而一眼就可以領略文本數據的主要表