1. 程式人生 > >解析:全球四大明星網際網路公司是如何做大資料的?

解析:全球四大明星網際網路公司是如何做大資料的?

大資料”炙手可熱,很多企業都不會錯失機會,谷歌已經從一個網頁索引發展成為一個實時資料中心樞紐,可以估量任何可以測量的資料,將輸入的查詢與所有可用資料相匹配,確定使用者查詢的資訊;對臉譜網來說大資料就是“人”,公司也利用這一點在十幾年之內成為世界上最大的公司之一;亞馬遜通過分析使用者習慣,將使用者與其他可能符合使用者需求的產品和建議相匹配;領英幫助求職者根據自己的技能和經驗來匹配空缺職位,幫助招聘人員找到與特定資料相匹配的人才,這些都是大資料應用的典型例子,但也只是其中一部分,越來越多的資料易獲得,複雜工具也會隨之湧現,大資料的利用可以改變我們個人生活和商業活動。
在這裡插入圖片描述

大資料

當下,每個人都聽說過人們如何利用大資料治癒癌症、終結恐怖主義和養活飢餓人口來改變世界。

當然,也很明顯,有些人正利用它來賺大錢——據估計,到2030年,世界經濟將增加15萬億美元。

很多人可能會想“那太好了,但實際上和我沒什麼關係。”只有擁有數百萬美元資產的大型科技公司才會真正受益。那你需要大量的資料才能開始一項新的研究嗎

其實並不是這樣的。事實上,利用近年在資料收集、分析上的巨大突破,很容易改善我們的個人和商業生活。很多人先前可能沒有認識到這點。

以下是大資料作為日常生活工具和服務的一部分的一些細節。

谷歌——語義分析與使用者畫像

儘管谷歌並沒有把自己標榜成資料公司,但實際上它的確是資料寶庫和處理問題的工具。它已經從一個網頁索引發展成為一個實時資料中心樞紐,幾乎可以估量任何可以測量的資料(比如:天氣資訊、旅行延遲、股票和股份、購物……以及其他很多事情)。

大資料分析——也就是說,當我們進行搜尋時大資料就會起作用,可以使用工具來對資料分類和理解。谷歌計算程式運行復雜的演算法,旨在將輸入的查詢與所有可用資料相匹配。它將嘗試確定你是否正在尋找新聞、事實、人物或統計資訊,並從適當的資料庫中提取資料。

對於更復雜的操作,例如翻譯,谷歌會呼叫其他基於大資料的內建演算法。谷歌的翻譯服務研究了數以百萬計的翻譯文字或演講稿,旨在為顧客提供最準確的解釋。

經常利用大資料分析的物件從最大的企業到單人樂隊,當他們通過谷歌的Adwords進行廣告宣傳時就是對大資料的利用。通過分析我們瀏覽的網頁(很明顯能看出我們喜歡什麼網頁),谷歌可以向我們展示我們可能感興趣的產品和服務的廣告。廣告商使用Adwords和谷歌分析等其他服務,以吸引符合其客戶資料的人員到其網站和商店時,廣告商就利用了大資料分析。

臉譜網——影象識別與“人”的大資料

儘管臉譜網與谷歌在市場營銷上差異巨大,但實際上它們的業務和資料模式非常相似。眾所周知,兩個公司都選擇將自己的企業形象定位重點放在大資料方面。

對谷歌來說,大資料是線上資訊、資料和事實。對臉譜網來說大資料就是“人”。臉譜網讓我們與朋友和家人保持聯絡越來越方便,利用這個巨大的吸引力,該公司在十幾年之內成為世界上最大的公司之一。這也意味著他們收集了大量的資料,同時我們也可以自己使用這些大資料。當我們搜尋老朋友時,大資料就會發揮作用,將我們的搜尋結果與我們最有可能聯絡的人進行匹配。

由臉譜網開創的先進技術包括影象識別——一種大資料技術,通過利用數百萬種其他影象進行訓練,能教會機器識別圖片或視訊中的主題或細節。在我們告訴它圖片中的人是誰之前,機器可以通過標籤來識別圖片中的人。這也是為什麼,當我們的朋友分享或給圖片“點贊”時,如果它發現我們喜歡看例如嬰兒或貓的圖片,在我們的資訊流中就會看到更多這種型別的圖片。

對人們興趣及其利益的詳細瞭解也使臉譜網能夠向任何企業出售極具針對性的廣告。臉譜網可以幫助企業根據詳細的人口統計資料和興趣資料找到潛在客戶,或者可以僅僅讓他們通過查詢與企業已有客戶相似的其他客戶來完成他們的大資料“魔術”。

亞馬遜——基於大資料的推薦引擎

亞馬遜作為世界上最大的線上商店,也是世界上最大的資料驅動型組織之一。亞馬遜和本文提到的其他網際網路巨頭之間的差別很大程度上取決於市場營銷。與谷歌和一樣,亞馬遜提供了廣泛的線上服務,包括資訊搜尋、關注朋友和家人的賬號以及廣告,但其品牌建立在最初以購物聞名的服務上。

亞馬遜將我們瀏覽和購買的產品與全球數百萬其他客戶進行比較。通過分析我們的習慣,可以將我們與其他可能符合我們需求的產品和建議相匹配。大資料技術在亞馬遜的應用就是推薦引擎,而亞馬遜是推薦引擎的鼻祖,其也是最複雜的。除了購物,亞馬遜還讓客戶利用自己的平臺賺錢。任何在自己的平臺上建立交易的人都會受益於資料驅動的推薦,從理論上講,這將吸引合適的客戶來購買產品。

領英——被篩選過的精準大資料

如果你是一名僱主,或是正在找工作的人,領英會提供一些可以幫助你的大資料。

求職者可以根據自己的技能和經驗來匹配空缺職位,甚至可以找到與公司其他員工以及其他可能競爭該職位的員工的資料。

對招聘人員來說,領英的大資料可以找到與特定資料相匹配的人才,例如現任員工或前僱員。

領英對其資料採取了“圍牆的花園”方式(注:“圍牆花園”是相對於“完全開放”的網際網路,把使用者限制在一個特定的範圍內,允許使用者訪問指定的內容),當你選擇在何處尋找和使用大資料時,這個不同之處值得考慮。領英的招聘人員和申請人的服務都是由公司內部和由服務本身控制的資料進行的,而谷歌是(在美國也提供招聘資訊)從大量外部資源中獲取收資料。領英的方法提供了潛在的更高質量的資訊,而另一方面,它可能不全面。谷歌的方法提供了更大容量的資料,但這些資料可能是你想要的,也可能不是。

這些只是應用大資料的幾種方式——遠非資源豐富的公司和技術精英的工具,而是我們大部分人在日常生活中已經從中受益的東西。隨著越來越多的資料變得容易獲取,越來越複雜的工具湧現出來,從中獲得價值,肯定會有更多的資料產生。想諮詢更多內容,對大資料的概念都是模糊不清的,大資料是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解,想學習的同學歡迎加入大資料學習qq群:458345782,有大量乾貨(零基礎以及進階的經典實戰)分享給大家,並且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國內最完整的大資料高階實戰實用學習流程體系