1. 程式人生 > >帶你裝B,帶你飛的大數據時代

帶你裝B,帶你飛的大數據時代

等等 大數據 組織 content apriori 正在 class 大數據架構 互聯網

我接觸過的大數據有:

1.美國棱鏡計劃

2.前幾天新聞報道的,蘋果公司竊取用戶隱私

3.百度的用戶搜素習慣統計分析

4.淘寶的用戶購物習慣分析,智能推薦寶貝

5.瀏覽器的智能標簽頁

...

最想了解的大數據架構與算法:

1.著名的Google 網頁排名算法:PageRank

2.著名的聚類算法:K-Means

7.CART

3.C4.5

4.k-Means

5.SVM

6.Apriori

...

大數據應用的未來挑戰和趨勢是:

最大的挑戰並非技術和數據本身,而在與人們對於數據的認識和態度。這方面非常多互聯網公司做的比較好。它們擁有豐富的數據同一時候也有強烈的盈利需求。能夠挖空心思的在各種數據上做文章;而對於非常多傳統行業。尤其是政府。首先它們還是相當重視數據的,甚至比互聯網公司都要重視。但出於行政管理,組織利益和安全等的考慮數據往往會形成孤島非常難做到綜合利用。


另外一方面的挑戰是構建成功的大數據應用須要對業務邏輯和數據處理技術都有比較深入的理解,並且非常難拆解開。由於業務的需求會直接影響究竟層架構的設計以及算法和工具的選擇,這一點和傳統的交易型系統有非常大差別,所以如今一些行業中的軟件+數據庫+硬件的分工模式不太適合大數據應用開發,市面上可以對各種因素通盤考慮做總體架構的公司並不多。
趨勢的話我的理解,如今技術層面的工具,技術是一個百家齊放的局面,其原因一方面是開源項目的運營模式越來越成熟,還有一方面是大數據的分析處理是多樣化的,相信未來非常長一段時間都會維持這個局面,傳統的軟件開發上已經逐漸向服務提供商轉變。產品本身可能變得越來越不重要。貼合用戶需求的定制化架構和解決方式可能更加受到歡迎,同一時候雲計算的不斷發展也將使得未來的架構設計更加輕松,部署和遷移更加便捷。


未來大數據的發展前景是巨大的。如今人們的生活已經離不開大數據了,雲計算、雲存儲、電商等等站點的數據都是大數據,可是大數據的發展的技術還是面臨挑戰。技術的發展新的技術也在不斷更新。所以大數據應用的挑戰是結合新技術,不斷優化大數據的算法。
大數據存儲技術、並行計算、吞吐量

讀完試讀樣章後的啟示:

大數據事實上才剛剛起步,正在打垮不發展。面臨著非常大的機遇和挑戰,海量待挖掘數據,數據切分算法,分布式圖計算了解到大數據的精深之處。要學習的還有非常多,我感覺到了自己的不足之處,大數據加油。你一定會更好更牛逼,我看好你哦。希望你可以帶我飛的更高,go,go。

。。


帶你裝B,帶你飛的大數據時代