1. 程式人生 > >大資料和雲端計算技術週報(第83期)

大資料和雲端計算技術週報(第83期)

大資料” 三個字其實是個marketing語言,從技術角度看,包含範圍很廣,計算、儲存、網路都涉及,知識點廣、學習難度高。

    

本期會給大家奉獻上精彩的:神經網路、HBase、Hive、spark、推薦系統、MangoDB、AIops。全是乾貨,希望大家喜歡!!!


#大資料和雲端計算技術社群#希望通過堅持定期分享能幫助同學在大資料學習道路上盡一份微博之力。相信長期堅持認真閱讀週報的同學,在技術的道路上一定會日益精進!感謝編輯們的長期堅持!也請同學們繼續打賞,支援社群,支援編輯們持續奉獻高質量知識!


#大資料和雲端計算技術社群#長期招募有興趣參與社群編輯和運營的同學,歡迎掃描文末二維碼聯絡(參與社群工作,收穫知識和進步,還有紅包哦

)。


特別提醒,文末有驚喜!


以下是正文,限於眾編輯水平有限,不保證大家都喜歡。(如果連結不能點開  請用二維碼  謝謝

1Hbase

phoneix適合高併發低時延的SQL需求

https://mp.weixin.qq.com/s/jnYgwD8mnjEkInAE3VA5yw

640?wx_fmt=png

2圖神經網路 

近年來,圖神經網路的研究成為深度學習領域的熱點。本文主要介紹了清華大學孫茂松組在 arXiv 上釋出的卷積神經網路綜述文章的相關內容。

https://mp.weixin.qq.com/s/DIdJb_vG8_zLdp_t56jLXQ

640?wx_fmt=png


3AIOps 

面對目前海量的運維監控資料,如果還用傳統的方法已經是難以為繼了。我們面臨的任務往往是時效性非常強壓力非常大的任務,如故障止損,人工決策往往需要小時級的時間。 根本原因是人是不擅於在短時間內處理海量資料做出實時準確的決策的。 怎麼辦呢?只能通過AI來解決,只有這一條路,沒有別的辦法。而AIOps會給運維人員帶來革命性的影響。

https://mp.weixin.qq.com/s/C5NyDM0pkWvM3BFpSlUOpQ

640?wx_fmt=png


4資料治理 

在資料平臺的建設中,資料一致性一直是一個難題,本文介紹了美團酒旅起源資料治理平臺的建設與實踐。

https://mp.weixin.qq.com/s/GFTh2yU35A0paioMG_yKPQ

640?wx_fmt=png

5Hbase

本文從多租戶支援、資料讀寫介面、資料匯入匯出和平臺優化四個方面來重點講解58HBase平臺的建設。

https://mp.weixin.qq.com/s/x4Hx0402HEEtNchYEzlwww

640?wx_fmt=png

6MongoDB 

本文講述了MongoDB日誌分析工具mtools的mplotqueries的使用說明,以及mplotqueries命令全域性引數的說明;

https://studygolang.com/articles/1948

640?wx_fmt=png

7神經網路 

在最近結束的 NeruIPS 2018 中,來自多倫多大學的陳天琦等研究者成為最佳論文的獲得者。他們提出了一種名為神經常微分方程的模型,這是新一類的深度神經網路。神經常微分方程不拘於對已有架構的修修補補,它完全從另外一個角度考慮如何以連續的方式藉助神經網路對資料建模。在陳天琦的講解下,本文將向各位讀者介紹這一令人興奮的神經網路新家族。

https://mp.weixin.qq.com/s/SPf-9LPlMptNPMEOubr5sw

640?wx_fmt=png

8推薦系統 

網路中的資訊量呈現指數式增長,隨之帶來了資訊過載問題。推薦系統是大資料時代下應運而生的產物,目前已廣泛應用於電商、社交、短視訊等領域。本文將針對推薦系統中基於隱語義模型的矩陣分解技術來進行討論。

https://mp.weixin.qq.com/s/ys8qmUlUmGZfSYEChezENg

640?wx_fmt=png


9HIve 

如何準確、高效地把MySQL資料同步到Hive中?一般常用的解決方案是批量取數並Load:直連MySQL去Select表中的資料,然後存到本地檔案作為中間儲存,最後把檔案Load到Hive表中。這種方案的優點是實現簡單,但是隨著業務的發展,缺點也逐漸暴露出來;為了徹底解決這些問題,逐步轉向CDC (Change Data Capture) + Merge的技術方案,即實時Binlog採集 + 離線處理Binlog還原業務資料這樣一套解決方案。Binlog是MySQL的二進位制日誌,記錄了MySQL中發生的所有資料變更,MySQL叢集自身的主從同步就是基於Binlog做的。本文介紹美團DB資料同步到資料倉庫的架構與實踐

https://tech.meituan.com/binlog_dw.html

640?wx_fmt=png

10Spark 

目前業界基於 Hadoop 技術棧的底層計算平臺越發穩定成熟,計算能力不再成為主要瓶頸。 多樣化的資料、複雜的業務分析需求、系統穩定性、資料可靠性, 這些軟性要求, 逐漸成為日誌分析系統面對的主要問題。2018 年線上線下融合已成大勢,蘇寧易購提出並踐行雙線融合模式,提出了智慧零售的大戰略,其本質是資料驅動,為消費者提供更好的服務, 蘇寧日誌分析系統作為資料分析的第一環節,為資料運營打下了堅實基礎

https://mp.weixin.qq.com/s/KPTM02-ICt72_7ZdRZIHBA

640?wx_fmt=png

11開心一刻   
 

有個程式媛加班時向男同事抱怨:“不是說一般領導交給女程式設計師的活都比較少嗎?為啥我的工作那麼重?”
男同事:“你從哪裡聽說的?”
程式媛:“坊間流傳····”
男同事:“······哼!沒把你變成活,就已經是仁至義盡了

致謝:

周蓬勃、王在道、孫亞飛、馮藝帆、陳少軍、鄧開表、張少華、薛述強、劉彬、劉超、廖程鵬、董言、呂西金、朱潔、藍隨、黃文輝、郭飛、

猜你喜歡

#大資料和雲端計算機技術社群#部落格精選(2017)

NoSQL 還是 SQL ?這一篇講清楚

阿里的OceanBase解密

#大資料和雲端計算技術#: "四有"社群介紹

大資料和雲端計算技術週報(第56期)

新數倉系列:Hbase周邊生態梳理(1)

《大資料架構詳解》第2次修訂說明

簡單梳理跨資料中心資料庫

雲觀察系列:漫談運營商公有云發展史

雲觀察系列:百度雲的一波三折

雲觀察系列:阿里雲戰略觀察

超融合方案分析系列(7)思科超融合方案分析

加入技術討論群

《大資料和雲端計算技術》社群群人數已經6000+,歡迎大家加下面助手微信,拉大家進群,自由交流。

640?wx_fmt=jpeg


喜歡QQ群的,可以掃描下面二維碼:

640?wx_fmt=jpeg

歡迎大家通過二維碼打賞支援技術社群(英雄請留名,社群感謝您,打賞次數超過108+):

640?wx_fmt=jpeg