1. 程式人生 > >【2019年大資料福利推薦】MaxCompute教程、案例視訊合集彙總(持續更新20190111)

【2019年大資料福利推薦】MaxCompute教程、案例視訊合集彙總(持續更新20190111)

大資料計算服務(MaxCompute,原名ODPS,產品地址:https://www.aliyun.com/product/odps)是一種快速、完全託管的TB/PB級資料倉庫解決方案。MaxCompute向用戶提供了完善的資料匯入方案以及多種經典的分散式計算模型,能夠更快速的解決使用者海量資料計算問題,有效降低企業成本,並保障資料安全。

 

本文收錄了大量的MaxCompute教程、案例視訊,幫助您快速瞭解MaxCompute/ODPS。 

 

目錄大綱

產品最新動態:

大資料計算服務MaxCompute官方介紹

MaxCompute 2.0新功能介紹

阿里關濤談大規模計算—面向企業的大資料平臺MaxCompute

MaxCompute新一代計算引擎:佈局整個大資料和AI生態鏈

MaxCompute2.0產品最新進展

MaxCompute新上線功能特性介紹

 

技術原理:

MaxCompute 2.0 效能優化揭祕

從單租戶IaaS到多租戶PaaS——金融級別大資料平臺MaxCompute的多租戶隔離實

MaxCompute大資料語言的新發展

飛天伏羲:阿里雲分散式排程系統架構實戰

阿里雲大規模計算平臺研究與實戰

阿里大規模資料計算與處理平臺

MaxCompute資料上雲與生態

高可用大資料計算平臺如何持續釋出和演進

 

產品教程:

MaxCompute客戶端 - odpscmd操作使用

DataWorks排程配置分享

MaxCompute多租戶資料安全體系介紹及實踐

MaxCompute資料安全管理解析

Python與大資料計算平臺結合實踐

MaxCompute Logview引數詳解和問題排查

如何將Kafka資料同步至MaxCompute

MaxCompute Tunnel上傳典型問題場景實戰

資料進入MaxCompute的N種方式

MaxCompute資料倉庫資料轉換實踐

阿里雲大資料數倉建設效能優化方式

幫助企業做好MaxCompute成本優化的實踐

自建Hadoop資料如何託管到MaxCompute

使用Flume收集網站日誌資料到MaxCompute

將ECS上的Hadoop資料遷移到MaxCompute

MaxCompute Studio開發實戰

 

客戶案例:

探祕獨角獸背後的大資料力量(眾安保險、親寶寶、中金易雲、螞蟻金服)

ofo在MaxCompute平臺的大資料開發之路

基於MaxCompute構建Noxmobi全球化精準營銷系統

MaxCompute在阿里媽媽數字化營銷解決方案上的典型應用

佰騰科技的專利大資料的雲上裂變之路

用大資料打造你的變美頻道-小紅脣

上海雲貝網路科技:雲上大資料,零售新思維

上海雲棲:開啟大資料智慧時代(輕鬆籌、收錢吧)

 

產品最新動態:

大資料計算服務MaxCompute官方介紹

https://videocdn.taobao.com/oss/taobao-ugc/557a6734b5d8488e82774628b0118f4f/1478591731/video.mp4

 

MaxCompute 2.0新功能介紹

視訊介紹:最新推出的MaxCompute 2.0,在高效能方面主要依託於全新的SQL 2.0計算引擎。在新功能方面提供了非結構化的處理,在雲上開始使用OSS(開放的物件儲存)、OTS(開放的表格儲存),MaxCompute對其進一步分析和計算提供了連線性。在開放性方面,相容Hive、Spark SQL;

https://help.aliyun.com/video_detail/89937.html?spm=a2c4g.11174359.2.2.786a2bf44bOl5h

 

阿里關濤談大規模計算—面向企業的大資料平臺MaxCompute

在剛剛結束的2018杭州雲棲大會上,阿里巴巴通用計算平臺負責人,阿里巴巴計算平臺資深技術專家關濤從計算力,聯合計算,智慧化,企業級服務能力四個方面詳細介紹阿里巴巴統一的超大規模資料計算平臺MaxCompute的探索與實踐。從數字化阿里巴巴,到數字化企業,再到數字化城市,MaxCompute快速進化,加速科技普惠, 驅動數字中國。

https://yunqi.youku.com/2018/hangzhou/videos?spm=a2c4e.11165380.1220735.5&video=https://yunqivedio.alicdn.com/od/7kCzt1537435157133.mp4

 

MaxCompute新一代計算引擎:佈局整個大資料和AI生態鏈

2018年9月19日下午,阿里巴巴集團副總裁周靖人,攜阿里巴巴資深技術專家、Dataworks負責人徐晟,阿里巴巴研究員、MaxCompute負責人關濤,阿里巴巴研究員、實時計算負責人蔣曉偉,以及阿里巴巴研究員、PAI平臺負責人林偉,描繪了阿里新一代計算引擎。

 

https://yunqivedio.alicdn.com/od/ChpeY1537587825738.mp4

 

MaxCompute2.0產品最新進展

視訊介紹:從2010年開始MaxCompute(原名ODPS)作為阿里巴巴集團統一的大資料計算平臺,到2013年在阿里雲上開始正式提供公共大資料計算服務,在叢集規模、穩定性、資料安全、處理效能、擁有成本、生態工具等方面持續進化。 來自阿里巴巴計算平臺 高階產品專家 雲郎,本次分享將會帶來MaxCompute產品最新進展。

https://edu.aliyun.com/lesson_1010_8794?spm=5176.8764728.0.0.3Cmv65

 

MaxCompute新上線功能特性介紹

視訊介紹2018年9月以來,MaxCompute增加了哪些新功能?支援哪些新語法?優化哪些新體驗?MaxCompute產品專家曲寧帶你一起解讀Lightning、Spark、CUBE、HashClustering、UDT;

https://help.aliyun.com/video_detail/100491.html?spm=a2c4g.11174359.2.12.786a2bf44bOl5h

 

 

技術原理:

深入淺出的剖析MaxCompute技術原理,比如SQL執行原理、MR機制、伏羲排程機制、盤古儲存機制、優化器等等。

 

MaxCompute 2.0 效能優化揭祕

視訊介紹:回顧大資料技術領域大事件,最早可追溯到06年Hadoop的正式啟動,而環顧四下,圍繞著資料庫及資料處理引擎,業內充斥著各種各樣的大資料技術。這是個技術人的好時代,僅資料庫領域熱門DB就有300+,圍繞著Hadoop生態圈的大資料處理技術更是繁花似錦。在雲棲社群2017線上技術峰會大資料技術峰會上,阿里雲大資料計算平臺架構師林偉做了題為《MaxCompute的大腦:基於代價的優化器》的分享,為大家分享阿里巴巴大資料計算服務的大腦——基於代價的優化器的設計和架構。

http://yq.aliyun.com/webinar/play/188

 

從單租戶IaaS到多租戶PaaS——金融級別大資料平臺MaxCompute的多租戶隔離實踐

來自阿里雲的高階技術專家李雪峰帶來了主題為《金融級別大資料平臺的多租戶隔離實踐》的演講。在分享中,李雪峰首先介紹了基於傳統IaaS單租戶架構做隔離時面臨的問題;然後,他重點分享了MaxCompute PaaS層面的多租戶的架構以及MaxCompute在安全隔離方面的具體實踐。

https://yunqivedio.alicdn.com/2017sz/bigdata.mp4  [第5:30秒開始]

 

MaxCompute大資料語言的新發展

視訊介紹:阿里雲飛天一部高階專家振禹為大家帶來題為“MaxCompute SQL 現狀與展望”的演講。本文重點解析了MaxCompute SQL 現狀,詳細介紹了各種功能,其中包括編譯器使用者友好功能、複雜型別、CTE、引數化檢視和SEMI JION等,接著說明了MaxCompute SQL即將完成與推進中的功能,最後作了簡要總結。

http://yq.aliyun.com/webinar/play/189

 


飛天伏羲:阿里雲分散式排程系統架構實戰

視訊介紹:阿里雲分散式排程團隊在分散式排程系統的設計、實現、優化等方面的實踐以及由此而總結的分散式系統設計的一般性原則,具體包括分散式排程的任務排程、資源排程、容錯機制、規模挑戰、安全與效能隔離以及未來發展方向六部分。

https://yq.aliyun.com/video/play/470

 

 

 

阿里雲大規模計算平臺研究與實戰

視訊介紹:本次演講將介紹MaxCompute在雙十一中如何滿足阿里巴巴上萬使用者不同計算任務在延時、效能、規模上不同需求,並在全域性做到低成本、高效能、高彈性、高可用;如何能夠在保證高可用計算服務和使用者資料安全性下持續釋出改進計算平臺。

https://yq.aliyun.com/video/play/361

 

阿里大規模資料計算與處理平臺

視訊介紹:雙11,阿里雲實時大資料系統產生了3項世界級記錄:第1筆交易發生到大屏上顯示結果,處理過程僅幾秒鐘;最高處理速度千萬條/秒;全天服務不降級、無故障。MaxCompute抗下了單天資料處理峰值上百PB,百萬級的排程作業的挑戰。 

https://yq.aliyun.com/video/play/453

 

 

 

MaxCompute資料上雲與生態

視訊介紹:來自阿里雲端計算平臺的高階專家朋春分享從MaxCompute提供的離線、實時資料通道入手,延伸到DTS、Logstash、DataX等官方/開源軟體,向大家介紹如何從資料庫、本地檔案等多種儲存向MaxCompute匯入資料,分享最後還介紹瞭如何在Python和R語言中使用MaxCompute。

http://yq.aliyun.com/webinar/play/192

 

高可用大資料計算平臺如何持續釋出和演進

視訊介紹:阿里雲端計算平臺高階專家無庸為大家帶來題為“高可用大資料計算服務如何持續釋出和演進”的演講。本文先對MaxCompute架構進行了介紹,接著重點介紹在大資料計算服務下,高可用服務持續改進和釋出的工具,包括Playback工具、Flighting工具和灰度上線、細粒度回滾等。

https://yq.aliyun.com/live/193

 

 

產品教程:

MaxCompute客戶端 - odpscmd操作使用

視訊介紹:介紹如何藉助客戶端命令列工具使用 MaxCompute 服務的基礎功能

https://yq.aliyun.com/live/467

 

 

DataWorks排程配置分享

視訊介紹:介紹通過DataWorks進行新增排程資源、排程資源管理、配置不同週期任務依賴等最佳實踐。

https://help.aliyun.com/video_detail/87887.html?spm=a2c4g.11174359.2.6.786a2bf44bOl5h

 

MaxCompute多租戶資料安全體系介紹及實踐

視訊介紹:介紹MaxCompute 多租戶的資料安全體系,包括使用者認證、專案空間的使用者與授權管理、專案空間的資料保護等內容。

https://help.aliyun.com/video_detail/87058.html?spm=a2c4g.11174359.2.8.786a2bf44bOl5h

 

MaxCompute資料安全管理解析

視訊介紹:來自阿里雲高階產品經理海清,本次分享主要介紹MaxCompute安全模型與Dataworks安全模型之間的關聯,同時介紹如何將兩個產品有效的結合進行日常資料安全管理,保障資料安全。

https://help.aliyun.com/video_detail/99890.html

 

Python與大資料計算平臺結合實踐

視訊介紹:Pandas庫提供豐富的API尤其是DataFrame API來操作結構化資料,但是作為單機的庫,計算能力有限;同時MaxCompute本身作為大資料處理平臺,提供了海量資料的能力,SQL作為主要的資料處理語言,表達能力受限於SQL語法。PyODPS DataFrame框架提供了一種類似於Pandas DataFrame的API,但是能將操作編譯成SQL執行,使使用者同時擁有API的便捷和海量資料計算能力。同時,PyODPS提供了類似scikit-learn類似的介面,通過輸入和輸出PyODPS DataFrame,能讓使用者無需學習成本,就能用類似scikit-learn的體驗進行機器學習和資料探勘。

https://yq.aliyun.com/video/play/396

 

MaxCompute Logview引數詳解和問題排查

視訊介紹:對於Logview上的諸多引數資訊,究竟應該怎麼“撥開雲霧”,發現問題所在呢?又如何通過Logview瞭解每個instance、task執行狀態及資源佔用情況,如何分析執行計劃,分析query存在問題,找到Long-Tails task,讓資料分析業務高效又省錢呢?本文中,阿里巴巴計算平臺產品專家雲花將為大家揭曉答案。

https://yq.aliyun.com/live/484

 

 

如何將Kafka資料同步至MaxCompute

視訊介紹:來自阿里雲高階售後技術工程師雲奉,本次分享主要介紹如何將Kafka的資料同步到MaxCompute。

https://yq.aliyun.com/live/696

 

MaxCompute Tunnel上傳典型問題場景實戰

視訊介紹:來自阿里雲高階技術支援工程師,本次分享關於MaxCompute Tunnel上傳的各種用法,如何使用Python UDF實現正則、如何使用shell實現批量上傳、實現自定義分隔符等。

https://yq.aliyun.com/live/697?spm=a2c4e.11153940.blogcont670753.16.14463183eksgjx

 

資料進入MaxCompute的N種方式

視訊介紹:由阿里雲資料技術專家彬甫帶來以“資料進入MaxCompute的N種方式”為題的演講。本文講述了在阿里雲內部開發了一個實戰Demo系統,它能夠實現自動全鏈路的大資料處理流程,其中包括離線的和實時資料的,接下來將為大家揭曉實戰Demo系統是怎樣實現自動全鏈路的大資料處理流程的。

http://cloud.video.taobao.com/play/u/2605255438/p/1/e/6/t/1/50177942336.mp4?spm=a2c4e.11153940.blogcont603650.17.27d8c504KrSjyN&file=50177942336.mp4

 

MaxCompute資料倉庫資料轉換實踐

視訊介紹:由阿里雲資料技術專家彬甫帶來以“MaxCompute資料倉庫資料轉換實踐”為題的演講。本文首先介紹了MaxCompute的資料架構和流程,其次介紹了ETL演算法中的三大演算法,即更新插入演算法、直接載入演算法、全量歷史表演算法,再次介紹了在OLTP系統中怎樣處理NULL值,最後對ETL相關知識進行了詳細地介紹。

http://cloud.video.taobao.com/play/u/2605255438/p/1/e/6/t/1/50177978054.mp4?spm=a2c4e.11153940.blogcont603650.20.27d8c5041B6DJs&file=50177978054.mp4

 

阿里雲大資料數倉建設效能優化方式

視訊介紹:對於阿里雲大資料數倉建設效能優化而言,主要可以從排程優化、模型優化、同步優化以及任務優化這四個方面著手。其實,對於效能優化而言,最終還是會歸結到“資源”之上,所以資源是否足夠,分配是否合理也是我們在進行效能優化時必須考慮的關鍵所在。

http://cloud.video.taobao.com/play/u/2605255438/p/1/e/6/t/1/50178016505.mp4?spm=a2c4e.11153940.blogcont603650.23.27d8c5041B6DJs&file=50178016505.mp4

 

幫助企業做好MaxCompute成本優化的實踐

視訊介紹:阿里雲在和很多企業交流的過程中發現他們在使用MaxCompute的時候往往會遇到一些成本相關的問題,而在與客戶不但交流溝通的過程中,阿里雲在成本優化方面也積累了大量的經驗,因此也希望能夠將這些經驗沉澱下來分享給更多的企業和開發者,本文就將與大家分享幫助企業做好MaxCompute成本優化的“四步走”戰略。

http://cloud.video.taobao.com/play/u/2605255438/p/1/e/6/t/1/50178070358.mp4?spm=a2c4e.11153940.blogcont603650.26.27d8c5041B6DJs&file=50178070358.mp4

 

自建Hadoop資料如何託管到MaxCompute

視訊介紹:MaxCompute大資料計算服務,能提供快速、完全託管的PB級資料倉庫解決方案,能夠使使用者經濟且高效地分析處理海量資料。而使用者往往之前使用了Hadoop實現大資料計算任務,在選擇了阿里雲大資料計算服務之後,如何從Hadoop向MaxCompute進行遷移就成為了一個需要面對的問題了。在本文中,阿里雲資料技術專家結網就為大家分享了從Hadoop遷移到MaxCompute的理論與實踐。

https://yq.aliyun.com/webinar/play/495?spm=a2c4e.11153940.blogcont616516.26.108a7075lh0p9P

 

使用Flume收集網站日誌資料到MaxCompute

視訊介紹:本教程通過Flume 離線採集日誌到 MaxCompute,幫助中小企業實現低成本海量資料儲存。

https://yq.aliyun.com/video/play/487

 

將ECS上的Hadoop資料遷移到MaxCompute

視訊介紹:本教程是一個MaxCompute零基礎教程,在使用者擁有hadoop叢集以及擁有一定的hadoop資料開發經驗基礎上,結合阿里雲ECS伺服器,即可玩轉阿里雲數加平臺以及該平臺下大資料開發套件、Datax工具,實現資料從hadoop到MaxCompute。

https://yq.aliyun.com/video/play/450

 

 

 

MaxCompute Studio開發實戰

視訊介紹:阿里雲端計算平臺高階技術專家薛名深入介紹阿里巴巴大資料計算平臺開發利器—MaxCompute Studio。一站式的 IDE,可以快速完成資料瀏覽和管理、進行基於 SQL 和 UDF 的資料開發,更具備完善的作業分析和優化輔助等功能。

https://edu.aliyun.com/lesson_1010_8793?spm=5176.10731542.0.0.aUlrTO#_8793

 

 

客戶案例:

MaxCompute在短短的幾年時間裡,改變了很多行業,積累了大量的客戶成功案例。比如東潤環能在3個月內業務全面交付雲端,資料處理時間不到原來自建方式的1/3,並確保雲上資料安全無憂。墨跡天氣日誌分析業務遷移到數加MaxCompute後,開發效率提升了超過5倍,儲存和計算費用節省了70%,每天處理分析2TB的日誌資料,更高效的賦能其個性化運營策略。本文收錄了大量的客戶案例,總有一款適合您。

 

探祕獨角獸背後的大資料力量(眾安保險、親寶寶、中金易雲、螞蟻金服)

視訊介紹:來自眾安保險、親寶寶、中金易雲的大資料負責人以及螞蟻金服的資料技術專家為現場以及線上的企業和開發者們帶來了精彩細緻的分享。

https://yq.aliyun.com/live/643

 

ofo在MaxCompute平臺的大資料開發之路

視訊介紹:深入介紹ofo是如何站在MaxCompute這個巨人的肩膀上,遊刃有餘的處理千萬輛共享單車的大資料問題。

https://edu.aliyun.com/lesson_1010_8792?spm=5176.10731542.0.0.iCHgqS#_8792

 

基於MaxCompute構建Noxmobi全球化精準營銷系統

視訊介紹:Nox夜神成立於2015年,2016年開始進入廣告行業並主打Noxmobi廣告平臺,專注於全球化的泛娛樂精準營銷領域,目前發展迅速,並在業界擁有良好口碑。Noxmobi在營銷技術方面已經有一定積累,依託於阿里雲的各種雲服務,自建了業界領先的DSP、SSP、ADX等廣告系統。其中最重要的底層資料建設,依託於MaxCompute,本次分享將主要分享MaxCompute在ETL、特徵工程、資料探勘等方面的應用。

https://edu.aliyun.com/lesson_1010_8791?spm=5176.10731542.0.0.xaTjgA#_8791

 

MaxCompute在阿里媽媽數字化營銷解決方案上的典型應用

視訊介紹:阿里媽媽是阿里巴巴集團內部最大的MaxCompute使用者,承載著“讓天下沒有難做的營銷”的使命。本次技術沙龍會從應用和管理優化兩個方面來介紹阿里媽媽在搜尋廣告、定向廣告、達摩盤、報表和BI分析等常見場景下是如何使用MaxCompute的。

https://edu.aliyun.com/lesson_1010_8790?spm=5176.10731542.0.0.ai7H6J#_8790

   

 

佰騰科技的專利大資料的雲上裂變之路

視訊介紹:來自明源雲的劉崢分享了整個的地產行業的趨勢以及探索應用實踐。他主要從行業趨勢和應用實踐兩個方面進行了分享。他詳細的分享了資料管理平臺DMP平臺的基礎層、畫像層、演算法層、展示層的架構設計,並通過應用場景詮釋了大資料在地產行業的作用。

http://yq.aliyun.com/webinar/play/195

 

用大資料打造你的變美頻道-小紅脣

視訊介紹:來自小紅脣的王洋分享了數加平臺上小紅脣的大資料實踐。他對資料倉儲解決方案和搜尋引擎進行了詳細介紹。通過演算法平臺應用的基於視訊元資訊的迴歸、近義詞、業務匯流排三個案例具體介紹了數加平臺的大資料應用實踐。

http://yq.aliyun.com/webinar/play/196

 

上海雲貝網路科技:雲上大資料,零售新思維

視訊介紹:來自上海雲貝網路科技有限公司的 首席架構師-劉立兼 分享了基於阿里雲產品,如何構建一個大資料系統,以及系統如何在實際的業務過程中幫助客戶提升價值。他主要從客戶價值、產品線、服務、資料中心、基礎設施、資料採集服務六個方面進行了實踐分享。

https://yq.aliyun.com/live/197

 

上海雲棲:開啟大資料智慧時代(輕鬆籌、收錢吧)

視訊介紹:來自輕鬆籌、收錢吧的大資料負責人為現場以及線上的企業和開發者們帶來了精彩細緻的分享。

https://videocdn.taobao.com/oss/taobao-ugc/41bcb9dd919948a8ab40cea9db26531e/1497512453/video.mp4 [第1:45:00開始]