1. 程式人生 > >BDTC 2017 | “TOP10大資料應用最佳案例實踐”十佳獲獎單位精彩分享

BDTC 2017 | “TOP10大資料應用最佳案例實踐”十佳獲獎單位精彩分享

【CSDN現場報道】12月7-9日,由中國計算機學會主辦,CCF 大資料專家委員會承辦,中國科學院計算技術研究所、中科天璣資料科技股份有限公司、CSDN協辦的2017中國大資料技術大會(BDTC 2017),在北京新雲南皇冠假日酒店隆重舉行。本次大會以“大資料與智慧為主題,聚焦最純粹的技術乾貨分享,和最接地氣的深度行業案例實踐,匯聚國內外頂尖技術專家,共論最新的大資料技術實踐與發展趨勢。

圖片描述

CCF大資料專家委員會副祕書長 潘柱廷

繼7日公佈TOP10評選結果正式對外發布後,8日下午,CCF大資料專家委員會副祕書長潘柱廷主持了“TOP10大資料應用最佳案例實踐”分論壇的上半場環節。

數贏未來,中興通訊大資料產業應用實踐

圖片描述

中興通訊股份有限公司首席架構師 羅聖美

目前,城市資訊化發展面臨了巨大挑戰:

  • 缺乏互聯互通:業務系統是由各委辦局分散建設、管理、運維的垂直系統,多重壁壘導致已有資料無法共享
  • 缺少價值發掘:未實現資料到知識的轉變,業務決策支撐智慧不足
  • 缺少決策依據:缺少大資料的支撐,不能為城市管理者提供資料資源與決策依據

中興通訊股份有限公司首席架構師羅聖美,率先分享了《數贏未來,中興通訊大資料產業應用實踐》的主題報告。他首先介紹了中興通訊大資料發展戰略分析了大資料國家產業政策,並介紹了中興通訊大資料全球重點市場應用和解決方案架構。通過在金融、電信、智慧城市等行業的典型應用案例,分享了中興通訊在大資料產業應用方面的實踐。據悉,全球範圍共有超過200家客戶選擇了中興通訊大資料產品,應用領域覆蓋通訊、智慧城市、公共安全、金融、教育等諸多領域

資料探勘與機器學習技術在電力領域應用

圖片描述

中國電力科學研究院技術戰略研究中心大資料聯合攻關專案部工程師 張國賓

中國電力科學研究院技術戰略研究中心大資料聯合攻關專案部工程師張國賓,進行了《資料探勘與機器學習技術在電力領域應用》的主題分享。裝置重過載執行是引起故障停電的主要原因之一,同時重過載現象通常也伴隨著三相不平衡、電壓偏移等其他問題,嚴重影響供電質量。另一方面,裝置長時間處於重過載狀態會加快元件的非正常損耗,降低裝置使用壽命,給電網帶故障隱患和執行風險。因此臺區重過載治理一直是配網運維檢修工作的重要內容。

針對臺區一級的重過載預測,目前的研究大多數仍然以配變負荷預測為切入點,包括利用歷史負荷資料外推負荷典型變化規律,加入氣象條件、經濟指標等外部間接因素分析與負荷關聯程度,嘗試各類機器學習方法構建負荷預測模型,最後基於負荷預測結果對重過載進行判斷。

但目前各類負荷預測方法在預測精度上的侷限性導致基於負荷預測結果的重過載預測不能適應業務實際情況:

  1. 對於短期負荷預測,考慮到目前消除重過載的手段以實施週期較長的線路切改和裝置改造為主,短期的預測結果不足以提供足夠的時間裕度消除重過載隱患;
  2. 對於中長期負荷預測,考慮到臺區負荷的突變性和波動性,負荷預測結果本身不能滿足對重過載進行判斷的基本精度。

基於以上兩點,案例直接從配變重過載狀態出發同時響應重過載管理工作的現狀需求,提出基於資料探勘與機器學習的重過載事件預測方法,包括:

  1. 基於概念聚類的重過載事件分類方法,從重過載發生時段、持續時長、發生相別、負載率水平等多個方面對重過載事件進行細分;
  2. 基於關聯規則挖掘的重過載影響因素分析方法,從裝置和使用者屬性、自然環境、短期負荷特性中挖掘針對各類重過載事件的關聯規則;
  3. 從關聯項中提取重過載影響因素並基於深度學習方法建立重過載事件預測模型,對重過載進行週期性預測。

醫療大超人(大資料+超級計算+人工智慧)

圖片描述

國家超算長沙中心副主任/教授 彭紹亮

在昨天7日主會keynote主題報告後,8日,國家超算長沙中心副主任/教授彭紹亮在TOP10分論壇又再次進行了《醫療健康大資料驅動下的人工智慧醫生》的主題分享。演講分為AI醫生體系、分導診機器人、準確率分析三部分。

醫療大資料的門檻非常高。其中,資料、演算法、算力是三個最大的門檻。智超醫療所研發的CDSS系統是結合了“大資料+超級運算+人工智慧“技術的計算機輔助診斷系統。大資料與人工智慧的介入與應用,不僅能提高臨床診療效率,還能有效緩解因醫療資源分佈不均帶來的診療體驗與效果差異,促進分級診療制度建設。系統最大的優勢在於,診斷和處方建議都是量化的,可操作性和可驗證性強。系統將掛號準確率提升到99%,診療準確率提升了10-20%,醫生診療效率提高了2-10倍,全面超越人工醫生和國際國內相關技術和產品。

產品在向量化演算法、神經元演算法、貝葉斯演算法的基礎上,研發了更符合醫學邏輯的VQ演算法/RBF演算法/BP演算法。同時推出了演算法整合平臺,對上述演算法的結果做了修正。通過天河超級計算機,將本來需要3-5年的計算工作時間,縮短到1-3小時,甚至秒級目前有三種形態產品:分導診機器人、分導診PAD版、分導診微信版。

滴滴實時計算平臺在運營監控方面的應用

圖片描述

滴滴大資料架構部技術研究員 羅李

針對運營監控,滴滴大資料架構部技術研究員羅李分享了《滴滴實時計算平臺在運營監控方面的應用》的相關內容。羅李通過實時平臺架構體系、實時應用案例、實時平臺功能簡介詳細的介紹了滴滴的大資料架構體系,架構體系如下圖:

圖片描述

滴滴通過實時計算叢集架構,維護了SparkStreaming和Flink兩套流計算引擎,通過Druid實時聚合資料指標,建立獨立的實時叢集,跟離線分開和任務級的管控/監控報警/日誌診斷和流處理作業的恢復功能。

在演講最後,羅李植入招聘廣告,他說:“網際網路公司最後一頁ppt都是招聘,歡迎大家一起來做事”。想去滴滴的朋友可以去試試。

金融科技在網際網路金融風險防範領域的應用

圖片描述

宜信致誠信用技術總經理 胡鵬飛

就分散式系統、社交圖譜等技術問題,宜信致誠信用技術總經理胡鵬飛分享了《金融科技在網際網路金融風險防範領域的應用》的主題演講。

隨著網際網路金融行業規模的不斷擴大,借貸需求持續增加,行業整體的風控水平亟待提升,為防範行業系統性風險的集中爆發,推動行業健康發展,致誠信用推出了致誠阿福風控平臺,這是專為網貸機構、消費信貸、小額信貸、銀行信用卡中心等提供身份識別、反欺詐、信用評估等服務的一站式智慧風控雲平臺。

胡鵬飛介紹了致誠信用旗下的致誠阿福風控雲平臺。致誠阿福以共享為核心,基於宜信強金融屬性資料及先進風控經驗、自身大資料分析能力及評分建模能力,採用分散式服務化系統架構,幫助信貸機構防範貸前調查、貸中授信和貸後管理中因資訊不對稱所帶來的潛在風險。

平臺最大化地將金融科技與業務融合,以知識圖譜為底層架構建立反欺詐的風控體系,創新性地研發了福網。福網以經過校驗核實的千萬級宜信多條業務線的風險資料、超過億級的社交資料以及其他資料為基礎進行整合,在提升資料純度的基礎上有效釋放資料價值,通過自然語言處理、機器學習、聚類演算法等方法構建模型,建立多維度資料畫像。通過量化評分、風險分級,對風險實現最優排序性和區分度,準確識別使用者欺詐可能性併為機構反饋精準且區隔度高的風險資訊。

中國科學院計算技術研究所副研究員、博士查禮,主持了下半場的“TOP10大資料應用最佳案例實踐”分論壇的下半場環節。

阿里商品知識圖譜-智慧消費導購與商品管控背後的“商品大腦”

圖片描述

阿里巴巴產品專家 施喆琦

在下半場,阿里巴巴產品專家施喆琦率先分享了《阿里商品知識圖譜-智慧消費導購與商品管控背後的“商品大腦”》的話題。施喆琦具有豐富的大資料從業經驗,現負責阿里商品知識圖譜產品設計,曾從事電信、銀聯的資料產品工作。演講中,施喆琦介紹阿里三萬億背後的“商品大腦”——阿里商品知識圖譜的構建與應用。

“大腦”的一個應用場景就是導購。而所謂導購,就是讓消費者更容易找到他想要的東西,比如說買家輸入“我需要一件漂亮的真絲絲巾”, “商品大腦”會通過語法詞法分析來提取語義要點 “一”、“漂亮”、“真絲”、“絲巾”這些關鍵詞,從而幫買家搜尋到合適的商品。在導購中為讓發現更簡單,“商品大腦”還學習了大量的行業規範與國家標準,比如說全棉、低糖、低嘌呤等。

此外,它還有與時俱進的優點。“商品大腦”可以從公共媒體、專業社群的資訊中識別出近期熱詞,跟蹤熱點詞的變化,由運營確認是否成為熱點詞,這也是為什麼買家在輸入斬男色、禁忌之吻、流蘇風等熱詞後,出現了自己想要的商品。最後,智慧的“商品大腦” 還能通過實時學習構建出場景。比如輸入“海邊玩買什麼”,結果中就會出現泳衣、游泳圈、防晒霜、沙灘裙等商品。

“讓發現變簡單、讓判斷更智慧”,通過阿里的知識圖譜,人們的消費購物將變得更加簡單。

工業網際網路

圖片描述

東方國信市場總監 王立忠

全球範圍內新一輪科技革命和產業變革蓬勃興起。工業網際網路作為新一代資訊科技與製造業深度融合的產物,日益成為新工業革命的關鍵支撐和深化“網際網路+先進製造業”的重要基石。作為工業網際網路專家,並擁有工業領域20+年的資訊化諮詢及應用經驗的東方國信市場總監王立忠,針對《工業網際網路》領域分享了東方國信的工業網際網路平臺和應用,這也是TOP10獲獎企業中唯一一家針對工業大資料的主題演講。

東方國信不斷卡位大資料優勢行業,持續深化“大資料+行業”的戰略佈局,已經成功服務於通訊、金融、城市大資料、智慧旅遊、精準醫療、公共安全、保險、新聞媒體、工業、農業等十大領域,奠定了更為堅實的行業基礎。憑藉自主可控大資料技術,為具有海量資料的國內外客戶提供大資料規模化處理。

最後,王立忠講解了工業鍋爐、空壓機遠端運維、園區環境安全資訊化平臺、安全生產監測預報警平臺、政府工業大資料監測預警等多個東方國信的案例應用。

網際網路數字營銷廣告資料管理平臺應用

圖片描述

精碩科技技術副總裁兼總架構師 劉喆

精碩科技技術副總裁兼總架構師劉喆分享了《網際網路數字營銷廣告資料管理平臺應用》的內容,演講針對高併發、高擴充套件、易監控、自動化、智慧化、混合異構、數字營銷應用等方面,闡述了精碩科技的方案思路。

由於資料來源是有廣告資料、文字資料、資料庫資料、視訊和圖片資料等,每個使用者對系統的響應速度要求也不一樣,所以AdMaster開發了一個混合異構大資料平臺專案,深度整合了多個開源大資料平臺,並融入了AdMaster自己的技術基因,真正把開源技術活學活用,一方面解決了公司自己的問題,提升了資料管理效率;另一方面回饋開源,為大資料的綜合應用方案提供了可行的案例。案例創新點如下:

  • 自主研發的高併發資料收集服務,單機每秒1.2w次以上;
  • 按業務不同,自動排程優先順序,智慧調配資源;
  • 頁面模擬錄屏,分析最真實的廣告;
  • 為資料科學家提供互動式資料分析平臺R/SQL/Spark;
  • 實時和穩定的訊息收發平臺, 全國30多機房,資料彙總延遲不超過3分鐘

作為廣告監測領域的TOP10代表,他們的方案在廣告監測、輿情分析、人群畫像的成果在廣告行業大資料應用中有很突出的示範意義。

研究垃圾簡訊大資料自動識別的新方法

圖片描述

中移(蘇州)軟體技術有限公司 大資料產品部演算法工程師 楊希

垃圾簡訊是困擾我們每個人的問題,大家對這個話題的關注度可見一斑。作為TOP10獲獎企業之一的中移(蘇州)軟體技術有限公司,其大資料產品部演算法工程師楊希分享了《研究垃圾簡訊大資料自動識別的新方法》的演講。

經與業界領先網際網路公司演算法進行測試比對,其研發演算法查全率與其基本持平,但識別準確率(99.8%)遠高於對方(93.7%),處於領先水平。由實際生產需求驅動創新研發,並最終實現了研發成果的應用落地,並用機器識別替代傳統治理模式。根據統計資料可知,目前月均可減少不法分子傳送的垃圾簡訊約8500萬條,有效的保障了廣大使用者的通訊權益,創造了巨大的社會效益。

該案例中應用的技術水平已處於國際先進、國內領先地位。為我國自動化識別技術在垃圾簡訊治理中應用,創新探索出了一條切實可行的道路。

大資料助力傳統供應鏈降本增效

圖片描述

杭州覽眾資料科技有限公司副總經理 金亮亮

近年來,供應鏈管理在企業發展中佔據著越來越重要的戰略地位,成為企業“第三利潤的源泉”。對於很多物流不是核心業務的企業來說,供應鏈既是主要成本的產生點,又是降低成本的關注點。針對供應鏈領域的發展需求,杭州覽眾資料科技有限公司副總經理金亮亮分享了《大資料助力傳統供應鏈降本增效》的主題演講。

覽眾資料智慧決策引擎雲平臺軟體主要包括銷售預測、智慧要貨、智慧採購、智慧分類四大產品,可以針對不同行業,提取典型的決策場景進行分析,為企業提供SaaS服務,針對零售業和製造業所提供的資料進行分析,可以打通上下游環節,實現企業資料資本化,企業之間合作最大化。

整個系統包含兩個方面的層次關係,一個是軟體的畫面表現層,體現在網頁瀏覽器中,是使用者最終能看到的部分;另一個是邏輯層,包含整個軟體的執行時邏輯以及計算、繪圖。

在公司供應鏈智慧決策引擎的幫助下,浙江的一鳴食品總體銷售額同比增加10%,庫存成比例降低30%,客戶滿意度提升5%。

活動最後,中國科學院計算技術研究所副研究員、博士查禮總結的活動意義。目睹了大資料長達十年的發展,其技術已趨向成熟,通過實際應用效果選出的這10家不同行業案例,為整個大資料企業樹立起行業標杆。他期望,未來將有更多優秀的行業案例湧現出來,從而推動大資料技術落地到我國的各行各業。

更多精彩內容,請關注直播專題,
新浪微博@CSDN
觀看大會圖文直播,請掃描二維碼關注CSDN資訊微信公眾號。

圖片描述

圖片描述