1. 程式人生 > >【人工智慧】資料科學2019發展趨勢有哪些?計算機先驅艾倫•圖靈這樣說!

【人工智慧】資料科學2019發展趨勢有哪些?計算機先驅艾倫•圖靈這樣說!

資料科學和分析領域在2018年的主要發展有哪些?2019年的主要趨勢又如何?本文推薦業內12位大牛的觀點,一起來看看他們是如何評價的吧!

Meta Brown, @metabrown312, 《Data Mining for Dummies》作者, A4A Brown公司總裁。致力於培養管理和技術人員之間的有效溝通。

人工智慧一直是2018年的熱門分析話題。

在這裡給大家推薦一個python系統學習q群:250933691有免費開發工具以及初學資料,(人工智慧,資料分析,資料探勘,爬蟲,神經網路)每天有老師給大家免費授課,歡迎一起交流學習

近來,與其他分析應用相比,人工智慧的話題度似乎更高。可惜的是,大部分討論都毫無意義。

計算機先驅艾倫•圖靈曾設想計算機擁有與人類智力相匹敵的能力。人工智慧將使計算機生成的對話與人類對話別無二致。

想想當下我們與人工智慧應用的互動。諸如Siri或Alexa之類的私人助理或許有用,好像和真人溝通沒什麼區別。但提供線上幫助的機器人客服卻令人大失所望——你只需問一個實際點的問題,就能馬上發現它只是一個沒有思想的機器人。

根據圖靈的定義,人工智慧尚未出現。紐約大學的心理學和神經科學教授Gary Marcus表示,“認為我們離它很近”是對人工智慧最大的誤解。

在現實生活中,我們確實有計算機驅動邏輯的實際應用。雖然不像人那樣思考,但它們思維敏捷、連貫,這些都是有價值的特點。這些應用程式使機器能夠做一些實際的工作,比如標記潛在的欺詐交易和操作汽車。

儘管技術上存在明顯的侷限,但公眾甚至技術人員都對人工智慧抱有不切實際的要求和期望。誇大其詞引起了許多恐慌。AI正開始令人失望,並且這種失望只會更多。

Tom Davenport,@tdav,巴布森學院傑出的資訊科技和管理教授,國際分析研究所聯合創始人,麻省理工學院數字經濟計劃研究員,德勤分析高階顧問。

在國際分析研究所做出的年度趨勢預測中,有幾個觀點我較為贊成:

• 公司越來越關注模型部署率——根據Rexer Data Science的調查,只有10-15%的公司“幾乎總是”部署結果,另外50%的公司則“經常”部署結果。剩下35%-40%的公司只是偶爾或很少成功地部署分析模型。我遇到過一些公司稱其成功部署率低於10%。當然,未經部署的分析模型不會有任何經濟價值。所以企業需要在2019年衡量並提高其部署率。

• 業餘資料科學家和商業分析師仍將存在。圖形化分析和基於搜尋的分析的興起,以及資料科學前沿日益自動化的機器學習意味著我們將看到業餘人士完成越來越多的分析工作。與其與這種趨勢做無謂的抗爭,不如集中精力為其保駕護航。這也意味著,一定數量的專業人員要麼需要轉向高度複雜困難的建模任務,要麼需要理解商業問題,應對企業變革。

Carla Gentry, @data_nerd,資料科學顧問,Analytical-Solution的所有者。

2018年是分析和資料科學的黃金年。同時,我們也看到了AI、神經網路和機器學習的爆炸式增長,無論這種說法有無人才和經驗的支援。AI在醫療和治安領域的使用有所增加,而且,無論是否存在偏見、人才和經驗等危機,我認為有些人已經忘記了在這些情況下,資料等於生命。而可穿戴裝置和物聯網(Google Home, Alexa等)的例子告訴我們,這種情況將繼續存在。

2019年將會有更多相同的流行語出現,很多公司開始意識到,神經網路需要成千上萬的例子來學習。更糟糕的是,每次你想讓神經網路識別新型的東西時,必須從零開始(至少很耗時)——人才是另一個問題,除了Geoffrey Hinton、Yejin Choi 和Yann LeCun外,再無神經網路方面的專家,所以別指望在人才庫裡進行挑選了。

資料科學是指收集資料並形成觀點。在某些情況下,期望我們成為AI、機器學習或神經網路領域的專家是不切實際的的。因此,我們必須更仔細地探討其差異。同時,在這一技術的新未來裡,新使用者必須具備更強的技能來競爭。我擔心的是,對機器如何學習以及如何使用人工智慧缺乏真正的理解,將繼續暴露一些公司/演算法/企業的弱點。

讓我們欣然接受這些技術吧!但要明白,如果你做錯了,就要承擔後果!

Bob E. Hayes, @bobehayes,研究員、作家和顧問,Business over Broadway出版人,擁有工業組織心理學博士學位。

在資料科學和分析領域,人們對機器學習的興趣持續升溫,包括強化學習、聊天機器人及其對社會的影響。

預計在2019年,AI領域的倫理道德將獲得越來越多的關注,包括隱私和安全問題。重點將更多放在理解演算法如何做出特定決策上:我們不僅需要知道機器學習能夠幫助我們做出決策,還要知道其工作原理(它是如何做出決策的)。此外,美國企業將重點關注如何使用消費者的個人資料。加州通過了《加州消費者隱私法案》(將於2020年1月生效),希望其他州也能效仿。

我擔心AI和機器學習在假新聞的製造和傳播中發揮更大的作用。DeepFakes已經表明人們可以輕而易舉地製作視訊內容,其中顯示的是人們並沒有說過的話和沒有采取過的行動。正如Max Tegmark所言,認識AI潛在的壞處並非是在散佈恐懼,而正是一項“安全工程”。

雖然對於資料專業人士來說,通過訓練營、慕課(MOOCs)和大學課程等學習資料科學的方法有很多,但我希望在資料分析的方法中,能看到更多對非資料專業人士(如管理者和一線員工)的教育嘗試。

Cassie Kozyrkov, @quaesita,谷歌雲首席決策工程師。熱愛統計、AI、資料、雙關語、藝術、科幻、戲劇、決策科學。

2018年的一個主要發展即是資料科學的民主化。從雲技術(雲技術允許人們不必先建立資料中心,就可以嘗試資源密集型的大資料和AI應用程式),到像Kubeflow這樣的工具(這些工具將可伸縮的資料科學帶給沒有專業知識的普通人),在2019年,它們將促使資料科學成為每個人工具的趨勢進一步加速。

Doug Laney, @Doug_Laney,Gartner副總裁、傑出的分析師和首席資料官,著有《資訊經濟學》一書。

Gartner的2019年度資料&分析戰略預測剛剛釋出。其中包括:越來越多的公司戰略明確提到,資訊是重要的企業資產之一,而分析是一項基本能力。不僅IT策略提到了這一點,企業策略和計劃亦有提及。

同時,我們也希望資料教育計劃能變得更常見,幫助商業人士與資料&分析專家更好地交流,特別是在分析需求變得更復雜的情況下。隨著資訊經濟學的原則和實踐被越來越多地採用,我們希望首席資料官能夠多與其首席財務官合作,以正式評估企業的資訊資產。實踐證明,這樣做可以為我們許多客戶的資訊管理和生意帶來利益。但是分析和數字道德仍是一個問題,我們相信公司將開始為其資料科學團隊引入行業行為準則。

此外,我們預計在未來3-5年內,多數新商業系統將會採用使用實時語境資料的連續智慧;量子計算概念驗證專案將顯著超越現有的分析技術;強化的和自動化的見解將取代絕大多數預先構建的報告;位置分析的使用將增加近10倍;機器學習將緩解尋找資料科學家的競爭。

Gregory Piatetsky, @kdnuggets,KDnuggets總裁,資料科學家,KDD會議和SIGKDD聯合創始人,位列LinkedIn 2018 Top Voices “資料科學和分析”排行榜首位。

2018年的主要發展:

• GDPR(《通用資料保護條例》)於2018年5月生效,這不僅是歐洲的一個重要里程碑,在美國和其他地區也是如此,許多公司正在更新其隱私政策。然而,消費者的隱私是否會得到實質性的保護,亦或只是在新的隱私條款的掩護下一切照舊,還有待觀察。

• 資料科學民主化繼續進行,越來越多的工具使我們能夠獲得更廣泛的資料科學見解。我尤其注意到AWS改造釋出的新工具。

• AI風險:第一起自動駕駛汽車致人死亡事故發生——自動駕駛汽車與扶著自行車的行人相撞。這增加了人們對AI不可規避風險的關注。與此同時,自動駕駛汽車(以及自動化AI)不應被限制在理想化的零失誤標準之下,而應與當前的實際風險進行比較。例如,人類駕駛極其危險,僅在美國,2017年就有3.7萬人死於交通事故。

2019年的主要趨勢:

• 資料科學自動化將繼續加速,但至少在未來幾年內,資料科學家的工作不會被完全取代。

• AI的進步和炒作:雖然AI的進步是真實的,但AI的炒作會增長得更快。

• 中國已經成為人工智慧領域的主要參與者,許多中國公司都在進行自己的創新,而非只是抄襲美國。

• 強化學習將在AI進步中扮演越來越重要的角色。例如,RL在Montezuma's Revenge Atari遊戲中取得了100級的驚人戰績,遠遠超過了這款遊戲之前的所有記錄,無論是電腦還是人類創造的。

Bill Schmarzo, @schmarzo, Hitachi Vantara物聯網和分析的首席技術官。

2018年大資料、資料科學或分析的主要發展:

• 商業利益相關者對機器學習和深度學習的商業變化潛力的認識有了顯著提高。這是由大量已公佈的使用案例造成的。

• 資料湖仍是一項錯誤的資產。很多企業都把資料湖看作是一種降低昂貴的資料倉庫和ETL成本的方法,但卻沒有完全理解資料湖可作為一個合作的價值創造平臺,使商業利益相關者和資料科學團隊可以從中派生並驅動商業價值。

2019年的主要趨勢:

• 對於龍頭企業而言,大資料和資料科學計劃將由商業而非IT驅動。商業領袖們將親自識別、驗證、審查、評估這些能夠推動商業成果的業務領域,並優先考慮大資料、物聯網和資料科學(機器學習、深度學習、人工智慧)。

• 除了利用資料科學來優化核心業務和運營流程(從引人注目的ROI開始仍然可取),龍頭企業還將意識到隱藏在資料中的客戶、產品和運營的見解會是新的貨幣化機會的推動力。

Kate Strachnyi, @StorybyData,資料視覺化專家,著有《The Disruptors: Data Science Leaders and Journey to Data Scientist》; 播客Humans of Data Science 主持人。

2018年資料科學和分析的主要發展:

• 《通用資料保護條例》(GDPR):於2015年5月生效的歐盟條例提供了一套準則,旨在讓歐盟公民能夠更好地掌控其個人資料。其他地方受到鼓勵,也制定了類似標準。例如,加州通過了自己的數字隱私法,可以讓消費者知道公司在收集什麼資訊、為什麼要收集以及與誰共享這些資訊。

• 自助業務智慧(BI)工具:BI工具在資料分析師和商業分析師中變得更加常見。然而,目前還不清楚這些工具的使用者是否與幕後的分析保持一致。使用者學習將欄位拖放到工具中並建立圖表與後端對發生事件的實際理解之間似乎還存在著速度差距。

2019年的主要趨勢:

• 資料倫理&隱私:在資料科學程序的每一步中,將更加註重對資料處理倫理/隱私的考慮;從事資料工作的人員需要了解這些工作舉足輕重的意義。隨著世界的日益數字化,個人、公司和政府越來越關注這一問題。

• 流程自動化:公司將繼續自動化流程,以降低成本,提高效率。這種自動化可能導致負責執行自動化過程的人員失業。所以人們需要不斷學習新技能,以在這個快速變化的環境中保持與時俱進。

Ronald van Loon, @Ronald_vanLoon,Adversitement總監,幫助資料驅動的公司獲得成功。十大大資料、資料科學、物聯網、AI影響者之一。

在2018年,端到端資料管理得到了發展。公司正在使用所有的資料來源以獲取可靠見解,並支援與數字經濟相一致的基礎設施建設和商業模式,同時分析成熟度也得到了提高。機器學習被廣泛接受,所有的軟體供應商都將其構建到自己的應用程式中,並提供了特定領域的解決方案。

2019年,將會有更多整合的硬體和軟體框架,用於支援更高階的深度學習應用程式,進一步促進創新。深度學習應用程式需要充分優化的硬體和軟體棧,來推廣新的、現代的AI架構。我們將看到這種全棧方法在各領域供應商中興起,以應對對最優深度學習效能和能力的加速需求。

實時邊緣分析將隨著物聯網裝置的增長而迅速增長,實時分析變得更容易,便於根據實時見解作出快速反應。

Favio Vazquez, @FavioVaz,資料科學家,物理學家,計算工程師。Ciencia y Datos創始人。

對於資料科學(DS)來說,2018年是充滿驚喜的一年,在理論和實踐方面都取得了巨大進步。針對資料科學,有幾種不同的研究方法被提出,有助於將這一領域轉化為一門真正的科學。對此,我已經討論了一年多了,最近我發現有更多的人在談論它。在機器學習(ML)方面,AutoML非常龐大,也包括自動的深度學習。

在這裡給大家推薦一個python系統學習q群:250933691有免費開發工具以及初學資料,(人工智慧,資料分析,資料探勘,爬蟲,神經網路)每天有老師給大家免費授課,歡迎一起交流學習