機器學習+天體物理:星辰影象的更高效處理方法
為了應對宇宙資料即將出現的指數級增長趨勢,天體物理學家也開始將目光投向機器學習。
Kevin Schawinski的問題
2007年,他在牛津大學擔任天體物理學家,努力回顧了斯隆數字巡天計劃中超過900,000個星系七年中有價值的照片。他花了幾天時間翻來覆去觀察這些影象,並記錄下了一個星系是螺旋形還是橢圓形的,以及它的旋轉方式。技術的進步加快了科學家收集資訊的能力,但科學家們處理資訊的速度卻沒有相應提升。 Schawinski和同事Chris Lintott花費了大量的時間來處理這個任務(即是上面提到處理星辰影象的任務),但並沒有得到良好的效果,因此,他們決定必須找到更好的方法來解決這個問題。
Schawinski和Lintott通過一個名為Galaxy Zoo的公民科學專案從公眾中招募志願者來幫助他們分類網上的星辰影象,並向多名志願者展示相同的影象以便讓他們能夠檢查彼此的工作。最終,超過10萬人參與並完成了這一項任務,如果靠他們自己的話,這項任務可能需要數年時間才能完成,但通過這種方式不到6個月就完成了。
公民科學家繼續為影象分類任務做出貢獻。但技術也在不斷髮展。
暗能量光譜儀器計劃於2019年開始,五年內將測量約3000萬個星系和類星體的速度。大型天氣調查望遠鏡定於20世紀20年代初開始工作,每晚將收集超過30TB的資料 – 並持續十年。
“來自這些調查的資料量至少要大一個數量級,”芝加哥大學博士後研究員Camille Avestruz說。
為了跟上資料的增長,像Schawinski和Avestruz這樣的天體物理學家已經著手招募了一類新的、非人類的科學家:機器。
研究人員正在使用人工智慧來幫助完成天文學和宇宙學中的各種任務,從影象分析到望遠鏡排程。
超級排程,計算機級別的校準
人工智慧似乎是計算機可以推理,決策,學習和執行與人類智慧相關的任務的方式的總稱。機器學習是人工智慧的一個子領域,它使用統計技術和模式識別來訓練計算機做出決策,而不是編寫更直接的演算法。
2017年,斯坦福大學的一個研究小組利用機器學習來研究強引力透鏡的影象,這種現象指的是空間中物質的積累足夠密集時會彎曲光波。由於許多引力透鏡不能單獨通過發光物質來解釋,因此更好地瞭解引力透鏡可以幫助天文學家深入瞭解暗物質。
過去,科學家通過比較重力透鏡的實際影象,並使用計算機大量模擬數學透鏡模型來進行研究,這個過程可能需要數週甚至數月才能生成單個影象。但一個斯坦福大學的團隊表明,機器學習演算法可以將這個過程加速數百萬倍。
Schawinski現在是蘇黎世聯邦理工學院的天體物理學家,並在他目前的工作中應用了機器學習。他的小組使用了稱為生成對抗網路(GAN)的工具來恢復因隨機噪聲而降級的影象。
機器學習在天體物理學中的另一個應用涉及解決諸如排程之類的邏輯挑戰。對於望遠鏡來說,一夜之間只有一個固定的時長可以使用給定的高倍望遠鏡,並且在一個確定的時間它只能指向某個特定的方向。芝加哥大學的物理學家,費米實驗室機器智慧小組的成員布萊恩諾德說:“使用望遠鏡數週就能花費數百萬美元。”該公司的任務是幫助所有高能量領域的研究人員在他們的工作中部署AI。
機器學習可以幫助天文臺安排望遠鏡,使他們能夠儘可能有效地收集資料。 Schawinski的實驗室和Fermilab都在使用一種稱為強化學習的技術來訓練演算法解決這樣的問題。在強化學習中,演算法不是針對“正確”和“錯誤”答案進行訓練,而是通過依賴於其輸出的不同反饋。演算法必須在選項的安全性,可預測的收益與通過意外方案完美解決問題的可能性之間取得平衡。
不斷增長的AI應用領域
當芝加哥大學豐田技術學院的電腦科學研究生Shubhendu Trivedi開始與他的導師Risi Kondor一起教授深度學習的研究生課程時,他很高興地看到有很多來自物理科學的研究人員報名參加。他們對如何在他們的研究中使用AI知之甚少,Trivedi意識到機器學習專家能夠幫助不同領域的科學家找到利用這些AI新技術的方法,但目前這一需求並沒有得到滿足。
他與班上研究人員進行的對話演變為合作,包括參加深空天體實驗室,這是一個天文學和人工智慧研究小組,由Avestruz,Nord和太空望遠鏡科學研究所的天文學家Joshua Peek共同創立。本月早些時候,他們提交了他們的第一篇同行評審論文,展示了基於人工智慧的方法在宇宙微波背景下測量引力透鏡的效率。
論文地址:
https://arxiv.org/abs/1810.01483
事實上,各地都出現了類似的團體,從瑞士的Schawinski集團到澳大利亞的天體物理和超級計算中心。天文學中機器學習技術的採用正在迅速增加。在arXiv對天文學論文的搜尋中,“深度學習”和“機器學習”這兩個術語在2018年前七個月的論文標題中出現的比2017年全年更多,而2017年全年都超過了2016年。
“五年前,天文學中的機器學習演算法是在大多數情況下比人類表現更差的深奧工具,”Nord說,然而如今,越來越多的演算法開始優於人類:“你會驚訝於它有多少低懸可摘的果實。”
但是將機器學習引入天體物理學研究也存在很多障礙。其中最大的問題在於機器學習對天文學家來說往往是一個黑盒。Schawinski說:“我們不瞭解神經網路如何工作和理解事物”,對於使用工具而不完全瞭解它們的工作方式,科學家們感到很擔心。
另一個絆腳石則是不確定性。機器學習通常建立於具有一定量噪聲或誤差的輸入,並且模型本身會做出引入不確定性的假設。研究人員在工作中使用機器學習技術需要了解這些不確定性,並將這些不確定性準確地傳達給彼此和更廣泛的研究領域。
機器學習的現狀發生瞭如此迅速的變化,研究人員不願意對未來五年即將發生的事情進行預測。 “如果資料能直接從望遠鏡中取出,而機器可以利用這些資料,發現並創造出意想不到的模式,我會非常興奮,”Nord說。
無論未來的發展形式如何,資料的發展都會越來越快。研究人員越來越相信,人工智慧將成為幫助他們跟上發展的必要條件。
相關報道:
https://www.symmetrymagazine.org/article/studying-the-stars-with-machine-learning
ofollow,noindex">大資料文摘
秉承“普及資料思維,傳播資料文化,助⼒產業發展”的企業⽂化,我們專注於資料領域的資訊、案例、技術,形成了“媒體+教育+⼈才服務”的良性⽣態,致⼒於打造精準資料科學社群。
理論 機器學習 模式識別 強化學習 深度學習 神經網路 天文 物理 影象分類
相關資料
Artificial Intelligence
在學術研究領域,人工智慧通常指能夠感知周圍環境並採取行動以實現最優的可能結果的智慧體(intelligent agent)
來源: Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.
Neural Network
(人工)神經網路是一種起源於 20 世紀 50 年代的監督式機器學習模型,那時候研究者構想了「感知器(perceptron)」的想法。這一領域的研究者通常被稱為「聯結主義者(Connectionist)」,因為這種模型模擬了人腦的功能。神經網路模型通常是通過反向傳播演算法應用梯度下降訓練的。目前神經網路有兩大主要型別,它們都是前饋神經網路:卷積神經網路(CNN)和迴圈神經網路(RNN),其中 RNN 又包含長短期記憶(LSTM)、門控迴圈單元(GRU)等等。深度學習是一種主要應用於神經網路幫助其取得更好結果的技術。儘管神經網路主要用於監督學習,但也有一些為無監督學習設計的變體,比如自動編碼器和生成對抗網路(GAN)。
來源:機器之心
Generative Adversarial Networks
生成對抗網路是一種無監督學習方法,是一種通過用對抗網路來訓練生成模型的架構。它由兩個網路組成:用來擬合數據分佈的生成網路G,和用來判斷輸入是否“真實”的判別網路D。在訓練過程中,生成網路-G通過接受一個隨機的噪聲來儘量模仿訓練集中的真實圖片去“欺騙”D,而D則儘可能的分辨真實資料和生成網路的輸出,從而形成兩個網路的博弈過程。理想的情況下,博弈的結果會得到一個可以“以假亂真”的生成模型。
Logic
人工智慧領域用邏輯來理解智慧推理問題;它可以提供用於分析程式語言的技術,也可用作分析、表徵知識或程式設計的工具。目前人們常用的邏輯分支有命題邏輯(Propositional Logic )以及一階邏輯(FOL)等謂詞邏輯。
來源:機器之心
Machine Learning
機器學習是人工智慧的一個分支,是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推斷統計學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。
來源:Mitchell, T. (1997). Machine Learning. McGraw Hill.
Reinforcement learning
強化學習是一種試錯方法,其目標是讓軟體智慧體在特定環境中能夠採取回報最大化的行為。強化學習在馬爾可夫決策過程環境中主要使用的技術是動態規劃(Dynamic Programming)。流行的強化學習方法包括自適應動態規劃(ADP)、時間差分(TD)學習、狀態-動作-回報-狀態-動作(SARSA)演算法、Q 學習、深度強化學習(DQN);其應用包括下棋類遊戲、機器人控制和工作排程等。
來源:機器之心
Deep learning
深度學習(deep learning)是機器學習的分支,是一種試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對資料進行高層抽象的演算法。 深度學習是機器學習中一種基於對資料進行表徵學習的演算法,至今已有數種深度學習框架,如卷積神經網路和深度置信網路和遞迴神經網路等已被應用在計算機視覺、語音識別、自然語言處理、音訊識別與生物資訊學等領域並獲取了極好的效果。
來源: LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.
Pattern Recognition
模式識別(英語:Pattern recognition),就是通過計算機用數學技術方法來研究模式的自動處理和判讀。 我們把環境與客體統稱為“模式”。 隨著計算機技術的發展,人類有可能研究複雜的資訊處理過程。 資訊處理過程的一個重要形式是生命體對環境及客體的識別。其概念與資料探勘、機器學習類似。
來源: 維基百科