1. 程式人生 > >我眼中的華為公有云AI平臺--ModelArts

我眼中的華為公有云AI平臺--ModelArts

前言

AWS Sagemaker has been a great deal for most data scientists who would want to accomplish a truly end-to-end ML solution——by John Moolayil

這是資料科學線上網站“towards data science”一篇文章中的一段話。時常有人問我,“為什麼會有ModelArts存在”,這是一個很有價值的問題,結合國外專家對AWS Sagemaker的評價,我決定寫一篇文章,講講我對華為雲ModelArts全流程AI平臺的理解。

ModelArts平臺的初心

為什麼不能僅僅使用開源軟體構建AI訓練和推理過程?答案是,可以的,但是不能用於大規模生產環境下,至於為什麼我這麼說,讓我們先談談人工智慧產品。我認為,如果要將人工智慧技術整合到各個行業,需要有一套完整的軟硬體平臺支撐。

人工智慧平臺大致的分層架構如下圖所示:

完整的人工智慧平臺,水平方向上支援端、邊、雲三種場景,每個場景均涵蓋了從底層硬體至上層應用。

最底層是晶片層(例如華為的昇騰晶片、Google的TPU晶片、NVIDIA的GPU卡),再往上是適用於端邊雲的硬體系統(包括伺服器和終端裝置等)及其基礎軟體環境(如雲服務、作業系統)。

位於這三層之上的是AI計算引擎層,AI計算引擎可以藉助計算資源,完成AI模型的訓練和推理。當模型訓練後之後,需要部署進行推理,推理模組由於計算資源消耗較少,更容易覆蓋端、邊、雲三個場景。

在AI計算引擎之上,人工智慧平臺提供了常用的AI框架、演算法、模型及其其他工具方便使用者進行AI業務的開展。常用的AI工具包括但不限於:資料的格式轉換、預處理、模型儲存、模型評估、模型壓縮等等。AI框架、演算法、模型和工具是解決常用AI問題時必備的元件。這些可以大大降低AI應用開發的門檻,簡化開發AI應用所需的程式碼量。在此之上,AI應用平臺服務提供AI應用的開發和部署服務,支援一次開發、任意部署(含雲、邊、端)。

再往上是AI應用平臺服務,它提供端到端的AI應用開發和部署服務。

最頂層是基於AI應用平臺服務開發出的AI解決方案和AI應用,可用於解決業務問題。

自下向上的每一層,我們可以看出,AI平臺需要提供從硬體到軟體、演算法工具再到雲服務的全棧優化,才能夠真正提升AI應用開發的效率,進而使能行業AI。

ModelArts平臺的初心,除了降低以上所說的各層的複雜性之外,更是為了便於使用者創造AI應用。為什麼AI應用有別於傳統軟體應用?因為目前常用的人工智慧演算法,大多基於概率統計,所以具有一定的不確定性和概率性。例如在影象分類場景下,任何AI模型都不可能實現100%的分類準確率。當AI模型預測一張影象類別時必須伴隨著一定的概率值,這個概率值不可能達到100%,只能無限接近。而傳統AI軟體基本都在執行確定性的操作,不會出現概率性。這就是AI應用和傳統軟體應用最大的區別。

如下表所示,從產品設計、方案設計、開發、測試、上線再到運維的全生命週期的每個階段中,傳統軟體應用開發和AI應用開發都有很大的區別。

初識ModelArts

這是ModelArts的首頁,有人會說為什麼這麼雜亂,很多功能都被平鋪在了首頁上?如果你換位思考,ModelArts是面向2C使用者的AI平臺,從完全不懂程式設計的小白,到精通AI開發全流程的工程師,我們要讓更多人享受到AI帶來的紅利,我們自然需要覆蓋更廣的使用者技能範圍,所以,你看到了自動學習、AI全流程開發,這兩個不同方向並排在了首頁。普惠,瞭然於心。

進一步剖析ModelArts

瞭解一下AI全流程開發,如下圖所示:

對於資料管理的理解

AI應用開發的全流程是對資料來源不斷地進行處理,並得到最終期望結果的過程。這個過程的每個步驟,都會基於一定的處理邏輯對輸入資料進行處理,並得到輸出資料,同時也可能會產生一個或多個模型,以及一些可能的元資訊檔案(如配置項檔案等)。

在處理的過程中,可能會接受外部輸入(例如使用者的輸入、配置、其他外部環境的輸入等)。每個處理步驟的處理邏輯可以是平臺內建的處理邏輯,也可以是開發者自定義的處理邏輯(例如開發者利用平臺的開發除錯環境開發的一套程式碼)。當資料來源經過一系列處理之後,我們會得到最終的結果資料(例如影象識別精度等報表資料)。在這一系列的處理步驟中,可能會出現反覆,例如當我們對某個處理步驟輸出的資料不滿意時,可以重新修正輸入資料或者處理邏輯,重新進行處理,也可以跳到其他處理步驟進行進一步處理。

當前,大部分人工智慧是圍繞資料為中心進行開發,其中涉及到的演算法往往以概率統計為基礎,這些演算法往往對其輸入資料有非常強的先驗假設(例如獨立同分布等),我們需要將原始資料轉換為滿足這些假設的資料才能用來訓練模型。

學術界對於一些常見的我們通常專注於演算法的創新設計和開發,而較少地去做資料的採集、清洗、處理等工作。工業界情況恰好相反,我們需要在資料方面做非常多的工作,例如當我們需要採用機器學習分類演算法解決一個具體業務問題時,資料來源可能是多方面的,可能是在本地儲存的某些檔案,也可能是業務系統的資料庫,也可能是一些紙質文件。

因此,我們需要統一的資料來源接入層完成資料採集。在這些資料採集過程中,可能還會涉及到模型的訓練和推理。例如,可以呼叫一個現有的OCR模型用來識別紙質文件上的關鍵資料,用於電子化歸檔並做進一步處理。除了資料採集之外,我們還需要進行一系列的資料預處理(例如脫敏、去燥、校驗、條件篩選等等)。由於目前人工智慧演算法大部分都是基於監督學習的方法,所以資料標註十分必要。另外,實際的資料經常會面臨很多問題,比如資料質量較差、資料冗餘性較多、資料規律發現難等。因此資料需要額外的調優工作。資料經過一系列採集、處理、標註、調優之後還需要進行半自動、自動化稽核驗證。例如在經過標註之後,我們需要能夠及時評估標註質量。最後,為了方便管理資料,我們需要資料管理來實現資料的儲存對接、資料許可權控制、資料版本控制、資料元資訊管理、資料集切分等。

資料獲取:資料來源接入模組能夠保證ModelArts方便地讀取各類資料,例如儲存在資料庫、本地檔案系統、物件儲存系統等上的離線資料,也可以是來自於實時流系統的資料流、訊息等。另外,為了應對資料獲取難的問題,ModelArts服務提供了資料檢索和資料擴增的能力。

資料預處理:提供一系列的預處理演算法和工具包,例如針對於非結構化資料的格式合法性校驗、資料脫敏,以及針對於結構化(表格類)資料的特徵清洗(異常樣本去除、取樣等,還有一些針對單個特徵的缺失值補充、歸一化、統計變換、離散化等)。

資料標註:針對於非結構化資料(例如影象、視訊、文字、音訊等)通常,提供一系列的智慧化標註能力和團隊標註能力。

資料調優:提供資料生成、資料遷移、資料選擇、特徵選擇的能力,以及資料特徵分析、標籤分析、資料視覺化的能力。

資料驗證和平臺:提供資料稽核、標註稽核的能力,使處理後的資料滿足可信要求。

資料集管理:提供資料集儲存管理(對接多類儲存系統,如物件儲存系統、本地檔案系統等)、資料集版本管理、資料元資訊管理、資料集切分和生成。

對於開發環境的理解

在AI研究探索場景中,Jupyter 作為一個特殊的存在迅速成長為AI探索類場景開發的首選,能夠在其各個階段滿足開發者訴求並覆蓋這些關鍵點,以及支援在瀏覽器中使用的特點。

Jupyter 起始於 IPython 專案,IPython 最初是專注於 Python 的專案,但隨著專案發展壯大,已經不僅僅侷限於 Python 這一種程式語言了。按照Jupyter創始人的想法,最初的目標是做一個能直接支援Julia(Ju),Python(Py)以及R三種科學運算語言的互動式計算工具平臺,所以將他命名為Ju-Py-te-R,發展到現在Jupyter已經成為一個幾乎支援所有語言,能夠把程式碼、計算輸出、解釋文件,多媒體資源整合在一起的多功能科學運算平臺。

這裡需要提到的另外一個概念就是“文學程式設計”,文學程式設計是一種由Donald Knuth提出的程式設計正規化。這種正規化提供了用自然語言來解釋程式邏輯的機會。簡單來說,文學程式設計的讀者不是機器,而是人。 從寫出讓機器讀懂的程式碼,過渡到向人們解說如何讓機器實現我們的想法,其中除了程式碼,更多的是敘述性的文字、圖表等內容。 文學程式設計中間穿插著巨集片段和傳統的原始碼,從中可以生成可編譯的原始碼。

作為第一個貫穿整個科學計算研究的生命週期工具平臺,可以將可以分解為,如果我們將科學計算研究全生命週期分解為,個人探索,協作與分享,生產化執行環境,發表與教學,Notebook都可以在這些階段中滿足科研工作的需求。

Jupyter有沒有缺點?有的。如果你追求的是產品化程式碼開發,例如程式碼格式、依賴管理、產品打包、單元測試等等功能在IDE中是沒有很好的支援,當前有一些外掛可以做,但是相比重型IDE,功能還是比較弱。此外,Jupyter定義為研究類除錯環境,一方面對於分散式的任務當前推薦都是通過單機多程序的方式進行模擬,真實到有多節點拓撲資訊的部分在Jupyter中不容易實現,另外一方面,Jupyter的架構並不適合跑非常重量級的作業。對於真實軟體產品開發的訴求,還是需要在IDE中進行工程化程式碼開發,並配搭測試邏輯,將任務部署在叢集中進行執行。

所以,我們還是需要繼續使用pyCharm開發程式,但是如何讓本地的pyCharm與ModelArts結合在一起呢?放心,我們有pyCharm的ModelArts外掛。

我們實際上使用一個PyCharm ToolKit工具來幫助建立從本地pyCharm IDE到ModelArts的連線通道,本案例我使用MXNet實現手寫數字影象識別應用的示例,在本地快速完成程式碼編寫,釋出到ModelArts公有云完成模型的訓練和模型生成。

安裝toolkit前需要先安裝2019.2版本(目前toolkit僅適配該版本)的pycharm,下載地址是:https://developer.huaweicloud.com/tools。

需要注意,如果已經安裝了高版本的pyCharm,需要首先解除安裝(自動)已安裝的pyCharm:

下載一個工具Pycharm-ToolKit-PC-2019.2-HEC-1.3.0.zip,連線本地IDE與雲之間的鏈路:

https://www.jetbrains.com/pycharm/download/other.html

解壓後看到一堆jar檔案,

接著回到pyCharm IDE,開啟Settings:

找到Plugins,選擇一個外掛:

點選RestartIDE:

重啟後看到如下介面:

然後我們需要去ModelArts網站申明祕鑰:

申請祕鑰:

簡訊驗證碼註冊成功後,請務必把csv檔案儲存到本機。

回到pyCharm IDE:

注意,如果填寫祕鑰鍵值對成功後,Edit Credential應該是要打鉤的,如果沒有,請檢視網路連線是否存在問題,例如不允許連線外網,或是對訪問外網有限制。

注意,需要你重新點選edit credential按鈕,退出後就能看到打鉤了。

這樣我們就完成了pyCharm IDE與ModelArts的對接工作,進入下一步,實際訓練一個模型。

首先,下載手寫字的資料集:https://modelarts-cnnorth1-market-dataset.obs.cn-north-1.myhuaweicloud.com/dataset-market/Mnist-Data-Set/archiver/Mnist-Data-Set.zip

登入華為雲上傳OBS:

建立兩個資料夾,一個用於存放資料集,一個用於存放訓練生成的日誌(需要傳回到pyCharm IDE並顯示):

接著在pyCharm開啟工程,點選“Run Training Job”:

填寫引數,可以參考ModelArts訓練模型時填寫的引數:

訓練完成後,訓練模型儲存在OBS中 /工程名/output/V0006/。

自動學習

在典型的機器學習應用場景中,開發者還必須選擇合適的資料預處理工具,特徵提取和特徵選擇方法,從而使原始資料適合機器學習的輸入。 在經過這些預處理步驟之後,開發者通常需要根據經驗選擇恰當的模型演算法,以滿足當前的場景需求。同時在做模型訓練的時候,通常需要做大量的超引數優化,以獲得比較優異的的機器學習模型的預測效能。

比如說深度學習在語音識別,影象識別等領域已經取得了令人矚目的成就。AlexNet在2012年在ImageNet挑戰中打敗了所有其他傳統模型之後,越來越多更加複雜的網路結構被提出來了,網路的層數越來越深,目前的網路已經從最初AlexNet的5個卷積層,增長到目前的上百層,其中涉及到的引數也超過了1億個。而這些引數都是基於研究人員不斷的試錯以及調參經驗所確定的。而這些通過人工調參得到的模型通常只能針對某一類問題(比如說影象分類)有突出的效能,在遇到新的需要AI建模的問題的時候,通常需要重新構建AI模型,所以在構建AI模型的時候,研究人員需要花費大量的時間和計算資源。

為了降低模型構建的成本,提升AI建模的效率,研究人員提出了自動機器學習(AutoML)的概念,針對特定的機器學習任務,AutoML能夠端到端的完成資料處理,特徵提取,模型選擇以及模型評估。

談一個ModelArts的自動學習案例-心臟病預測。

我們已經瞭解了機器學習預測模型的實現原理,本文我們並不會自己動手從頭實現,因為當前預測演算法已經非常成熟,我們完全可以利用一些公有云大廠提供的自動學習技術,實現模型的快速訓練及預測。本案例我們採用的是華為雲的公有云AI平臺ModelArts,資料來源Kaggle網站。

Kaggle是一家線上AI競賽網站,開源提供了針對各個行業的脫敏資料,用於支援學生訓練對應的AI模型。

首先需要下載開源資料集,原始資料(已開源的脫敏資料)下載地址如下:

https://www.kaggle.com/johnsmith88/heart-disease-dataset

開啟csv檔案,你可以看到如下圖所示:

上圖中的資料集截圖中包括了14個欄位,對這14個欄位的含義做逐一解釋:

  1. Age:年齡;
  2. Sex:性別;
  3. chest pain type (4 values):胸部疼痛型別;
  4. resting blood pressure:靜息血壓;
  5. serum cholestoral in mg/dl:血漿膽固醇水平;
  6. fasting blood sugar > 120 mg/dl:空腹血糖>120 mg/dl;
  7. resting electrocardiographic results (values 0,1,2):靜息心電圖結果;
  8. maximum heart rate achieved:最大心率;
  9. exercise induced angina:與運動相關的心絞痛;
  10. oldpeak = ST depression induced by exercise relative to rest:與靜息時比較,運動導致的ST段下移;
  11. the slope of the peak exercise ST segment:心電圖ST segment的傾斜度;
  12. number of major vessels (0-3) colored by flourosopy:透視檢檢視到的血管數;
  13. thal: 1 = normal; 2 = fixed defect; 3 = reversable defect:檢測方式;
  14. target:0和1。

根據醫學雜誌上查到的資訊,一般認為,膽固醇介於200-300之間發病率高;心率異常易導致發病,最大心率在150到175間發病率高;最大心跳在150到175間發病率高;血壓在120到140時發病率高。

下載資料之後,我們接下來做的是上傳資料到華為雲。華為雲提供了OBS桶用於存放檔案,本文所涉及的csv檔案可以作為物件上傳。上傳檔案截圖如下圖所示:

注意,上傳檔案前請刪除表頭欄位名,否則訓練過程中會報錯。此外,資料集不用自己劃分為訓練集和測試集,AI平臺會自動按照7:3的比例進行切分。資料預覽如下圖所示:

接下來就可以進行模型訓練了。首先登陸網站https://console.huaweicloud.com/modelarts/,首頁如下圖所示:

有沒有看到螢幕中間的“自動學習”按鈕?後續我會寫一篇文章系統性介紹什麼是自動學習,這裡先略過。我們本案例要做的是預測,也就是“預測分析”按鈕,點選該按鈕。

點選“建立專案”按鈕:

接著選定資料集後,你會看到如下圖所示的步驟,分為資料標註、魔性訓練,以及部署上線。

點選訓練按鈕,開始模型訓練,由於是機器學習演算法,只需要採用CPU資源即可。

訓練任務完成後,你可以點選進去檢視模型的準確度預測(預設7:3比例已經預留了測試集,可以用來生成測試報告),如下圖所示:

AI市場

AI市場是一個面向一站式AI開發平臺,它提供AI數字資產(包括AI開發工作流和開箱即用的資料集、演算法、模型等)的託管式儲存倉庫。AI市場提供細粒度許可權控制的共享,使得個人或企業開發者,能夠以公開、私密的方式託管AI數字資產,從而促進開發人員、資料科學家和機器學習工程師使用相應數字資產進行協同工作。隨著AI市場測試版的不斷改進,後續將支援更多的用法和內容型別,從而進一步簡化 AI 的學習、實驗、開發和在生產環境中的部署與迭代。

AI市場售賣的由第三方釋出的人工智慧領域相關AI數字資產本質上屬於軟體服務,可分為演算法類和模型類兩種形態。演算法類軟體目前僅包含雲端演算法(Cloud Algorithm)。模型類的軟體進一步根據不同的支援平臺,又細分為雲端模型(Cloud Model)、慧眼技能(HiLens skill),以及HoloSens三種。

後記

ModelArts 是可以讓開發者上手更快、訓練更快、部署更快的全流程平臺。它可以為企業帶來更多價值:

1、資料標準與準備效率百倍提升

在資料標註與準備階段,調查發現:資料標註與準備非常耗時費力,約佔整體開發時間50%,所以有大家常說的“沒有人工就沒有智慧”。 ModelArts內建AI資料框架,以AI的機制來治理資料,用迭代訓練來解決標註的資料量問題。尤其適合資料量很大的場景,資料標註與準備效率百倍提升。

2、模型訓練耗時降一半

在模型訓練階段,針對模型訓練耗時長的挑戰,ModelArts通過各類優化技術,尤其,我們的級聯式混合並行技術,在同樣的模型、資料集和同等硬體資源情況下,模型訓練耗時降低一半。

3、模型一鍵部署到雲、邊、端

在模型部署階段,AI規模化落地,模型部署會非常複雜。例如智慧交通,就有一個常見場景:即更新後的模型,需要一次性同時部署到各種不同規格、不同廠商的攝像頭上,是一項非常耗時、費力的巨大工程。而ModelArts已實現一鍵推送模型到所有邊緣、端的裝置上,雲上的部署還支援 線上和批量推理,滿足大併發和分散式等多種場景需求。

4、用AI的機制加速AI開發過程,降低開發門檻

解決了標註、訓練、部署之後,ModelArts還能幫助開發者提升開發的效率。AI要規模化走進各行各業,必須要變成一種易掌握的基本技能。ModelArts的自動學習功能,包括模型的自動設計與自動調參等,目的是讓每個開發者,都可以快速上手。

ModelArts實現在AI開發全生命週期中,從原始資料、標註資料、訓練作業、演算法、模型、推理服務等,提供全流程視覺化管理。實現千萬級模型、資料集以及服務等物件的管理,無需人工干預,自動生成溯源圖,選擇任一模型,就可以找到對應的資料集、引數、模型部署在哪裡。尤其是訓練斷點接續和訓練結果比對,這些很實用的功能很受華為內部開發者歡迎。

5、ModelArts幫助開發者構建自己的生態

ModelArts為開發者提供了支援資料、模型和API的共享管理平臺。

對內,可以內部實現資料、模型的共享,幫助企業提升AI開發效率,構建企業自己的AI能力,同時全方位的保障企業AI資訊資產的安全。

對外,通過模型倉庫,實現開放、健康的生態,幫助AI開發者實現知識到價值的變現,幫開發者構建自己的影響力和生態。

正如本文開篇的引用,Sagemaker是我們強有力的友商AWS的產品,做得很不錯,我們始終要滿懷著尊敬之心,從友商身上學習精髓,我們始終要以客戶為中心,為他們提供各種各樣的服務,讓中國的使用者可以享受安全、可信的公有云服務,可以基於公有云服務享受AI帶來的紅利。

點選關注,第一時間瞭解華為雲新鮮技術~

相關推薦

眼中的華公有AI平臺--ModelArts

前言 AWS Sagemaker has been a great deal for most data scientists who would want to accomplish a truly end-to-end ML solution——by John Moolayil 這是資料科學線上網站“to

快取技術在華公有環境中的挑戰與應用

12月1日,ACMUG & CRUG 2018 技術沙龍全國巡演第十站在西安舉辦。華為雲中間件產品經理 Kevin 在會上帶來了《快取技術在華為公有云環境中的挑戰與應用》主題演講,為大家介紹和分享了華為雲分散式快取服務(Distributed Cache Service,簡稱DCS)的應用與挑戰。

中國公有三巨頭,同時支援Rancher Kubernetes平臺

Rancher正式宣佈擴大對中國領先Kubernetes服務的支援,華為雲容器引擎(CCE)、阿里雲Kubernetes容器服務(ACK)和騰訊雲Kubernetes引擎(TKE),中國公有云三巨頭正式全面支援Rancher Kubernetes平臺。  

資料哪存比較好?AI把使用者“逼上”公有

越來越多的AI應用發生在雲端,尤其是對於智慧技術需求高的行業而言,他們甚至可以說是被AI逼上公有云,而那些原本使用私有云的企業使用者,也由私有云躍遷到了公有云。 資料和算力是維持AI的兩大要素,而傳統的計算環境是難以滿足二者的指數級增長的。 如果在雲端藉助Hadoop叢集和Spark這樣的通

有一天他會腳踩公有、私有、混合雲來娶...

伴隨著雲端計算的到來,隨之產生了三種不同的雲概念名詞,公有云、私有云、混合雲。而關於三者之間到底誰才是未來雲端計算的最終形態論戰也從未休止,反而有愈演愈烈之勢,但是對於行業外的小白來說,這些耳熟能詳的概念還是相當晦澀難懂。那麼接下來跟著 阿里雲河南小編讀完下面這些生動形象的

什麽.Net平臺不支持程序集卸載(Assembly.Unload)?

處理 msdn 每一個 我們 加載 引用 neu 基於 why 我們知道在.net平臺中反射提供了在運行時動態的獲得程序或程序集中每一個類型(包括類、結構、委托、接口和枚舉等)的成員和成員的信息,從而使得我們開發人員在運行時能夠利用這些信息構造和使用對象。我們知道反射中可以

恩智浦IMX6開發板選哪家?迅imx6開發板平臺運行怎麽樣?

https tao androi 打開 加速度 觸控 平板電腦 需要 燒寫 iTOP-i.MX6 開發板預裝 Android4.4 系統,采用 9.7 寸(或者 7 寸或者 4.3 寸)IPS 屏 幕,至少 5 點以上觸控,操作流暢,無論是高清視頻、遊戲等都會有上佳的表現,

AI穿透萬物:華P20與AI攝影大師改變的遊戲規則

華為P20華為P20發布之後,第一個刷屏的事件,就是DxOMark居然被“屠榜”了。本來我們以為手機行業今年的任務是DxO達到100分,結果沒想到才開年不久相機評分就被華為P20 Pro刷到了114……當然,在刷榜的碾壓局背後其實有更多值得我們關註的東西。比如DxOMark在評測報告的結尾中是這樣寫的:“P2

在華公有雲服務器上搭建seafile個人網盤

華為雲 最近買了一臺華為ECS雲服務器,系統為centos7 64位,1核心1G內存,40G硬盤,1M帶寬,配置了雲監控,報警和基本DDos防禦。雖然配置不高,拿來學習是可以的。但是我想充分利用上雲服務器,所以想搭載一個個人網盤,保存個人資料。 開源而且免費的網盤,有seafile,服務器端有li

破電腦終於擺脫虛擬機了,雖然並不知道什麽

機器 ios bsp 描述 nbsp 若是 bios ddr3 找不到 機器配置 神舟k610d-i7 i7-4710mq ddr3 1600m 4g *2 sata3 硬盤 東芝 q200ex 240g ssd sata2 硬盤 東芝 500g 7200 2.5寸 GT8

雲有技術有未來是華雲核心合作夥伴

華為雲 服務器 雲存儲 在華為看來,保證用戶信息安全,是最重要的 針對用戶最在意的雲端數據安全問題,我們從帳號認證、數據傳輸、數據存儲三個環節九重防護來保證數據安全。在帳號認證方面,我們采用了更高級別的身份認證方案和加密算法;采用viriSign簽發的數字證書對通信實體進行驗證,采用TLS1.2協

公有雲linux服務器上ssh登錄的安全加固

進行 art 51cto stat 可能 密鑰登錄 lin sha table linux服務器主要是通過ssh進行登錄,但是在華為公有雲上,如何保證登錄安全性呢?本次以centos7為例,對ssh登錄進行安全加固 修改默認端口 在linux上,修改ssh登錄的默認端口,

裏K-Means算法

開始 接下來 它的 講解 .com 情況 一個點 size 算法 在我眼裏一切都是那麽簡單,復雜的我也看不懂,最討厭那些復雜的人際關系,唉,像孩子一樣交流不好嗎。 學習K-Means算法時,會讓我想起三國誌這個遊戲,界面是一張中國地圖,諸侯分立,各自為據。但是遊戲開始,玩家

java語言什麽具有平臺無性

under 機器 tro ++ bytecode 分配 固定 操作 驗證   首先解釋一下什麽叫做平臺無關性:平臺無關性即對每種數據類型在不同的操作系統中都分配固定長度,例如,int類型數據總是占據32個位(4個字節),而C/C++卻不然。   知道了平臺無關性後下面我們簡

人才生態數字化平臺 & 華雲微認證發布

職業 evc cer 覆蓋 技能 發展 ice 華為技術 中國 普及雲知識 構築雲人才生態——華為人才生態數字化平臺 & 華為雲微認證發布【 中國,上海,2018年10月12日】全球領先的信息與通信技術(ICT)解決方案供應商華為技術有限公司在上海舉辦的華為全聯接

二度雲擬推出公有可用性區域,保障使用者私密空間

 我們都知道,二度雲在彈性雲領域投入研發規模比較大的,並且雲服務的價效比很高的,二度雲正在為普通使用者提供雲服務可用性區域的一些服務。所謂的可用性區域也就是能夠幫助公有云使用者免受資料中心層次上故障的影響,從而能夠保證使用者擁有一個完整、可靠的公有云應用環境。 據瞭解,二度雲正在

OpenStack原理框架及在大型公有可用性分析

一、元件框架  OpenStack專案是一個開源的雲端計算平臺,旨在實現很簡單,大規模可伸縮,功能豐富。來自世界各地雲端計算開發人員和技術人員共同建立OpenStack專案。OpenStack通過一組相關的服務提供一個基礎設施即服務(IaaS)解決方案。每個服務提供了一個應用程式程

Gartner:以下5種情況公司應該選擇私有而不是公有

2015年2月6日,中國農曆除夕的前一天,當大多數中國人正在準備過年的時候,一則題為“這一天對雲端計算公司來說絕對是黑暗日”的報道在圈子內一石激起千層浪。文章大致的內容是前日,美股眾多雲計算相關的股票大跌和由此引發的對雲端計算前景的擔憂或討論。雲優先(cloud first)戰略是否繼續,主

公有說明書理解記錄(含學習記錄)

pdgw-說明書記錄: 記錄1: svn分支命名規範:cmshop_CMS_ECO:_CMS_ECO是固定的,前面是具體的專案 if少用else,可以使用return,邏輯清晰一些 常量類分包管理,service有一個常量,controller也有一個常量

人才生態數字化平臺 & 華雲微認證釋出

普及雲知識 構築雲人才生態——華為人才生態數字化平臺 & 華為雲微認證釋出【 中國,上海,2018年10月12日】全球領先的資訊與通訊技術(ICT)解決方案供應商華為技術有限公司在上海舉辦的華為全聯接大會上正式釋出華為人才生態數字化平臺 & 華為雲微認證。隨著ICT技術的發展,我們正步入一個萬