1. 程式人生 > >阿里雲機器學習平臺PAI使用簡明教程

阿里雲機器學習平臺PAI使用簡明教程

概述

阿里雲機器學習平臺是構建在阿里雲MaxCompute(原ODPS)計算平臺之上,集資料處理、建模、離線預測、線上預測為一體的機器學習平臺。很多使用者在初次使用PAI過程中因為對平臺比較陌生,總是會遇到這樣或那樣的困惑。本文以通用的機器學習流程為指導,結合PAI平臺逐一介紹資料準備、模型搭建與訓練、模型部署與呼叫,將目前PAI平臺的主要操作流程做一個梳理。

本文的主要目的是做PAI平臺使用流程的演示,所以演算法上選擇最簡單的線性迴歸演算法,便於使用者的理解和操作。


操作

資料準備


1、DataStudio中建立資料表

_

  • SQL指令碼
CREATE TABLE `lm_test_input` (
    `value` bigint,
    `output1` bigint
) ;

2、資料匯入

目前支援多種方式將資料匯入到表,如果是大資料量匯入,請使用tunnel客戶端工具匯入資料到表中。本示例使用的資料量較少,直接通過SQL指令碼的方式匯入資料。

  • SQL指令碼
INSERT into table lm_test_input values (1,2);

INSERT into table lm_test_input values (2,4);

INSERT into table lm_test_input values (3,6);

INSERT into table lm_test_input values (4,8);

INSERT into table lm_test_input values (5,10);

select * from lm_test_input; --檢視匯入的資料

3、資料表
_


模型搭建與訓練


1、新建空表實驗

_

2、拖入元件“源/目標的”讀資料表模組,配置:
_

3、拖入元件“工具”SQL指令碼模組,用於讀入資料:
_

4、拖入元件“資料預處理”拆分模組,用於將原資料集拆分為訓練集和測試集:
_

5、拖入元件“機器學習”線性迴歸模組,分別指定特徵及標籤,用於訓練模型:
_

6、拖入元件“機器學習”預測模組,用於預測測試集的情況:
_

7、整個流程:
_

8、點選執行按鈕執行整個模型,當然也可以點選到具體的模組選擇執行到此處,還可以分別查詢各個模組的執行結果:

_

9、執行的結果:

_


模型的部署與呼叫

機器學習模型線上部署功能可以將您的模型一鍵部署為Restful API,您可以通過HTTP請求的方式進行呼叫。

1、部署模型

注意: 模型正常執行後才能部署,並不是搭建的實驗都能生成模型,普通的數值處理不能生成模型,常見的可以生成模型演算法包括:GBDT二分類、線性支援向量機、邏輯迴歸二分類、邏輯迴歸多分類、隨機森林、KMeans、線性迴歸、GBDT迴歸(GBDT迴歸演算法不支援int型資料格式輸入,所以在部署前請注意GBDT演算法輸入應為Double型)、Tensorflow等。

_

2、Rest呼叫的引數
_

3、線上除錯

_

4、程式呼叫(value:100)

例項Demo下載地址

_

5、監控

_

6、目前直接測試API功能預設分配的是二級域名,二級域名僅供測試使用,有每天1000次的訪問限制。如果您有更大需求,請在分組管理介面單擊繫結域名,對該API所在的分組進行域名繫結。具體參考模型線上部署使用說明


更多參考

什麼是阿里雲機器學習

機器學習