1. 程式人生 > >【機器學習】 之 xgboost python ubuntu部署

【機器學習】 之 xgboost python ubuntu部署

安裝XGBoost-Python

pip install xgboost --index https://pypi.mirrors.ustc.edu.cn/simple/

安裝基本開發工具:

$ sudo apt install git build-essential python-dev python-setuptools python-pip python-numpy python-scipy

從Github下載最新原始碼:
1$git clone --recursive https://github.com/dmlc/xgboost

編譯:

1 2 $cdxgboost $
make-j4

生成的庫:lib/libxgboost.so、lib/libxgboost.a;命令列工具:xgboost。

安裝Python包:

1234$cd python-package/$sudo python setup.py install# 或# $ sudo python setup.py install --user

測試:

Ubuntu 安裝 XGBoost-Python和R

1 2 3 4 5 6 7 8 9 10 importxgboostasxgb # read in data dtrain=xgb.DMatrix('demo/data/agaricus.txt.train') dtest
=xgb.DMatrix('demo/data/agaricus.txt.test') # specify parameters via map param={'max_depth':2,'eta':1,'silent':1,'objective':'binary:logistic'} num_round=2 bst=xgb.train(param,dtrain,num_round) # make prediction preds=bst.predict(dtest)

安裝XGBoost-R

安裝XGBoost包:

12>install.packages('xgboost'
)>library(xgboost)

測試:

1 2 3 4 5 6 7 8 9 # load data data(agaricus.train,package='xgboost') data(agaricus.test,package='xgboost') train<-agaricus.train test<-agaricus.test # fit model bst<-xgboost(data=train$data,label=train$label,max.depth=2,eta=1,nround=2,nthread=2,objective="binary:logistic") # predict

相關推薦

機器學習 xgboost python ubuntu部署

安裝XGBoost-Python pip install xgboost --index https://pypi.mirrors.ustc.edu.cn/simple/ 安裝基本開發工具: $ sudo apt install git build-essential python-dev pyth

機器學習感知機Python程式碼實現

回顧 感知機 前面我們介紹了感知機,它是一個二分類的線性分類器,輸入為特徵向量,輸出為例項的類別。感知機演算法利用隨機梯度下降法對基於誤分類的損失函式進行最優化求解,得到感知機模型,即求解w,bw,b。感知機演算法簡單易於實現,那麼我們如何通過python程

機器學習數據預處理將類別數據轉換為數值

行數據 pri and slab form ces nbsp 遍歷 encode 在進行python數據分析的時候,首先要進行數據預處理。 有時候不得不處理一些非數值類別的數據,嗯, 今天要說的就是面對這些數據該如何處理。 目前了解到的大概有三種方法: 1,通過LabelE

機器學習Python 快速入門筆記

python 筆記 基礎 Python 快速入門筆記Xu An 2018-3-7 1、Python print#在Python3.X中使用print()進行輸出,而2.x中使用()會報錯 print("hello world") print('I\'m a

機器學習--機器學習樸素貝葉斯從初始到應用

rac AC 一個 pam 數據 ast 出現 相對 解決方法 一、前述 機器學習算法中,有種依據概率原則進行分類的樸素貝葉斯算法,正如氣象學家預測天氣一樣,樸素貝葉斯算法就是應用先前事件的有關數據來估計未來事件發生的概率。 二、具體 1、背景--貝葉斯定理引入對於兩個關聯

機器學習Weighted LSSVM原理與Python實現:LSSVM的稀疏化改進

【機器學習】Weighted LSSVM原理與Python實現:LSSVM的稀疏化改進 一、LSSVM 1、LSSVM用於迴歸 2、LSSVM模型的缺點 二、WLSSVM的數學原理 三、WLSSVM的python實現 參

機器學習最小二乘法支援向量機LSSVM的數學原理與Python實現

【機器學習】最小二乘法支援向量機LSSVM的數學原理與Python實現 一、LSSVM數學原理 1. 感知機 2. SVM 3. LSSVM 4. LSSVM與SVM的區別 二、LSSVM的py

機器學習Apriori演算法——原理及程式碼實現(Python版)

Apriopri演算法 Apriori演算法在資料探勘中應用較為廣泛,常用來挖掘屬性與結果之間的相關程度。對於這種尋找資料內部關聯關係的做法,我們稱之為:關聯分析或者關聯規則學習。而Apriori演算法就是其中非常著名的演算法之一。關聯分析,主要是通過演算法在大規模資料集中尋找頻繁項集和關聯規則。

機器學習特徵選擇最小冗餘最大相關性(mRMR)與隨機森林(RF)

特徵選擇之最小冗餘最大相關性(mRMR) 最小冗餘最大相關性(mRMR)是一種濾波式的特徵選擇方法,由Peng et.al提出。主要用途有機器學習,影象識別等。 一種常用的特徵選擇方法是最大化特徵與分類變數之間的相關度,就是選擇與分類變數擁有最高相關度的前k個變數。但是,在特徵選擇中,

機器學習使用Python中的區域性敏感雜湊(LSH)構建推薦引擎

學習如何使用LSH在Python中構建推薦引擎; 一種可以處理數十億行的演算法 你會學到: 在本教程結束時,讀者可以學習如何: 通過建立帶狀皰疹來檢查和準備LSH的資料 選擇LSH的引數 為LSH建立Minhash 使用LSH Query推薦會議論文 使用LSH

機器學習使用Python的自然語言工具包(NLTK)對Reddit新聞標題進行情感分析

讓我們使用Reddit API獲取新聞標題並執行情感分析 在我上一篇文章中,使用Python進行K-Means聚類,我們只是抓取了一些預編譯資料,但是對於這篇文章,我想更深入地瞭解一些實時資料。 使用Reddit API,我們可以從各種新聞subreddit獲得成千上萬的

機器學習資料分析王者 CatBoost vs. Light GBM vs. XGBoost

機器學習領域的一個特點就是日新月異,在資料競賽中,一件趁手的工具對比賽結果有重要影響。boosting是一種將弱分類器組合成強分類器的方法,它包含多種演算法,如GDBT、AdaBoost、XGBoost等等。如果你參加過Kaggle之類的資料競賽,你可能聽說過XGBoost在

機器學習機器學習特徵選擇

機器學習之特徵選擇 特徵選擇方法初識: 1、為什麼要做特徵選擇 在有限的樣本數目下,用大量的特徵來設計分類器計算開銷太大而且分類效能差。 2、特徵選擇的確切含義 將高維空間的樣本通過對映或者是變換的方式轉換到低維空間,達到降維的目的,然後通過特徵選取刪選掉冗餘和不相關的特徵來進一步降維。

機器學習XgBoost 原理詳解 數學推導

XgBoost   (Xtreme Gradient Boosting 極限 梯度 增強) 1.基本描述:             假設Xg-模型有 t 顆決策樹數,t棵樹有序串聯構成整個模型,各決策樹的葉子節點數為 k1,k2,...,kt,             

機器學習基於python對大資料量CSV進行操作

在我們日常學習之中,往往會遇到各種各樣的資料。但有時候其龐大的資料量,使得我們無法使用一般的辦公軟體進行操作,與此同時直接將所有資料取到記憶體之中,也有存在溢位的風險。所以,在這種情況下,採用逐行存取的方式對資料進行操作是十分必要的。本文簡單的使用python最為基礎的函式實

機器學習傳統目標檢測演算法級聯分類器Cascade

先附上參考文章吧。 文章其實是“P. Viola, M. Jones. Rapid Object Detection using a Boosted Cascade of Simple Features[J].CVPR, 2001”的學習筆記,下面第二個連結是文獻的中英文版

機器學習python第三方模組lda包呼叫程式碼

# coding=utf-8 # !/usr/bin/env python ''' 【資料來源樣例】 詞語1 詞語2 詞語3 詞語4 詞語5 詞語6 詞語7 詞語8 詞語9 詞語1 詞語2 詞語3 詞語4 詞語5 詞語1 詞語2 詞語3 詞語4 詞語5 詞語6 詞語7 ……

機器學習C++與OpenCV、Tensorflow-python聯合呼叫

  上一篇我介紹了C++呼叫Python的入門方法。這一篇我講述C++與OpenCV、Tensorflow-python聯合呼叫的一次成功的實驗過程。   C++通過python呼叫tensorflow,比呼叫C++版本的tensorflow的優勢在於:ten

機器學習5種距離度量方法詳解+Python實現([]+lambda+np.frompyfunc+向量法等多種方法實現)

介紹的五種距離度量方法是:歐氏距離(Euclidean Distance),曼哈頓距離(Manhattan Distance),夾角餘弦(Angle Cosine),切比雪夫距離(Chebyshev Distance),漢明距離(Hamming Distance)。1.歐式距

機器學習Python sklearn包的使用示例以及引數調優示例

# coding=utf-8 # !/usr/bin/env python ''''' 【說明】 1.當前sklearn版本0.18 2.sklearn自帶的鳶尾花資料集樣例: (1)樣本特徵矩陣(型別:numpy.ndarray) [[ 6.7 3. 5.2 2