1. 程式人生 > >精選|2018年8月R新包推薦

精選|2018年8月R新包推薦

作者:Joseph Rickert

翻譯:黃小偉,先後從事遊戲、社交及金融資料研究及應用,目前就職杭州有贊

8月份,共有160個R新包收錄於CRAN(7月份收錄R新包251個),增幅有所降低!本期選摘了其中40個R新包,針對其主要功能做簡單介紹,便於大家學習。包含七個類別:資料、機器學習、科學、統計學、時間序列、工具和視覺化.

一. 資料

1.nsapi: 提供Nederlandse Spoorwegen(荷蘭鐵路)API介面,允許使用者下載當前站點的出發時間、站點列表和從一個站點到另一個站點的旅行建議等資料.

2.repec: 支援通過RESTful API訪問RePEc(經濟學研究論文).

3.rfacebookstat: 實現了Facebook營銷API介面,允許使用者通過多種方式載入資料.

4.UCSCXenaTools:支援對UCSC Xena資料中心的資料訪問,它是UCSC託管的公共資料庫的集合.

5.ZipRadius: 當給定起始郵政編碼和半徑(單位:英里)時,在該資料框架下,可生成對應的美國郵政編碼及其到給定郵政編碼的距離.

640?wx_fmt=png

二. 機器學習

1.dials: 提供用於建立無法從資料直接估計模型引數的工具.

2.tosca: 提供內容分析中的統計分析框架.

640?wx_fmt=jpeg

3.tsmap: 實現Matrix Profile概念以進行分類.

640?wx_fmt=png

三. 科學

1.DSAIRM: 提供一組Shiny應用程式,實現動態系統模擬,探索宿主免疫反應.

2.epiflows: 提供用於處理、視覺化區域間流行病流動的功能和類別,以及用於預測疾病傳播的統計方法.

640?wx_fmt=png

3.fieldRS: 利用Olofsson等人提出的最佳實踐,為遙感現場工作提供支援.

640?wx_fmt=png

4.Rnmr1D : 提供從自由感應衰變的原始資料處理質子核磁共振譜的功能,參見Jacob et al. (2017) .

640?wx_fmt=png

四. 統計學

1.bcaboot: 提供函式以一種幾乎自動的方式計算bootstrap置信區間.

640?wx_fmt=png

2.bivariate : 提供用於構造、繪製雙變數概率分佈的便捷函式.

640?wx_fmt=jpeg

3.DesignLibrary: 提供一個簡單的介面來構建設計,允許使用者在一系列引數組合(如效果大小、樣本量和分配概率)之間比較給定設計的效能.

4.doremi: 支援利用微分方程和線性混合效應迴歸函式來估計方程的特徵引數.

640?wx_fmt=png

5.eikosograms: eikosogram(來自古希臘εὶκὀσ的概率圖 )將單位正方形劃分為矩形區域,其區域、邊和寬度表示與一個或多個分類變數的值相關聯的各種概率. 

640?wx_fmt=png

6.localIV: 提供使用區域性工具變數估計邊際治療效果的函式,參見Heckman et al. (2006)Zhou and Xie (2018) .

7.merlin: 根據Crowther(2017)開發的框架,提供適合線性、非線性和使用者自定義的混合效應迴歸模型的函式.

8.MRFcov: 提供估計馬爾可夫隨機場圖形網路的節點互動引數的函式.

9.SCPME: 提供函式,支援通過擴充套件ADMM演算法估計懲罰精度矩陣,如Molstad和Rothman(2018)所述.

640?wx_fmt=png

10.survxai: 支援建立生存模型的統一表示,可以由各種生存直譯器進一步處理.

640?wx_fmt=png

五. 時間序列

1.hpiR: 提供計算房價指數和序列的功能,並基於準確性、波動性和修正統計來評估指數的好壞.

640?wx_fmt=png

2.STMotif: 提供函式來識別空間-時間序列中的基序(先前識別的子序列).

640?wx_fmt=png

3.trawl : 提供模擬和估計Veraart(2018)中描述的整數值拖網過程的函式,以及模擬來自二元負二項和二元對數分佈的隨機向量.

六. 工具

1.arkdb: 提供將表從關係資料庫連線、匯出到壓縮文字檔案中的功能,並將這些文字檔案匯入資料庫,而無需將整個表放入工作記憶體中.

2.aws.kms: 實現AWS金鑰管理服務(用於管理加密金鑰的雲服務)的介面.

3.DatapackageR: 提供一個框架,支援以可重現的方式構造R資料包.

4.hedgehog: 允許使用者根據隨機生成的輸入測試其程式的屬性,與單元測試相比,提供了更優越的測試覆蓋率.

5.jsonstat: 實現JSON-stat的介面,JSON-stat是一種簡單、輕量級的“JSON”格式,用於資料傳播.

6.nseval: 提供用於惰性和非標準評估的API,該API具有捕獲、檢查、操作和建立惰性值、“…”列表和活動呼叫的功能.

7.runner: 提供具有不同視窗大小的執行函式(視窗化、滾動、累積)和R向量的缺少處理選項.

8.RTest: 提供基於XML的測試框架,用於為監管環境開發的R軟體包的自動化元件測試.

9.sparkbq: 通過提供與Google BigQuery的整合來擴充套件sparklyr.它支援從/向BigQuery直接匯入/匯出,及從Google雲端儲存中提取中間資料等功能.

10.vapour: 提供對地理空間資料抽象庫GDAL的低階訪問.

七. 視覺化

1.mapdeck: 提供使用Mapbox GL(用於互動式地圖的JavaScript庫)和Deck.gl(使用WebGL視覺化大型資料集的JavaScript庫)繪製互動式地圖的機制.

640?wx_fmt=gif

2.rayshader: 提供使用光線跟蹤、球面紋理對映、朗伯反射和環境遮擋的組合的函式,以生成高程矩陣的山體陰影,包括水檢測和分層功能、可程式設計調色盤生成、內建紋理、2D和3D繪圖選項等.

640?wx_fmt=gif

3.sigmajs: 提供sigma.js圖形視覺化庫的介面訪問.

640?wx_fmt=png

4.survsup : 實現繪製生存曲線的函式.

640?wx_fmt=png

5.tidybayes: 提供組合資料的功能,以整齊的資料格式從貝葉斯模型(JAGS、Stan、rstanarm、brms...)中提取、操作和視覺化.

640?wx_fmt=png

說明:限於個人水平,錯誤之處難免,煩請批評指正,共同交流~

公眾號後臺回覆關鍵字即可學習

回覆 爬蟲            爬蟲三大案例實戰  
回覆 
Python1小時破冰入門

回覆 資料探勘     R語言入門及資料探勘
回覆 
人工智慧     三個月入門人工智慧
回覆 資料分析師  資料分析師成長之路 
回覆 機器學習      機器學習的商業應用
回覆 資料科學      資料科學實戰
回覆 常用演算法      常用資料探勘演算法