精選|2018年8月R新包推薦
作者:Joseph Rickert
翻譯:黃小偉,先後從事遊戲、社交及金融資料研究及應用,目前就職杭州有贊
8月份,共有160個R新包收錄於CRAN(7月份收錄R新包251個),增幅有所降低!本期選摘了其中40個R新包,針對其主要功能做簡單介紹,便於大家學習。包含七個類別:資料、機器學習、科學、統計學、時間序列、工具和視覺化.
一. 資料
1.nsapi: 提供Nederlandse Spoorwegen(荷蘭鐵路)API介面,允許使用者下載當前站點的出發時間、站點列表和從一個站點到另一個站點的旅行建議等資料.
2.repec: 支援通過RESTful API訪問RePEc(經濟學研究論文).
3.rfacebookstat: 實現了Facebook營銷API介面,允許使用者通過多種方式載入資料.
4.UCSCXenaTools:支援對UCSC Xena資料中心的資料訪問,它是UCSC託管的公共資料庫的集合.
5.ZipRadius: 當給定起始郵政編碼和半徑(單位:英里)時,在該資料框架下,可生成對應的美國郵政編碼及其到給定郵政編碼的距離.
二. 機器學習
1.dials: 提供用於建立無法從資料直接估計模型引數的工具.
2.tosca: 提供內容分析中的統計分析框架.
3.tsmap: 實現Matrix Profile概念以進行分類.
三. 科學
1.DSAIRM: 提供一組Shiny應用程式,實現動態系統模擬,探索宿主免疫反應.
2.epiflows: 提供用於處理、視覺化區域間流行病流動的功能和類別,以及用於預測疾病傳播的統計方法.
3.fieldRS: 利用Olofsson等人提出的最佳實踐,為遙感現場工作提供支援.
4.Rnmr1D : 提供從自由感應衰變的原始資料處理質子核磁共振譜的功能,參見Jacob et al. (2017) .
四. 統計學
1.bcaboot: 提供函式以一種幾乎自動的方式計算bootstrap置信區間.
2.bivariate : 提供用於構造、繪製雙變數概率分佈的便捷函式.
3.DesignLibrary: 提供一個簡單的介面來構建設計,允許使用者在一系列引數組合(如效果大小、樣本量和分配概率)之間比較給定設計的效能.
4.doremi: 支援利用微分方程和線性混合效應迴歸函式來估計方程的特徵引數.
5.eikosograms: eikosogram(來自古希臘εὶκὀσ的概率圖 )將單位正方形劃分為矩形區域,其區域、邊和寬度表示與一個或多個分類變數的值相關聯的各種概率.
6.localIV: 提供使用區域性工具變數估計邊際治療效果的函式,參見Heckman et al. (2006)、Zhou and Xie (2018) .
7.merlin: 根據Crowther(2017)開發的框架,提供適合線性、非線性和使用者自定義的混合效應迴歸模型的函式.
8.MRFcov: 提供估計馬爾可夫隨機場圖形網路的節點互動引數的函式.
9.SCPME: 提供函式,支援通過擴充套件ADMM演算法估計懲罰精度矩陣,如Molstad和Rothman(2018)所述.
10.survxai: 支援建立生存模型的統一表示,可以由各種生存直譯器進一步處理.
五. 時間序列
1.hpiR: 提供計算房價指數和序列的功能,並基於準確性、波動性和修正統計來評估指數的好壞.
2.STMotif: 提供函式來識別空間-時間序列中的基序(先前識別的子序列).
3.trawl : 提供模擬和估計Veraart(2018)中描述的整數值拖網過程的函式,以及模擬來自二元負二項和二元對數分佈的隨機向量.
六. 工具
1.arkdb: 提供將表從關係資料庫連線、匯出到壓縮文字檔案中的功能,並將這些文字檔案匯入資料庫,而無需將整個表放入工作記憶體中.
2.aws.kms: 實現AWS金鑰管理服務(用於管理加密金鑰的雲服務)的介面.
3.DatapackageR: 提供一個框架,支援以可重現的方式構造R資料包.
4.hedgehog: 允許使用者根據隨機生成的輸入測試其程式的屬性,與單元測試相比,提供了更優越的測試覆蓋率.
5.jsonstat: 實現JSON-stat的介面,JSON-stat是一種簡單、輕量級的“JSON”格式,用於資料傳播.
6.nseval: 提供用於惰性和非標準評估的API,該API具有捕獲、檢查、操作和建立惰性值、“…”列表和活動呼叫的功能.
7.runner: 提供具有不同視窗大小的執行函式(視窗化、滾動、累積)和R向量的缺少處理選項.
8.RTest: 提供基於XML的測試框架,用於為監管環境開發的R軟體包的自動化元件測試.
9.sparkbq: 通過提供與Google BigQuery的整合來擴充套件sparklyr.它支援從/向BigQuery直接匯入/匯出,及從Google雲端儲存中提取中間資料等功能.
10.vapour: 提供對地理空間資料抽象庫GDAL的低階訪問.
七. 視覺化
1.mapdeck: 提供使用Mapbox GL(用於互動式地圖的JavaScript庫)和Deck.gl(使用WebGL視覺化大型資料集的JavaScript庫)繪製互動式地圖的機制.
2.rayshader: 提供使用光線跟蹤、球面紋理對映、朗伯反射和環境遮擋的組合的函式,以生成高程矩陣的山體陰影,包括水檢測和分層功能、可程式設計調色盤生成、內建紋理、2D和3D繪圖選項等.
3.sigmajs: 提供sigma.js圖形視覺化庫的介面訪問.
4.survsup : 實現繪製生存曲線的函式.
5.tidybayes: 提供組合資料的功能,以整齊的資料格式從貝葉斯模型(JAGS、Stan、rstanarm、brms...)中提取、操作和視覺化.
說明:限於個人水平,錯誤之處難免,煩請批評指正,共同交流~
公眾號後臺回覆關鍵字即可學習
回覆 爬蟲 爬蟲三大案例實戰
回覆 Python1小時破冰入門回覆 資料探勘 R語言入門及資料探勘
回覆 人工智慧 三個月入門人工智慧
回覆 資料分析師 資料分析師成長之路
回覆 機器學習 機器學習的商業應用
回覆 資料科學 資料科學實戰
回覆 常用演算法 常用資料探勘演算法