R語言

用R介紹路徑分析

路徑分析是多元迴歸的擴充套件。 它幫助分析更復雜的模型。 想象一下,你要建立一個模型從汽車不同屬性來預測汽車行駛里程。 你會怎麼做? 最簡單的方法是採用一個對行駛里程影響最大的引數或屬性(選擇哪一個屬

用R語言實現資料離散化

R的極客理想系列文章,涵蓋了R的思想,使用,工具,創新等的一系列要點,以我個人的學習和體驗去詮釋R的強大。 R語言作為統計學一門語言,一直在小眾領域閃耀著光芒。直到大資料的爆發,R語言變成了一門炙手可熱

用R語言分析與預測員工離職

在實驗室搬磚之後,繼續我們的kaggle資料分析之旅,這次資料也是答主在kaggle上選擇的比較火的一份關於人力資源的資料集,關注點在於員工離職的分析和預測,依然還是從資料讀取,資料預處理,EDA和機器學習建模

R Style(R 程式碼規範)

最近看到有朋友說起R程式碼書寫規範的問題,突然讓我意識到,從學R語言開始,似乎沒怎麼在書上提起過R程式碼風格。之前在學習Perl的時候,Perl語言入門這本書從最開始就提到了Perl程式碼的書寫風格,但其實Pe

EasyOCR 1.2.0 新增 MNIST 資料集圖片和寬幅數字識別

本軟體是一個手寫體數字識別軟體,採用BP神經網路,基於colt數學庫,有完整原始碼,可以儲存訓練結果,基於開源例程neuralnetwork-sample,原作可以在GitHub中找到。主要改進了訓練結果儲存,並新增

R Tip:資料集劃分為訓練集和測試集?

問題背景:我們構建資料模型的時候,需要把資料集劃分為訓練集和測試集,訓練集用來訓練模型,測試集用來測試模型的泛化能力。本文總結R語言如何把資料集劃分為訓練集和測試集? 解決方案 結合實際工作,羅列4中解

R語言-Cox Model Assumptions

這篇筆記連標題都懶得想了(照搬教程標題。。。),繼續接上篇 R語言-Cox比例風險模型 和上上篇 Survival analysis(生存分析) 先把我學習的教程放在最上面 Cox Model Ass

R實戰 第十篇:列聯表和頻數表

列聯表是觀測資料按兩個或更多屬性(定性變數)分類時所列出的頻數分佈表,它是由兩個以上的變數進行交叉分類的頻數分佈表。互動分類的目的是將兩變數分組,然後比較各組的分佈狀況,以尋找變數間的關係。 按兩個變數交叉

1746014861.9172