1. 程式人生 > >應用統計學與R語言實現學習筆記後記

應用統計學與R語言實現學習筆記後記

1 後記

應用統計學與R語言實現學習筆記這一系列部落格斷斷續續寫了5個月左右。現在終於算是基本完成了。我個人比較強迫症,比較喜歡一個系列更完再更其他的。所以中間有一些不錯的內容想寫到部落格裡都沒動筆。後面會繼續填坑。另外之後遇到的跟應用統計學與R語言實現相關的內容會以番外篇形式釋出。

當時想到寫這個東西,主要是自己選了門應用統計學的公選課,個人覺得不能浪費了這門課,而且其實我們在做一些研究的時候,其實都用了很多新的、高大上的所謂的新方法,並且不斷在追逐所謂的Big data,但是回過頭來想想,最基礎的統計學理論可能才是我們需要補課的地方(不得不說這門課挺對我胃口,去年暑假花了一部分時間在啃賈俊平的統計學,剛好是這門課的參考教材)。這個年代,用個tensorflow的包,import一下,訓練個模型出來就能說自己做的是深度學習。個人意見,也對也不對。IT技術飛速發展,大大降低了程式猿的門檻,但是現在的情況更應當說是程式猿的行當易學難精了。扯得有點遠,總之我認為返璞歸真地去學一學高數、概率論、統計學、線性代數可能比一上來就開始各種機器學習什麼的要強得多。

這份筆記的定位,就是一份筆記,某些程度上就是課程老師給我們的ppt,我對理論部分做了整理。所以要歸功於我的任課老師王老師。我不求大家從頭到尾看完這份筆記,因為理論很枯燥,但是當需要用些什麼內容的時候,可以想起這份筆記,供大家查詢和參考。我的筆記並不像《深入淺出統計學》那樣直白而又易懂的語言,儘管中間有一定的嘗試,所以不可能看完我的這個系列部落格就能對統計學的基本內容完全融會貫通,如果你希望在統計學上有所建樹,需要大家自己去補課。另外我這部分更多針對於應用,而且基於我自己本身地學背景,我講的例子也都跟儘量跟地學、生態相關。所以其他專業的同學會覺得一些例子苦澀難懂是比較正常的(在此向其他專業同學說聲不好意思,你們的批評我虛心接受,但是你們這方面的建議我堅決不改,傲嬌臉)。

好,講了這麼多。這個系列我其實是作為我自己的一個開源專案做的,我希望大家有什麼意見可以一起來幫忙修改完善這個專案。如果你覺得還不錯,也不要吝嗇你的star。我部落格裡提到的很多程式碼之類的也都在這個專案裡面開源了。就請大家批評指正。

2 基於gitbook的電子書生成教程

Modern book format and toolchain using Git and Markdown

這是 gitbook 專案主頁上對 gitbook 的定義。
gitbook 首先是一個軟體,正如上面定義的那樣,它使用 Git 和 Markdown 來編排書本。

也可以使用gitbook editor。
gitbook可以與github關聯,直接將倉庫的markdown文件釋出成電子書。為了方便管理,選擇在github上搭建電子書整體內容,然後push到github上,同時同步到gitbook中。首先用github登入gitbook。接著在github上建立一個新的倉庫。只保留markdown文件和資料夾。gitbook的關鍵是需要SUMMARY的markdown文件,這個檔案是用來組織書的框架。如下圖。

README的前言其實就是上面的後記,想說的話大體相同。只不過時間先後問題導致成了前言和後記。其他的是連結各章節。
接著看一下github上倉庫專案結構(初步構成)。

因為線上渲染電子書速度較慢,我們可以在本地進行渲染和修改。目前只需將倉庫先克隆到本地。接著安裝gitbook(基於node.js)。
因為gitbook是基於node.js的,先檢視是否安裝了node.js。

node -v
npm -v

接著輸入命令,安裝gitbook。

npm install gitbook-cli -g

接下來在github上先安裝gitbook的拓展應用。並選擇應用的倉庫範圍(可以選擇所有倉庫,也可以只選擇對應的倉庫)

這樣在gitbook上建立新書的時候,可以選擇github的模板,直接匯入書籍的倉庫,並且後面可以自動同步。

在gitbook的setting中設定,預設生成pdf,mobi,epub的電子書供下載,選擇MIT許可證。

gitbook可以通過book.json這個檔案來控制生成電子書的一些具體定製化的需求。我的設定如下,因為用到了流程圖和大量數學公式,就多加了katex和mermaid的外掛。

首先通過命令列,定位到克隆到本地書籍的路徑。

gitbook install

先安裝外掛。
接著渲染一下。

gitbook build

最後本地伺服器執行。

gitbook serve

在瀏覽器網址輸入localhost:4000。
即可檢視。

執行gitbook build的時候可能會有各種報錯,根據報錯資訊一個一個修改。目前發現似乎gitbook不太支援mathjax。而且公式裡面不能有中文及中文標點符號,而且原來在部落格上,兩個是表示獨立的公式,必須另起一行。但是katex只認四個$。所以進行了一番較多修改,流程圖目前也一直無法顯示。mermaid跟我部落格的流程圖外掛也不相同。我用的是flowchart,但是安裝了似乎也不顯示。最後就先用截圖來表示了。
全部搞定後直接push到github上。

發現gitbook上沒有完全同步。可以從setting裡面設定。

OK,大工告成,接下來只需等它線上渲染成功就可以了。
PDF版本。

每每看到封面的熊本分分鐘齣戲。。。

有興趣的同學可以下載這本電子書,也可以在評論留郵箱,可以傳送給大家。

參考部落格: