1. 程式人生 > >關於LDA學習的一些有用的部落格以及大牛寫的程式碼實現

關於LDA學習的一些有用的部落格以及大牛寫的程式碼實現

1、Blei的LDA程式碼(C):http://www.cs.princeton.edu/~blei/lda-c/index.html
2、D.Bei的主頁:http://www.cs.princeton.edu/~blei/publications.html
3、Gibbs LDA++  by Xuan-Hieu Phan and Cam-Tu Nguyen(C++):http://gibbslda.sourceforge.net/
4、用GibbsLDA做Topic Modeling (教程 by Lu Heng):http://weblab.com.cityu.edu.hk/blog/luheng/2011/06/
5、Daichi Mochihashi(C,Matlab) :http://chasen.org/~daiti-m/dist/lda/
6、Griffiths和Steyvers的Topic Modeling工具箱:http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm
7.shuyo的LDA(python):https://shuyo.wordpress.com/2011/05/18/latent-dirichlet-allocation-in-python/
8.python庫(lda 1.0.2):https://pypi.python.org/pypi/lda
9.影象主題方面的LDA實現(python):http://www.mblondel.org/journal/2010/08/21/latent-dirichlet-allocation-in-python/
10、一些部落格:
(1)【轉】LDA必讀的資料 http://www.xperseverance.net/blogs/2012/03/657/
(2)我愛機器學習小站裡面LDA部分:http://www.52ml.net/tags/lda/page/7
(3)基於LDA的Topic Model變形 http://www.cnblogs.com/wentingtu/archive/2013/06/02/3113422.html
(4)Topic modeling LDA by Blei(對Blei關於LDA的一些文章的評論)http://blog.csdn.net/pirage/article/details/8889951
(5)Latent dirichlet allocation note(裡面有對Daichi Mochihashi寫的LDA程式碼應用的教程)http://blog.csdn.net/wangran51/article/details/7408399

(6)Blei教學LDA視訊:http://videolectures.net/mlss09uk_blei_tm/

1.MALLET:實現語言,Java,實現模型,LDA,HLDA,Pachinko Allocation Model,此外,還實現了HMM,最大熵馬爾科夫模型和條件隨機場;
2.Shuyo的github程式碼:實現語言,Python,實現模型,LDA,Dirichlet Process Gaussian Mixture Model,online HDP,HDPLDA,Interactive Topic Model,Labeled LDA
地址:https://github.com/shuyo/iir/tree/master/lda
3.arongdari的github程式碼:實現語言,Python,實現模型,LDA,Correlated Topic Model,Relational topic model,Author-Topic model,HMM-LDA,Discrete Infinite logistic normal,Supervised Topic Model,Hierarchical Dirichlet process,Hierarchical Dirichlet scaling process
地址:https://github.com/arongdari/python-topic-model
4.Gensim:實現語言,Python,實現模型,LDA,Dynamic Topic Model,Dynamic Influence Model,HDP,LSI,Random Projections,深度學習的word2vec,paragraph2vec。
官網地址:http://radimrehurek.com/gensim/index.html
github程式碼地址:https://github.com/piskvorky/gensim
5.ahmaurya的github程式碼:實現語言,Python,實現模型,Topic Over Time
github程式碼地址:https://github.com/ahmaurya/topics_over_time
6.Blei實驗室的程式碼:實現語言,Python,實現模型,online lda,online HDP,turbo topic model,topic model visualization engine,實現語言,C,實現模型,correlated topic model,discrete infinite logistic normal,HLDA,lda,實現語言C++,實現模型,ctr,class-slda,Dynamic Topic model and the influence model,實現語言R,實現模型 lda
github程式碼地址:http://www.cs.columbia.edu/~blei/topicmodeling_software.html
7.中國科學技術資訊研究所徐碩老師的PDF,對LDA,TOT,AT模型如何使用gibbs sampling求參進行了細緻推導,並依據求參結果給出虛擬碼。
地址:http://blog.sciencenet.cn/blog-611051-582492.html

LDA和HLDA:
(1)D. M. Blei, et al., "Latent Dirichlet allocation," Journal of Machine Learning Research, vol. 3, pp. 993-1022, 2003.
(2)T. L. Griffiths and M. Steyvers, "Finding scientific topics," Proceedings of the National Academy of Sciences, vol. 101, pp. 5228-5235, 2004.
(3)D. M. Blei, et al., "Hierarchical Topic Models and the Nested Chinese Restaurant Process," NIPS, 2003.
(4)Blei的LDA視訊教程:http://videolectures.net/mlss09uk_blei_tm/  
(5)Teh的關於Dirichlet Processes的視訊教程:http://videolectures.net/mlss07_teh_dp/
(6)Blei的畢業論文:http://www.cs.princeton.edu/~blei/papers/Blei2004.pdf
(7)Jordan的報告:http://www.icms.org.uk/downloads/mixtures/jordan_talk.pdf
(8)G. Heinrich, "Parameter Estimation for Text Analysis," http://www.arbylon.net/publications/text-est.pdf
基礎知識:
(1)P. Johnson and M. Beverlin, “Beta Distribution,” http://pj.freefaculty.org/ps707/Distributions/Beta.pdf
(2)M. Beverlin and P. Johnson, “The Dirichlet Family,” http://pj.freefaculty.org/stat/Distributions/Dirichlet.pdf
(3)P. Johnson, “Conjugate Prior and Mixture Distributions”,http://pj.freefaculty.org/stat/TimeSeries/ConjugateDistributions.pdf
(4)P.J. Green, “Colouring and Breaking Sticks:Random Distributions and Heterogeneous Clustering”,http://www.maths.bris.ac.uk/~mapjg/papers/GreenCDP.pdf
(5)Y. W. Teh, "Dirichlet Process", http://www.gatsby.ucl.ac.uk/~ywteh/research/npbayes/dp.pdf
(6)Y. W. Teh and M. I. Jordan, "Hierarchical Bayesian Nonparametric Models with Applications,”
http://www.stat.berkeley.edu/tech-reports/770.pdf
(7)T. P. Minka, "Estimating a Dirichlet Distribution", http://research.microsoft.com/en-us/um/people/minka/papers/dirichlet/minka-dirichlet.pdf
(8)北郵論壇的LDA導讀:[導讀]文字處理、影象標註中的一篇重要論文Latent Dirichlet Allocation,http://bbs.byr.edu.cn/article/PR_AI/2530?p=1
(9)Zhou Li的LDA Note:http://lsa-lda.googlecode.com/files/Latent Dirichlet Allocation note.pdf
(10)C. M. Bishop, “Pattern Recognition And Machine Learning,” Springer, 2006.
程式碼:
(1)Blei的LDA程式碼(C):http://www.cs.princeton.edu/~blei/lda-c/index.html
(2)BLei的HLDA程式碼(C):http://www.cs.princeton.edu/~blei/downloads/hlda-c.tgz
(3)Gibbs LDA(C++):http://gibbslda.sourceforge.net/
(4)Delta LDA(Python):http://pages.cs.wisc.edu/~andrzeje/research/deltaLDA.tgz
(5)Griffiths和Steyvers的Topic Modeling工具箱:http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm
(6)LDA(Java):http://www.arbylon.net/projects/
(7)Mochihashi的LDA(C,Matlab):http://chasen.org/~daiti-m/dist/lda/
(8)Chua的LDA(C#):http://www.mysmu.edu/phdis2009/freddy.chua.2009/programs/lda.zip
(9)Chua的HLDA(C#):http://www.mysmu.edu/phdis2009/freddy.chua.2009/programs/hlda.zip
其他:
(1)S. Geman and D. Geman, "Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images," Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. PAMI-6, pp. 721-741, 1984.
(2)B. C. Russell, et al., "Using Multiple Segmentations to Discover Objects and their Extent in Image Collections," in Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on, 2006, pp. 1605-1614.
(3)J. Sivic, et al., "Discovering objects and their location in images," in Computer Vision, 2005. ICCV 2005. Tenth IEEE International Conference on, 2005, pp. 370-377 Vol. 1.
(4)F. C. T. Chua, "Summarizing Amazon Reviews using Hierarchical Clustering,"http://www.mysmu.edu/phdis2009/freddy.chua.2009/papers/amazon.pdf
(5)F. C. T. Chua, "Dimensionality Reduction and Clustering of Text Documents,”http://www.mysmu.edu/phdis2009/freddy.chua.2009/papers/probabilisticIR.pdf
(6)D Bacciu, "Probabilistic Generative Models for Machine Vision,"http://www.math.unipd.it/~sperduti/AI09/bacciu_unipd_handouts.pdf

相關推薦

關於LDA學習一些有用部落以及程式碼實現

1、Blei的LDA程式碼(C):http://www.cs.princeton.edu/~blei/lda-c/index.html 2、D.Bei的主頁:http://www.cs.princeton.edu/~blei/publications.html 3、Gibb

Elasticsearch學習有用部落

推薦閱讀:1、阿里:https://elasticsearch.cn/article/61712、滴滴:http://t.cn/EUNLkNU3、騰訊:http://t.cn/E4y9ylL4、攜程:https://elasticsearch.cn/article/62055、社群:https://elast

團隊部落豬蹄子隊)第二週

隊名 大豬蹄子隊 隊員學號 鄧宇 3116004682 劉豐璨 3115005153 侯國鑫 3116004684 王翠鸞 3216004715 謝雅淇 3216004716 袁杏儀 3216004717 組長:劉豐璨 團隊隨筆集合 因為部落格園的 markdown

團隊部落豬蹄子隊)第五週

有道雲地址:http://note.youdao.com/noteshare?id=b16ed6e0df3bb7171047d6954e4bce9b&sub=B790F32C610A4C7B82F7692B74439B7C Alpha 版本測試報告 1、測試找出的 BUG BUG 清單:

Atitit 學習一項技術的方法總結 目錄 1. 自己動手實現學習法 1 2. 七步學習法 —— 如何高效學習一項技能 1 3. 如何快速學習一項技能-十步學習法 - HugoLester - 部落

Atitit 學習一項技術的方法總結   目錄 1. 自己動手實現學習法 1 2. 七步學習法 —— 如何高效學習一項技能 1 3. 如何快速學習一項技能-十步學習法 - HugoLester - 部落格園.html 2    

0學習中的部落

做了餐廳網站的一點記錄 (終於可以不再面向w3c寫HTML+CSS) 理解了div的用法並且較為熟練的使用了div 糾正了之前對HTML以及CSS的部分錯誤認識 意識到div真的是個好東西只要引數和命令給夠div可以變成任何東西 終於把HTML和CSS放在兩個檔案裡了,提升了檔案整齊

從零開始,搭建部落系統MVC5+EF6搭建框架(4)下,前後檯布局實現、釋出部落以及展示。

1 @{ 2 string url = Request.Url.ToString().ToLower(); 3 } 4 @if (url.Contains("home")) 5 { 6 <aside class="col-sm-3 col-m

Lottie動畫學習一 —— 入門部落介紹

Lottie是什麼? 今天接手一個新專案的時候發現以前的同事引入了Lottie庫,因為之前沒有接觸過後來百度了一下發現原來這個庫主要是用來實現一些比較複雜的動畫的。下面是官方的介紹,Lottie是Airbnb開源的一個支援Android、ios以及ReactN

部落開發總結之後臺程式碼

寫這個部落格專案也是我第一次使用Spring Boot框架,用過之後,發現真的回不去了。省去了一大堆配置檔案,簡直不能再爽。之前用Spring MVC,Spring,Hibernate,MyBatis等框架,繁瑣的配置檔案,每一個專案都是那一套,感覺不是在學框架內容,而是在學寫配置檔案。Spring

之前的部落雖然是自己的,但是也得經常回顧啊。

之前的部落格雖然是自己寫的,但是也得經常回顧啊。 剛才用到執行緒鎖,但是又不敢確定用什麼最好了。之前學習過,但使用不多,不夠深刻,也沒有很理解,有點遺忘了。 ReentrantLock 和Synchronized都是可重入鎖,即本執行緒擁有鎖以後可以再次執行進入鎖所相關的程式碼而不會阻塞,只是count+

分享部落的動態執行天數程式碼

今天偶然看到別人部落格中可以顯示部落格的執行時間 於是自己也想做一個,就找了一下方法,最後找到一個比較方便的,就是貼程式碼,一開始還擔心沒有用,結果很完美 程式碼如下: 1 <script> 2 function secondToDate(second) { 3

Python的爬蟲學習路線,分享給大家!

第一步,學會自己安裝python、庫和你的編輯器並設定好它 我們學習python的最終目的是要用它來達到我們的目的,它本身是作為工具的存在,我們一定要掌握自己的工具的各類設定,比如安裝、環境配置、庫的安裝,編輯器的設定等等。 當然也可以用比如Anaconda來管理你的版本

用 Flask 來個輕部落 (26) — 使用 Flask-Celery-Helper 實現非同步任務

目錄 前文列表 擴充套件閱讀 Celery Celery 是使用 Python 多工庫來編寫的任務佇列工具, 可以 並行 的執行任務. 我們會將執行時間較長但又不那

如何高效的編寫與同步部落 (.NET Core 小工具實現

系列目錄 一.前言 寫部落格,可以帶給我們很多好處,比如可以讓我們結識更多志同道合的人;在寫部落格過程中去查技術資料或者實踐可以讓我們對知識的掌握和理解更加深刻;通過部落格分享能幫助他人收穫分享的快樂等等。寫部落格真的是一件十分有益的事情,在此我帶給大家一種高效的編寫以及同步部落格的方式,這也是我目前在用的

Ghost 開源部落使用七、又拍雲、阿里雲OSS雲儲存

該文章介紹的是GHOST部落格的圖片儲存,並不是CDN加速哦! 為什麼要用雲儲存? 1、ghost原本圖片上傳,圖片是儲存在ghost/content/images目錄下面的,也就是說圖片儲存在自己伺服器上面的,萬一服務重灌系統咋辦?萬一不小心刪掉咋辦?是不是就完蛋了!

Node部落--內容評論和分頁實現

1.首先在view.html中增加評論區域 2.使用ajax方法,把評論提交上去,在api.js中寫入 var Content=require('../models/Content');//引入內容 //評論提交 router.post('/comment/pos

關於部落系統使用者關注功能的實現

關注功能作為部落格的一個組成模組,在實現的時候碰到點麻煩。最開始的設想是在資料庫文章的表格中加入分類id(type_id),使用者表格中加入關注的種類id,新建一個種類表,通過多表查詢實現輸出使用者關

初次部落,一堆爛程式碼奉上

*原題:https://leetcode-cn.com/problems/permutation-sequence/description/ 給出集合 [1,2,3,…,n],其所有元素共有 n! 種排列。 按大小順序列出所有排列情況,並一一標記,當 n =

優秀部落翻譯-現代C++11程式碼風格

部落格原文: 開頭: C++11 就像一門全新語言 – C++之父 Bjarne Stroustrup C++11 標準提供了很多有用的特性。本文重點介紹一些有用的特性和那些相比於C++98,使C++ 11看上去時就像一門全新的語言的特性,因為

【nodeJS】從nodejs原生的部落網站搭建到 koa框架實現個人部落網站搭建

nodejs實現搭建部落格網站前言:原java後端渣渣一枚,因專案需要轉學了nodejs進行開發,正式進行專案開發之前,師傅安排了一些專案訓練,先熟悉js語法,然後熟悉nodejs,再慢慢重構向框架的使用。    寫這一篇文章的目的在於記錄自己學習的歷程,同時也是給其他的no