1. 程式人生 > >數學之美---數學本來就很美

數學之美---數學本來就很美

原來寫過一篇推薦數學之美的文章,但是一個不小心被我刪除了,所以要重新寫,但怎麼也找不回那種感覺。我個人參加過很多的數學建模競賽,也拿過一些獎,所以對數學模型有莫名的親切感,同時也對各種演算法有一定的瞭解,數學建模中主要用到的一些高階演算法比如模擬退火、神經網路、遺傳演算法、支援向量機等等都已經比較成熟,所以問題的關鍵在於如何把一個實際問題抽象為一個數學問題,通過邏輯建立模型,無論是微分方程模型亦或是非線性模型,都可以找到數學的解,然後數學解帶到實際問題中檢驗,從而驗證模型的合理性,所以解決問題的好壞並不在於模型的複雜程度,更不在於演算法的高階程度,越是簡單的演算法可以合理的解決問題就是針對這個問題最好的模型與演算法,而數學的美就在於簡潔之美,數學本來就很美。
其實,數學從來就不是我們所瞭解的那樣只有抽象的數字、符號、公式和定理。數學產生之與生活,它的美對應將實際問題抽象成數學邏輯問題,通過簡單的數學工具加以解決,並反饋到生活中。簡單就是數學之美的真諦。由於個人經歷問題,這裡這是介紹一些數學模型供大家學習參考,如果要深入學習各個模型,仍需要閱讀原著以及相關的論文。

1.統計語言模型

原著的作者吳軍是通訊專業出身,所以他首先從自然語言的發展出發,自然語言處理又叫nlp,它經歷了從規則到統計的發展歷程。統計語言模型用於機器翻譯、語音識別、拼寫糾錯、漢字輸入、文獻查詢等方面。
統計語言模型的基本數學表述為

P(w1,w2,...,wn)=P(w1)P(w2|w1)P(w3|w1,w2)P(wn|w1,w2,...,wn)
上述模型的條件概率P(wn|w1,w2,...,wn)比較難以估計,可以引入馬爾科夫假設,上述表達變為
P(w1,w2,...,wn)=P(w1)P(w2|w1)P(w3|w2)P(wn|wn1)
上述公式對應的就是二元統計語言模型。

2.資訊熵

H(X)=xXP(x)logP(x)
夏農最重要的貢獻之一。夏農在資訊領域的地位大致相當於馮諾依曼、圖靈在計算機領域的機會。夏農用位元定量化了資訊。從上式可以看出變數的不確定性越大,熵也就越大。有了熵的概念,資訊被定量化,例如,不考慮上下文,漢字的資訊熵大約8-9位元,所以一本漢字書可以用確定大小的檔案來儲存。

相關推薦

數學---數學本來

原來寫過一篇推薦數學之美的文章,但是一個不小心被我刪除了,所以要重新寫,但怎麼也找不回那種感覺。我個人參加過很多的數學建模競賽,也拿過一些獎,所以對數學模型有莫名的親切感,同時也對各種演算法有一定的瞭解,數學建模中主要用到的一些高階演算法比如模擬退火、神經網路、

考研數學高等數學知識點整理——2.極限

文章目錄 第二節、極限 一、極限的定義 二、數列極限的基本性質 三、函式極限的基本性質 四、無窮小量與無窮大量 1.定義 2.性質 3.無窮小量的比較 4.常用等價無窮小

碼農眼中的數學數學基礎

綜上所述,數可以分為: 複數:z = a+bi,i² = -1 實數(虛部b=0) 有理數 整數 正整數:1、2、3 0 負整數:-1、-2、-3 非整數的有理數([正負]分數) [正負]有限小數:0.3 ==> (3/10) [正負]迴圈小數:0.333

讀《數學》第三章 統計語言模型

其它 bigram 利用 理解 googl track 推斷 art google 自然語言從產生開始。逐漸演變為一種基於上下文相關的信息表達和傳遞方式,在計算機處理自然語言時,一個最主要的問題就是為自然語言上下文相關的特性建立數學模型,叫做統計語言模型(Statist

數學(吳軍著)學習總結和經典摘抄

語音識別 用戶輸入 問題 font 客戶 連接 進行 聯系 -m 第1章 語言和文字 VS數字和信息 1.不同的文明,由於地域的原因。歷史上相互隔絕。便會有不同的文字。隨著文明的融合與沖突,不同文明下的人們須要交流,或者說通信,那麽翻譯的需求便產生了。翻譯這件事之所

數學讀書筆記——自然語言處理教父和他的弟子們

自然語言處理 jpg alt 自然 .cn 讀書筆記 bsp blog 處理 數學之美讀書筆記——自然語言處理教父和他的弟子們

數學》——維特比和他維特比算法

數學 模型 狀態 inf 一個 alt 技術 劃算 spa 維特比乍法是一個特殊但應用最廣的動態規劃算法,可以解決任何一個圖中的最短路徑問題。 這個算法是針對一個特殊的圖——籬笆網絡的有向圖的最短路徑提出的。 這個算法之所以重要,是因為凡是使用隱含馬爾科夫模型描述的問題都可

數學 (第二版) pdf

學院 pagerank 部分 廣電總局 創始人 智能 inter link cor 下載地址:網盤下載 內容簡介 · · · · · ·幾年前,“數學之美”系列文章原刊載於谷歌黑板報,獲得上百萬次點擊,得到讀者高度評價。讀者說,讀了“數學之美”,才發現大學時學的數學知

數學》讀書記錄【思維導圖記錄】:第四章,談談中文分詞

post IT .cn splay top style title mage blog 《數學之美》讀書記錄【思維導圖記錄】:第四章,談談中文分詞

數學筆記】自然語言處理部分(一).md

strip BE 模擬 ges arr 實驗 語句 次數 而不是 文字、數字、語言 、信息 數字、文字和自然語言一樣,都是信息的載體,他們的產生都是為了記錄和傳播信息。 但是貌似數學與語言學的關系不大,在很長一段時間內,數學主要用於天文學、力學。 本章,我們將回顧一下信息時

數學》——第二章 個人筆記

term spa 高級 程序 chm 出現 信息 ont 飛機 第二章 自然語言處理——從規則到統計 這一章開頭這句話:字母,文字,數字是信息編碼的不同單位。任何一種語言都是一種編碼的方式,而語言的語法規則是編解碼的算法。我們表達一個意思要通過語言表達出來,就是用

數學》——第一章 個人筆記

沒有 歧義 移動互聯網 style 情況 組成 進制 LV 讓我   數學之美 第一章 文字和語言 vs 數字和信息 1 信息 通信的原理就是這三個步驟,本質上是一致的,只不過今天的實現形態發生了變化。更技

數學》——第五章 個人筆記

strong == 概率 上下 很多 alt 就是 相關 分享圖片 第五章 隱含馬爾可夫模型 1 通信模型 通信的本質是一個編解碼和傳輸的過程。 典型的通信系統: 包含雅格布森通信的六個要素:發送者(信息源),信道,接收者,信息,上下文和編碼。 其中S1,S2,S

數學”筆記

nbsp amp main close data pla AI lose http https://cosx.org/2013/01/story-of-normal-distribution-1 有一天一個哥們,也許是個賭徒,向棣莫弗提了一個和賭博相關的問題:A、B 兩人

數學讀書筆記(2)

談談分詞 分詞方法,最容易想到的就是查字典,即從左到右把句子掃描一遍,遇到字典裡有的詞,就標識出來,遇到複合詞就找最長的詞匹配。這個方法可以解決七八成的問題,但是還是過於單薄。 之後提出的用統計語言模型進行分詞的方法,效果上好的多。對於給定的一個句子,有若干中分詞方法,A1,A2

數學讀書筆記(1)

第二章 我們把一個要表達的意思,通過某種語言的一句話表達出來,就是用這種語言的編碼方式對頭腦中的資訊做一次編碼,編碼的結果就是一串文字。而如果對方懂得這門語言,他或她就可以用這門語言的解碼方式獲得說話人要表達的意思。這就語言的數學本質。 【語言的本質是資訊載體,不同的語言是對同一種

演算法與數學

發現這個好神奇,好好玩 為什麼圓是360度? 2018年07月28日 20:50:22 閱讀數:374 數是萬物的本原。——畢達哥拉斯學派     圓為什麼有360度? 為什麼不是300度呢?   古文明時期,人類把很多不能

【讀書筆記】數學2-搜尋引擎

8.簡單之美——布林代數和搜尋引擎 建立一個搜尋引擎大致需要做的幾件事情: 自動下載儘可能多的網頁; 建立快速有效的索引; 根據相關性對網頁進行公平準確的排序。 這就是搜尋的“道”。 關鍵詞=布林運算(詞1,詞2,詞3);接著判斷詞i是否在文獻中,以得到一串二進

【讀書筆記】數學2--從規則到統計

這本書重於“道”,所以不應該著眼於其中的“術”。悟“道”才可以在今後的研究生涯中篤定地前行。 目錄   1.文字和語言vs數字和資訊 1.1 資訊 1.2 文字和數字 1.3 小結 2.自然語言處理 3.統計語言模型 3.1 用數學的方法描述語言規律

數學——讀錄

文章目錄 第1章 文字和語言 vs 數字和資訊 第2章 自然語言處理——從規則到統計 第3章 統計語言模型 第4章 談談分詞 第5章 隱含馬爾科夫模型