1. 程式人生 > >《大資料時代:生活、工作與思維的大變革》讀書筆記

《大資料時代:生活、工作與思維的大變革》讀書筆記

引言

1、        大資料與雲端計算是一個問題的兩面:一個是問題,一個是解決問題的方法。通過雲端計算對大資料進行分析、預測,會是的決策更為精準,釋放出更多資料的隱藏價值。資料,這個21世紀人類探索的新邊疆,正在被雲計算髮現、征服。

2、        人類儲存資訊量的增長速度比世界經濟的增長速度快4倍,而計算機資料處理能力的增長速度則比世界經濟的增長速度快9倍。

3、        大資料的核心就是預測,它是把數學演算法運用到海量的資料上來預測事情發生的可能性。

4、        大資料使我們不再熱衷尋找因果關係,而應該尋找事物之間的相關關係。大資料告訴我們“是什麼”而不是“為什麼”。在大資料時代,我們不必知道現象背後的原因,我們只要讓資料自己發聲。

01 不是隨即抽樣,而是全體資料

02 不是精確性,而是混雜性

1、        大資料的簡單演算法比小資料的複雜演算法更有效。所以,資料多比少好,更多資料比算法系統更智慧還要重要。

2、        當我們掌握了大量新型資料時,精確性就不那麼重要了,我們同樣可以掌握事情的發展趨勢。大資料不僅讓我們不再期待精確性,也讓我們無法實現精確性。

3、        寬容錯誤會給我們帶來更多價值。

03 不是因果關係,而是相關關係

1、        建立在相關關係分析法基礎上的預測是大資料的核心。

04 一切皆可量化

1、        資料化和數字化的概念大相徑庭。資料化是指一種把現象轉變為可製表分析的量化形式的過程;數字化指的是把模擬資料轉換成用0和1表示的二進位制碼。

2、        數字化帶來了資料化,但是數字化無法取代資料化,數字化是把模擬資料變成計算機可讀的資料,和資料化有本質上的不同。

05 “取之不盡,用之不竭”的資料創新

1、 不同於物質性的東西,資料的價值不會隨著它的使用而減少,而是可以不斷地被處理。

2、 資料創新1:資料的再利用;資料創新2:重組資料;資料創新3:可擴充套件資料;資料創新4:資料的折舊值;資料創新5:資料廢氣;資料創新6:開放資料。

3、 資料是一個平臺,因為資料是新產品和新商業模式的基石。

06 資料、技術與思維的三足鼎立

1、 行業專家和技術專家的光芒都會因為統計學家和資料分析家的出現而變暗,因為後者不受舊觀念的影響,能夠聆聽資料發出的聲音。

2、 大資料讓處於行業兩端的公司受益良多,而中等規模的公司要麼向兩端轉換,要麼破產。傳統行業最終都會轉變為大資料行業,無論是金融服務業、醫藥行業還是製造業。當然,大資料不會讓所有行業中的中等規模的公司消亡,但是肯定會給可以被大資料分析所取代的中等規模公司帶來巨大的威脅。

07 讓資料主宰一切的隱憂

1、        如果在隱私和預測方面對大資料管理不當,或者出現數據分析錯誤,會導致的不良後果比定製化的線上廣告要嚴重的多。

2、        如果所有人的資訊本來都已經在資料庫裡,那麼有意識地避免某些資訊就是此地無銀三百兩。

3、        大資料預測給我們帶來威脅,不僅僅侷限於司法公正上,它還會威脅到任何運用大資料預測對我們的未來行為進行罪責判定的領域,比如民事法庭案件中判定過失以及公司解僱員工的決策。

4、        大資料的不利影響並不是大資料本身的缺陷,而是我們濫用大資料預測所導致的結果。大資料預測是建立在相關性基礎上的。讓人們為還未實施的未來行為買單是帶來不利影響的主要原因,因為我們把個人罪責判定建立在大資料預測的基礎上是不合理的。

08 責任與自由並舉的資訊管理

1、        管理變革1:個人隱私保護,從個人許可到讓資料使用者承擔責任;管理變革2:個人動因VS預測分析;管理變革3:擊碎黑盒子,大資料演算法師的崛起;管理變革4:反資料壟斷大亨;

2、        掌控大資料三項策略:(1)隱私保護從個人許可到資料使用者承擔責任的轉變;(2)使用預測分析時考慮個人動因;(3)催生大資料審計員,也就是演算法師。

結語——正在發生的未來

1、        大資料並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代,大資料為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的將來。這也提醒我們在使用這個工具的時候,應當懷有謙恭之心,銘記人性之本。

2、        當我們給一個人判定責任時,必須牢記人類意志的神聖不可侵犯性。人類的未來必須保留部分空間,允許我們按照自己的願望進行塑造。否則,大資料將會扭曲人類最本質的東西,即理性思維和自由選擇。