資料分析

資料處理-招聘資訊-中文分詞與詞頻統計

智慧決策上手系列教程索引 通過前面的幾篇文章,相信大家都嘗試抓取了一些網站上招聘資訊的資料,並存儲到自己的檔案裡面了,可能是一堆 .json 或 .csv 檔案。 如果你還沒有抓到資料,請看這

Facebook開源分散式日誌儲存系統LogDevice

Facebook開源 了他們的內部分散式日誌儲存專案LogDevice。它通過複製、持久日誌儲存和故障恢復實現寫入高可用性。 Facebook的大多數需要記錄日誌應用程式都需要寫入高可用性、持久的

如果再有人問你分散式 ID,這篇文章丟給他

首先國慶節要到了,先提前祝大家節日快樂,當然在放假的時候適當的學一下知識也是必要的。 1.背景 在我們的業務需求中通常有需要一些唯一的ID,來記錄我們某個資料的標識: 某個使用者的ID

著名的分散式事務資料庫谷歌Spanner設計有坑!

CAP定理指出,在網路分割槽的情況下,不可能同時保證一致性和可用性。由於網路分割槽在可擴充套件的分散式系統中理論上是可行的,因此現代可擴充套件資料庫系統的架構師分為兩大陣營:優先考慮可用性的陣營(NoSQL陣營

業務拆分的思考

從最初的單體應用,即將進行業務拆分,分而治之,雖心不免有些激動,但是很快就陷入深思。 因為我不得不考慮如何拆分比較好及其現在要不要拆分的問題。 目前我們開發的是一個多租戶系統應用,考慮到公共通用功能,例

餓了麼:分散式時序資料庫 - LinDB

餓了麼對時序資料庫的需求主要來自各監控系統,主要用於儲存監控指標。原來使用graphite,後來慢慢有對指標有多維的需求(主要體現在對一個指標加多個Tag, 來組成Series,然後對Tag進行Filter和Grou

K8S上的分散式系統應用編排

隨著容器技術的發展,容器的優勢:易打包、可複製、隔離性、低開銷,使得不斷的有應用開始從傳統的物理機、虛擬機器,逐漸的搬遷到容器上。而 Kubernetes 的誕生和發展壯大,又降低了應用的標準化部署管理的難度,

1746115409.9278