1. 程式人生 > >京東金融PaaS平臺思考與實踐_Kubernetes中文社群

京東金融PaaS平臺思考與實踐_Kubernetes中文社群

8月19日的數人云Container Meetup上,張龍老師做了《基於Kubernetes的PaaS平臺的設計和思考》的精彩分享,分別介紹了PaaS平臺的意義,為什麼選擇Kubernetes,PaaS平臺上的微服務架構應用,如何設計和快速構建PaaS平臺,PaaS平臺的功能元件這幾個內容。

以下為現場實錄內容——

今天跟大家分享下基於Kubernetes的PaaS平臺設計和思考,主要分為五個部分:

  • PaaS平臺的意義
  • 為什麼選擇Kubernetes
  • PaaS平臺上的微服務架構應用
  • PaaS平臺架構設計
  • PaaS平臺功能元件

PaaS平臺的意義

很多公司技術支援崗位的工作,如配置域名,部署環境,修改復位配置,服務重啟,擴容縮容,梳理和完善監控,根據開發的需要查詢日誌等工作,需要和開發進行大量的溝通,如什麼是外網域名,什麼是內網域名、A name、C name,防火牆規則該如何設定,作業系統等基礎環境需要什麼依賴。因為很多研發不瞭解運維的術語和知識點,導致溝通困難,效率很低。而且這樣的需求還很多,把運維壓的喘不過氣,佔用了幾乎所有的時間,但是開發的需求可能還是遲遲不能滿足。

這樣的公司可能遇到了以下問題:

  • 系統架構過於陳舊,效能、可靠性無法滿足現有的需求;
  • 原有IT架構不靈活,業務模組新增或變更帶來巨大成本壓力;
  • 系統功能繁雜,結構紊亂,定製的程式碼與系統耦合性極高;
  • 服務種類繁多,各種技術棧橫行;
  • 人員流動交接不充分,新接手的團隊對部署環境不瞭解,只能做周邊的修補,不敢遷移 。

如何才能解決?答案是流程化、標準化、自動化、平臺化。

流程化

即主動梳理運維工作任務,形成標準化的操作流程,尤其是針對需要多人協作完成的任務,比如應用的釋出部署,把流程固化到流程平臺系統中,保證每個人執行都能按照流程嚴格執行,不會有哪些環節遺漏,而且當前的流程狀態對所有人都可見,能清晰的看到誰正在處理,處理人也會更主動儘快的完成該任務。

標準化

從架構角度按照應用類別制定應用的部署標準,比如Web型別的應用,服務化的應用(我們內部用的JSF),或者是比較新的微服務的應用(Springboot等),部署指令碼和工具平臺按照約定好的規範進行設計開發,減少了因為應用種類繁多導致工具和平臺的複雜。

自動化

早期寫了非常多的指令碼,任務執行機到要執行任務的伺服器之間通過SSH免金鑰認證,再根據需要批量執行命令。隨著伺服器規模和應用數量的擴張,很快指令碼執行的方式無法滿足業務發展,難以理解,同一個型別的任務多個指令碼並存,存在誤操作,缺乏清晰的操作歷史記錄和回滾機制,即使後續替換了如Puppet,Saltstack,Ansible這樣的配置管理工具,但根本問題並沒有解決。

※ 平臺化

平臺化是這次分享的重點,一定要在前面三條的基礎上進行建設,如果沒有清晰的流程,明確的標準,平臺建設起來也只是自動化工具的整合,解決不了公司核心問題。

以下說的平臺化內容主要是PaaS平臺化,即主要從應用和中介軟體的角度,這裡不討論IaaS的內容。

PasS平臺化將問題的關注點從基礎資源上升到了應用層面,目標是提供一個幫助開發人員執行、管理應用的平臺,讓使用者更關注執行的程式碼(業務邏輯)。

PaaS能解決的問題:

  • 應用聚合:如開發需要一個Redis,直接啟動一個Redis容器即可
  • 服務發現、快速伸縮、狀態管理等
  • 服務監控、恢復、容災
  • 費用統計:提供計算資源資訊彙總,針對不同專案收費
  • 安全管控:不管什麼平臺,安全都非常重要,例如A應用可以訪問B,B不允許訪問A以及安全審計等。
  • 快速部署。

隨著Docker容器技術的出現,讓我們有了更合適的工具建設PaaS平臺,具備了基於應用構建服務的能力。

在Docker容器排程框架上,我們又選擇了Kubernetes平臺。

為什麼選擇Kubernetes

先列一下目前三大主流的容器排程框架的功能和特點:

〓 Kubernetes

資源排程、服務發現、服務編排、資源邏輯隔離、服務自愈、安全配置管理、Job任務支援、自動回滾、內部域名服務、健康檢查、有狀態支援、執行監控/日誌、擴容縮容、負載均衡、灰度升級、容災恢復、應用HA。

〓 Mesos

Mesos是一個分散式核心,目前的發展方向是資料中心作業系統(DCOS),它同時支援 Marathon、 Kubernetes 和 Swarm 等多種框架,Mesosphere 也是 Kubernetes 生態的一員。

注意Marathon的技術棧是Scala語言,而Docker和Kubernetes的技術棧都是Go語言。

〓 Swarm

從Docker1.12版本開始,Swarm 隨Docker一起預設安裝釋出,也由於隨Docker引擎一起釋出,無需額外安裝,配置簡單。

支援服務註冊、服務發現,內建Overlay Network以及Load Balancer。

與Docker CLI非常類似的操作命令,對熟悉Docker的人非常容易上手學習。

每一種工具都有自己的核心理念。

Mesos理念是資料中心作業系統(DCOS),為了解決IaaS層的網路、計算和儲存問題,所以Mesos的核心是解決物理資源層的問題。

Kubernetes的核心是如何解決自動部署,擴充套件和管理容器化(containerized)應用程式。

所以,個人認為Mesos和Kubernetes是兩種維度,對於我們的場景來說,關心應用的狀態多於物理資源層管理,因此更關心的是容器化應用程式管理,這是我們選擇Kubernetes的主要原因。

另外選擇Kubernetes還考慮了其它優勢,如:

  • 出身名門Google,其開發和設計受到了Google著名的Borg系統的影響;
  • GitHub上關注Kubernetes專案和提交程式碼的開發者非常多,社群活躍,如果遇到問題,通過社群諮詢和解決 問題速度也會比較快。
  • Kubernetes可以很好的支援有狀態的服務。

PaaS平臺上的微服務架構應用

再來看一下我眼中的基於當前最流行的微服務架構的設計是什麼樣的,即我們PaaS平臺上要執行的典型應用是什麼樣的。

使用者端的請求進來以後,首先進入前端的Nginx伺服器,再進入Zuul代理網管上,由Zuul將這些任務下發到不同的服務上去。Eureka叢集作為註冊中心服務,提供服務的發現和註冊的功能。服務後端再去呼叫依賴的其他服務,資料庫叢集,Redis叢集等服務。

微服務架構因為有註冊中心自動解決了服務註冊發現的問題,所以對內部服務來講就不用依賴傳統的負載均衡器等工具,很容易將各個服務Docker化,遷移到PaaS平臺裡統一管理。

PaaS平臺架構設計

平臺建設原則

在建設PaaS平臺之前,參考《高效人士的七個習慣》設定了PaaS平臺建設的原則:

  1. 以終為始:做一件事情要知道想達成什麼樣的目的,知道這個目的之後,就能夠圍繞這個目標採取一些措施。
  2. 知己解彼:作為一個運維人員,需要有一個比較大的知識面。只有如此才能夠去制定一些適合自己的方案和產品。
  3. 積極主動:因為要做PaaS所以要把自己的主觀能動性都調起來。
  4. 要事第一:上面說了很多PaaS相關的內容,由於時間、人員的限制。如何從眾多的基礎組建中挑選出來最重要的一些事情,著手建設。
  5. 雙贏:做出來的系統最好是能夠達到對開發、運維、公司都有利。
  6. 統合綜效:對待同樣的一件事,每個人都會有自己的見解。同時也要問同伴,要把所有的觀點都收集起來做一個綜合分析對比,以收到更好的效果。
  7. 持續更新:時刻提醒自己持續學習,擁抱變化,這樣才能看到平臺的不足。持續迭代出更好的產品。

基於以上的原則,我們團隊勾勒了一個最小化的PaaS圖:

  1. 最上面的Ingress服務跟傳統的負載均衡器的功能類似,提供請求分發的功能。
  2. Service相當於後端Pod的一個代理伺服器,Service需要通過Ingress服務才能被外部Client訪問。
  3. Pod則相當於我們傳統的一個服務。
  4. 最小化PaaS平臺還用到了DNS元件,在內部服務執行起來之後,我們會通過DNS元件分配一個內部域名供訪問時使用。

Kubernetes對外提供服務,用的是Lvs+Ingress,每次新增一個新的服務之後會呼叫一次DNS的API,按照規則生成一個內部域名供訪問使用。

平臺關鍵能力說明

應用持續部署

平臺實現快速、視覺化自動部署功能。支援對應用的快速、視覺化部署。使用者僅需在介面中選擇相應的映象和元件,並填寫簡單的配置資訊,點選部署按鈕,即可完成整個應用的安裝或者升級。在測試環境可通過Jenkins,可實現應用的持續整合和全自動化升級,同時支援一鍵回滾和恢復釋出功能。

應用彈性伸縮

構建具有需求預測和容器按需供給能力的彈性伸縮子系統,具有基於應用的負載和資源情況進行彈性伸縮能力,以應對網際網路使用者高併發的特點,應對流量衝擊。其中,包括容器彈性伸縮、物理機彈性伸縮功能。

容器和元件的統一管理

從整體應用的角度出發,平臺不僅管理映象和容器,而是將一個應用涉及的所有元件均做了統一管理,比如對前端的DNS、負載均衡(F5/Nginx),後端資料庫等的管理。通過對系統相關元件和容器統一管理,平臺將可以實現系統的全域性統一部署、配置、升級/回滾、監控、故障處理等功能。

高可靠性

容器的故障恢復,當伺服器宕機時,平臺系統會自動在其它伺服器上重新啟動容器併為其分配資源,從而達到秒級啟動,恢復業務。保障業務不掉線,高可靠執行;映象倉庫的可靠性,通過將單機版的映象倉庫擴充套件成映象倉庫叢集,從而提升效能,實現Registry的無狀態化,便於實現服務的高可用性。

應用docker化封裝

系統支援如下幾類常見應用:Tomcat、Jboss、Nginx、Redis、Zookeeper等。

PaaS平臺功能元件

具體實施時,主要有幾個基礎元件需要開發:

〓 映象管理

實際執行的應用映象由 “基礎中介軟體映象”+“應用包”+“配置” 自動構建,無需開發人員理解映象概念和手動製作映象;

〓 DNS管理

定製化公司內部使用的DNS管理平臺,對公司的DNS進行統一管理;

〓 服務管理

需要定製化一套Kubernetes的Deployment模板,從Ingress到Service再到RC都定義在這套模板裡面,方便對容器進行擴容、縮容、刪除操作;

〓 服務內pod管理

屬於Kubernetes自有範疇,檢視Service內的Pod執行情況、Pod日誌輸出等功能;

〓 日誌管理

將日誌輸出到公司的日誌平臺(如ELK平臺),對接研發人員排查問題、資料埋點使用。

〓 監控管理

參考方案cadvisor+influxdb+grafana/ heapster+influxdb+grafana/Prometheus/zabbix.

一箇中小企業做成這樣後,日常運維的工作量即可大量減少,兩三個人就能完成日常的應用運維工作,有興趣地話可以去挑戰一下。當然做完這些後,還只是一個小型的PaaS平臺。

如果是再複雜一點的PaaS平臺,應該還有哪些要繼續做的呢?

環境管理:即一套平臺管理多套不同的Kubernetes叢集。安全管理、流程管理、計費管理等功能模組。

還有因為規模增加和更高的可靠性要求,對應的網路,IO等各種優化。

其實還有很多功能就不一一列舉了,可以根據自己的實際情況新增功能模組,設計有自己公司特色的PaaS平臺。