週一見|Kubeflow v0.5 釋出:模型開發體驗的重大改進、Kuberhealthy:K8S 叢集綜合測試
作者:小君君(才雲)、bot(才雲)
技術校對:星空下的文仔(才雲)
Kubeflow v0.5 釋出
Alpine Linux Docker 映象漏洞
Kuberhealthy:K8S 叢集的綜合測試
微服務框架 Lagom v1.5
Docker 公司 CEO 宣佈離職
《Kubernetes 中如何保證優雅地停止 Pod》
《如何減輕 K8S 基礎設施工作》
ICML 2019 論文收錄情況
甲骨文中國區研發中心裁員近千人
谷歌宣佈 Kotlin 成 Android 開發首選語言
微軟 Build 2019
Kubernetes 資訊
1. Kubeflow v0.5 釋出
近日,Kubeflow v0.5 釋出,它為使用者的模型開發體驗帶來了重大改進!
Kubeflow v0.5 的新功能包括:
-
kfctl 可用於簡化 Kubeflow 的配置和部署;
-
為了更方便地管理 notebook,UI 的優化如下:
-
可同時執行多個 notebook;
-
可將卷附加到 notebook 上;
-
使用者可從 notebook 或 Python IDE 構建、訓練和部署模型的 Fairing 庫。
Kubeflow v0.5 通過利用 Istio 和 Kubernetes 名稱空間可以為建立多使用者隔離奠定基礎:多使用者功能提供了一個新的“Profiles”Kubernetes 自定義資源,支援每個使用者動態建立名稱空間,以便他們可以在預設情況下獨立執行。
同時,社群也開始對 Kubeflow v0.6 進行設計。社群將提供更友好的應用程式,以實現使用者配置檔案的自助服務(或管理建立)。 Kubeflow v0.6 另外兩個重要的舉措是替換 ksonnet 以及為 Kubeflow v1.0 做準備。
如果你想對 Kubeflow 有更多瞭解,不妨觀看由才雲 Caicloud & K8sMeetup 中國社群主辦的 5.11 K8S & Kubeflow Meetup 活動精彩回放。
Meetup 回放連結:
https://study.163.com/course/courseLearn.htm?courseId=1209336810&share=2&shareId=480000001892758#/learn/live?lessonId=1279047817&courseId=1209336810
2 . Alpine Linux Docker 映象漏洞(評分:9.8)
2019 年 5 月 8 日,Alpine Linux Docker 映象漏洞(編號:CVE-2019-5021)被發現 [1] 。該漏洞位於 /etc/shadow 檔案和 root 使用者帳戶的預設配置中。根據漏洞報告,自 Alpine Linux v3.3 開始的所有 Docker 映象,root 使用者都包含一個空密碼,這可能會導致攻擊者獲得 root 許可權,進而造成攻擊。
報告中稱:受影響範圍是 Alpine Linux Docker 映象 v3.3、v3.4、v3.5、v3.6、v3.7、v3.8、v3.9、edge 等全部版本。
當前官方映象已經修復,可直接更新對應映象。
使用者也可以在 Dockerfile 中增加如下命令:
RUN sed -ie 's/^root::/root:!:/' "$rootfs/etc/shadow"
3. Kuberhealthy:K8S 叢集的綜合測試
Kuberhealthy 是 Comcast(美國第二大網際網路服務供應商)開發的一種開源解決方案,它通過在 Kubernetes 叢集中執行綜合測試來檢測 Kubernetes 問題。 Kuberhealthy 通過 JSON 狀態頁面和 Prometheus 度量標準終端報告測試結果,為 Kuberhealthy 指標提供靈活的警報選項。
通過複製真正的 Kubernetes 工作流程,Kuberhealthy 嘗試識別可能會被忽視的生產問題。Kuberhealthy 檢測到的潛在問題包括由於 CNI 通訊故障而陷入“終止”狀態的 Pod;由於磁碟問題錯誤而陷入“ContainerCreating”狀態的 Pod 或者重啟速度過快的 Pod。
為了識別這些型別的問題,Kuberhealthy 可實現如下幾種檢查:
-
守護程序部署和終止:此測試將守護程序部署到 Kuberhealthy 名稱空間中,等待所有 Pod 進入 “Ready”狀態,然後終止 Pod,並保證終止成功;
-
元件執行狀況:檢查叢集元件狀態,並在狀態超過 5 分鐘時發出警報;
-
過多的 Pod 重啟: 在名稱空間中, 當一個 Pod 一小時內被重啟超過五次時,則預設為 kube-system;
-
Pod 狀態:檢查超過 10 分鐘但未處於“Ready”狀態的 Pod;
-
DNS:檢查叢集內外的 DNS 故障。
下一步,Kuberhealthy 將會進行更多其他測試,包括服務配置、DNS 解析和磁碟配置。
關於 Kuberhealthy 綜合測試的更多資訊,見:
https://github.com/Comcast/kuberhealthy
4. 微服務框架 Lagom v1.5
前不久,微服務框架 Lagom v1.5 釋出。新版本附帶了 Akka Management 工具(用於操作 Akka 驅動的工具),並支援使用 Kubernetes 進行部署。Lagom v1.5 構建於 Play v2.7.0、Alpakka Kafka v1.0 和 Akka v2.5.22 架構之上,並通過 Akka gRPC 增加了對 Couchbase 和 gRPC 的支援。
新的 Akka 管理工具允許通過專用的 HTTP 端點遠端檢查 Akka Actor System 的狀態。預設情況下,Lagom 還會向端點新增一些路由以進行執行狀況檢查。新的工具還可以引入 Akka Cluster Bootstrap,它可以發現環境中的現有節點,而不是使用種子節點的靜態列表。
除了現有的基於 HTTP/JSON 的傳輸之外, Lagom v1.5 還引入了對跨服務 gRPC 通訊的孵化(未經過全面測試)支援,為開發人員提供了更多的傳輸選擇,提高其服務的採用率。
其他改進包括:
-
TLS 通過框架提供的自簽名證書在開發模式和測試模式中提供基本支援;
-
附加路由器,允許擴充套件服務公開的路由;
-
孵化對 Java 11 的支援。
5. Docker 公司 CEO 宣佈離職
5 月 8 日,Docker 公司宣佈 Steve Singh 已辭去 CEO 職位,前 Hortonworks 的 CEO Rob Bearden 將接替他的位置。Rob Bearden 將於 6 月初加入 Docker,而 Steve Singh 將繼續擔任 Docker 董事會主席,並在未來一段時間內幫助 Bearden 順利完成職能交接。
Docker 的新 CEO Rob Bearden,他是一位經驗豐富的高管,在打造和發展世界級軟體公司方面有著 20 多年的經驗,其中包括幾家商業上最成功的開源公司。他將會帶領 Docker 發展到什麼程度,我們不妨拭目以待。
博文推薦
1.《Kubernetes 中如何保證優雅地停止 Pod》
很多人對優雅停止(Graceful shutdown)Pod 這件事理解得很單純:不就是利用 PreStop hook 做優雅退出嗎?本文作者 PingCap 工程師吳葉磊發現,在很多場景下 PreStop hook 並不能很好地完成需求。這篇文章就針對如何“優雅地停止 Pod”進行了詳細解釋。
文章連結:
https://aleiwu.com/post/tidb-opeartor-webhook/
2.《如何減輕 K8S 基礎設施工作》
在文中,科技行業作家 Paul Korzeniowski 描述了一些可以減少 Kubernetes 基礎設施工作的新興工具和平臺,以此幫助開發者提高工作效率。這些工具和平臺包括 Metaparticle、ZooKeeper、Chef、Puppet、Pulumi 以及 Ballerina 程式語言。
文章連結:
https://searchmicroservices.techtarget.com/feature/In-Kubernetes-management-infrastructure-work-is-tricky
AI 資訊
1. ICML 2019 論文收錄情況
上週,機器學習頂會 ICML 公佈了今年大會的論文收錄情況 [2] ,據瞭解,ICML 2019 將於 6 月 10 日至 15 日在美國加州舉辦,大會此前共收到 3424 份提交論文,最後收錄了 774 篇,接收率為 22.6%。
以下是網友 Andreas Doerr 對資料做的分析提煉:
-
組織排名:本屆大會論文收錄數量排名前五的組織分別是 Google、Google Brain、Microsoft、DeepMind 和 Facebook,其中有三個組織均屬於 Alphabet;
-
高校排名:本屆大會論文收錄數量排名前五的高校分別是麻省理工學院、加州大學伯克利分校、斯坦福大學、卡內基梅隆大學和佐治亞理工學院,清一色美國大學;
-
國內表現:在排行榜上,清華大學以 15 篇入圍全球前 20,北京大學、南京大學、香港中文大學緊隨其後,國內的企業,如騰訊、阿里巴巴、百度也榜上有名;
-
來源分佈:在被收錄的所有 774 篇論文中,完全來自學界的論文一共 452 篇,佔比 58.4%;完全來自工業界的論文共 60 篇論文,佔比 7.8%;剩餘 262 篇論文是學界與工業界的合作成果,佔比 33.9%。
近年來,ICML 的影響力日漸提升,大會對文章質量的要求也更高,但伴隨社會關注度的提高,大會並沒有出現被大型組織、高校 “壟斷” 的局面,反而愈發顯得 “百花齊放,百家爭鳴”。對於以上結果,大多數網友表示欣喜,不少人也在留言中指出,這份榜單也可作為機器學習從業者擇校、擇業的重要參考。
其他
1. 甲骨文中國區研發中心裁員近千人
近期,甲骨文在全球啟動了裁員計劃。據瞭解,此次甲骨文在全球範圍內或將裁員約 5000 人,其中僅中國區就將裁員 1600 人。根據甲骨文中國員工爆料,甲骨文中國北京公司已經正式宣佈了中國區的裁員方案。
此次主要裁撤的是甲骨文中國區研發中心(CDC)相關人員,首批確認裁員約 900 餘人,其中超 500 人來自北京研發中心,而整個 CDC 共約 1600 人,意味著首批裁撤人員數額達到近六成。第二批裁員或將在 7 月進行。
2. 谷歌宣佈 Kotlin 成 Android 開發首選語言
北京時間 5 月 8 日凌晨,Google I/O 大會上,谷歌正式宣佈 Kotlin 程式語言現在是 Android 應用程式開發人員的首選語言。谷歌在宣告中寫道:“Android 的開發將越來越以 Kotlin 為先。” 許多新的 Jetpack API 和特性將首先在 Kotlin 中提供。如果你要開始一個新專案,你應該用 Kotlin 來寫;用 Kotlin 編寫通常意味著更少的程式碼——更少用於型別、測試和維護方面的程式碼。”
在過去的兩年裡,Kotlin 的人氣只增不減。 谷歌說,超過 50% 的專業 Android 開發人員現在使用該語言開發他們的應用程式,在最新的 Stack Overflow 開發人員調查中,它被列為第四大最受歡迎的程式語言。
3. 微軟 Build 2019
北京時間 5 月 7 日 23:00,一年一度的微軟開發者大會在華盛頓州雷德蒙德舉行,微軟執行長薩提亞·納德拉在開幕演講中概述了 Azure、Dynamics 365 和 Power 平臺以及微軟遊戲等領域的發展願景和機會。之後,微軟雲與 AI 事業部執行副總裁 Scott Guthrie 在演講中釋出了 AI、智慧雲、物聯網等業務相關的新品。
此次釋出的產品包括:跨應用程式和 Web 的新型協作和生產力服務,以及 Microsoft 365 中的人工智慧功能。此外,微軟正在 Azure 和 Windows 中提供新的開源技術和開發工具。
--
參考文獻:
1. https://cve.mitre.org/cgi-bin/cvename.cgi?name=CVE-2019-5021
2.https://i.redd.it/wdbw91yheix21.png