隨著云原生平臺(tái)在企業(yè)核心業(yè)務(wù)中的廣泛落地,K8s 已從早期的“技術(shù)嘗鮮”階段全面邁入“生產(chǎn)級(jí)承載”時(shí)代。越來(lái)越多的關(guān)鍵業(yè)務(wù)系統(tǒng)紛紛構(gòu)建于 K8s 之上。在此背景下,K8s 面臨的核心挑戰(zhàn)已不再局限于基礎(chǔ)部署與運(yùn)維,而是逐步轉(zhuǎn)向三大關(guān)鍵維度:多集群治理規(guī)范化、資源管理精益化、異構(gòu)基礎(chǔ)設(shè)施管理標(biāo)準(zhǔn)化。
為幫助企業(yè)應(yīng)對(duì)上述挑戰(zhàn),KubeSphere正式推出v4.2.1版本,旨在構(gòu)建穩(wěn)定、高效、智能、經(jīng)濟(jì)的下一代云原生基礎(chǔ)設(shè)施平臺(tái)。
集群治理能力增強(qiáng):夯實(shí)企業(yè)級(jí)平臺(tái)底座
在大規(guī)模生產(chǎn)環(huán)境中,集群治理能力決定了平臺(tái)的穩(wěn)定邊界與運(yùn)維上限。KubeSpherev4.2.1 圍繞網(wǎng)關(guān)平滑升級(jí)、多集群治理、節(jié)點(diǎn)精細(xì)化調(diào)度等方面進(jìn)行針對(duì)性提升。
網(wǎng)關(guān)一鍵平滑升級(jí)
作為生產(chǎn)流量的第一道關(guān)口,網(wǎng)關(guān)的穩(wěn)定性、可觀測(cè)性與運(yùn)維效率,直接關(guān)系到企業(yè)核心業(yè)務(wù)的連續(xù)性。在 v4.2.1 中,KubeSphere 重構(gòu)網(wǎng)關(guān)全生命周期管理能力,從運(yùn)維效率、權(quán)限治理等方面做出重大改進(jìn)。
● 無(wú)感平滑升級(jí):支持管理員在控制臺(tái)一鍵發(fā)起網(wǎng)關(guān)升級(jí)操作,系統(tǒng)將自動(dòng)按照滾動(dòng)更新策略逐步替換網(wǎng)關(guān)實(shí)例,全程無(wú)需停機(jī)或中斷業(yè)務(wù)流量。該能力顯著提升了網(wǎng)關(guān)升級(jí)的成功率與執(zhí)行效率,大幅降低了因版本迭代、安全補(bǔ)丁或配置變更帶來(lái)的業(yè)務(wù)抖動(dòng)風(fēng)險(xiǎn),真正實(shí)現(xiàn) “靜默升級(jí)、無(wú)感運(yùn)維”,為生產(chǎn)環(huán)境中的高可用服務(wù)網(wǎng)關(guān)提供堅(jiān)實(shí)保障。
● 故障秒級(jí)定位:摒棄 “依賴日志擴(kuò)展組件” 的傳統(tǒng)模式,運(yùn)維人員即可直接查看網(wǎng)關(guān)工作負(fù)載狀態(tài)與運(yùn)行日志,故障定位時(shí)長(zhǎng)從 “分鐘級(jí)” 縮短至 “秒級(jí)”,顯著降低問(wèn)題排查成本。
● 分級(jí)流量管控:平臺(tái)管理員可在集群視角統(tǒng)一配置企業(yè)空間級(jí)與項(xiàng)目級(jí)網(wǎng)關(guān),實(shí)現(xiàn)分級(jí)部署與權(quán)限管控,滿足不同業(yè)務(wù)對(duì)流量隔離、入口管理和權(quán)限控制的差異化需求,滿足企業(yè)精細(xì)化運(yùn)維規(guī)范。

多集群治理
隨著企業(yè)業(yè)務(wù)規(guī)模的擴(kuò)大,K8s 集群數(shù)量持續(xù)增長(zhǎng),多集群已成為常態(tài)。KubeSphere v4.2.1 針對(duì)多集群場(chǎng)景,從升級(jí)管理、狀態(tài)同步等方面持續(xù)優(yōu)化平臺(tái)能力。
● 成員集群可視化在線升級(jí):提供成員集群版本升級(jí)的可視化便捷操作,降低多集群升級(jí)過(guò)程中的操作復(fù)雜度與人為失誤風(fēng)險(xiǎn);支持查看升級(jí)日志,及時(shí)掌握升級(jí)進(jìn)展。
● 多集群狀態(tài)精準(zhǔn)同步:優(yōu)化多集群狀態(tài)同步機(jī)制,新增成員集群狀態(tài)的主動(dòng)探測(cè),完善集群多種狀態(tài)的判斷邏輯,確保集群狀態(tài)的準(zhǔn)確性與一致性。

節(jié)點(diǎn)組精細(xì)化管理
KubeSphere v4.2.1 新增節(jié)點(diǎn)組(Node Group)能力,可將物理或虛擬節(jié)點(diǎn)邏輯劃分為多個(gè)節(jié)點(diǎn)組,支持節(jié)點(diǎn)組和企業(yè)空間綁定?;谠撃芰?,企業(yè)可實(shí)現(xiàn)在不同場(chǎng)景對(duì)資源調(diào)度的精細(xì)化管理。例如:
● 在多團(tuán)隊(duì)共享集群、信創(chuàng)環(huán)境隔離、AI 與普通業(yè)務(wù)混部等復(fù)雜場(chǎng)景,確保關(guān)鍵業(yè)務(wù)獨(dú)占高性能或?qū)S糜布Y源,避免租戶間資源爭(zhēng)搶。
● 基于節(jié)點(diǎn)組歸屬,自動(dòng)歸集資源消耗,實(shí)現(xiàn)部門/項(xiàng)目級(jí)成本核算。
● 支持將公有云、私有云、邊緣節(jié)點(diǎn)分別納入不同節(jié)點(diǎn)組,構(gòu)建統(tǒng)一調(diào)度平面下的異構(gòu)資源池。
KubeEye 一鍵巡檢
KubeSphere v4.2.1 通過(guò) KubeEye 提供靈活且可擴(kuò)展的 K8s 集群巡檢框架。KubeEye 支持通過(guò)自定義巡檢規(guī)則和計(jì)劃,對(duì)集群中的節(jié)點(diǎn)、工作負(fù)載及服務(wù)進(jìn)行全面的自動(dòng)化健康檢查與合規(guī)性掃描,并自動(dòng)采集結(jié)果、生成詳細(xì)的巡檢報(bào)告,幫助管理員提前發(fā)現(xiàn)潛在風(fēng)險(xiǎn)與配置缺陷。

彈性調(diào)度再升級(jí):新增容器垂直伸縮與事件驅(qū)動(dòng)伸縮,強(qiáng)化水平伸縮能力
KubeSphere v4.2.1 通過(guò)集成垂直 Pod 自動(dòng)擴(kuò)縮(VPA)、事件驅(qū)動(dòng)的彈性伸縮機(jī)制,并增強(qiáng)傳統(tǒng) HPA 策略,實(shí)現(xiàn)更精準(zhǔn)、更敏捷、多維度的資源彈性調(diào)度能力。
容器垂直伸縮(VPA):基于資源實(shí)際需求的智能調(diào)度
● 基于歷史 CPU 和內(nèi)存使用數(shù)據(jù),自動(dòng)分析并推薦每個(gè)容器的 requests 和 limits 最優(yōu)配置建議,避免人工配置過(guò)高(造成浪費(fèi)資源)或過(guò)低(導(dǎo)致 OOM 或 CPU 節(jié)流)。
● 在 “Auto” 模式下,VPA 可自動(dòng)修改工作負(fù)載(如 Deployment、StatefulSet)中 Pod 的資源請(qǐng)求值,以滾動(dòng)重建 Pod 應(yīng)用新資源配置。
注意事項(xiàng):建議避免同時(shí)對(duì)同一工作負(fù)載使用多種伸縮策略,防止策略沖突、伸縮混亂。

事件驅(qū)動(dòng)伸縮(KEDA):外部事件轉(zhuǎn)化為 K8s 的彈性信號(hào)
● 支持80 +信號(hào)源(Scalers),覆蓋消息隊(duì)列、數(shù)據(jù)庫(kù)、監(jiān)控系統(tǒng)、云服務(wù)、自定義伸縮器等全場(chǎng)景。
● 當(dāng)事件源無(wú)待處理任務(wù)時(shí),可將 Pod 副本數(shù)縮至 0,徹底釋放資源,顯著降低成本(尤其適用于低頻、突發(fā)型任務(wù))。
● 對(duì)同一伸縮目標(biāo)使用多個(gè)觸發(fā)器(target),實(shí)現(xiàn)精準(zhǔn)控制。

容器水平伸縮(HPA)增強(qiáng):精細(xì)控制擴(kuò)縮容行為
● 支持?jǐn)U容(scaleUp)和縮容(scaleDown)分別配置策略參數(shù),支持穩(wěn)定窗口、擴(kuò)縮容速率限制,避免指標(biāo)瞬時(shí)波動(dòng)導(dǎo)致頻繁擴(kuò)縮容。
● 針對(duì) CPU 和內(nèi)存,支持多種目標(biāo)值設(shè)定,如百分比、平均值、絕對(duì)值。
注意事項(xiàng):HPA V2 無(wú)法直接從舊版本 HPA V1 自動(dòng)升級(jí),需手動(dòng)調(diào)整 YAML;兩者不可同時(shí)應(yīng)用于同一工作負(fù)載,否則會(huì)產(chǎn)生沖突。

KubeSphere v4.2.1 一站式集成 VPA、HPA 與 KEDA,實(shí)現(xiàn)縱向調(diào)優(yōu)、橫向擴(kuò)縮與事件驅(qū)動(dòng)彈性的三位一體智能伸縮體系,兼顧資源效率、成本優(yōu)化與業(yè)務(wù)敏捷性。
異構(gòu)基礎(chǔ)設(shè)施統(tǒng)一納管:構(gòu)筑標(biāo)準(zhǔn)化算力底座
在 KubeSphere v4.2.1 中,我們聚焦異構(gòu)基礎(chǔ)設(shè)施的統(tǒng)一納管與數(shù)據(jù)訪問(wèn)效率,面向工程仿真、工業(yè)數(shù)字孿生等通用異構(gòu)計(jì)算場(chǎng)景,推出三大核心基礎(chǔ)能力,為上層調(diào)度平臺(tái)提供穩(wěn)定、標(biāo)準(zhǔn)化的算力支撐。
● GPU/vGPU 異構(gòu)算力統(tǒng)一納管與適配:支持對(duì)物理 GPU 與虛擬化 GPU 資源的統(tǒng)一識(shí)別、注冊(cè)與基礎(chǔ)分配,適配通用圖形渲染、工業(yè)計(jì)算等場(chǎng)景的硬件需求,實(shí)現(xiàn)異構(gòu)算力資源的規(guī)范化管理,提升資源可視性與可管理性。
● 集成 Volcano 基礎(chǔ)調(diào)度組件:提供通用批量計(jì)算任務(wù)的基礎(chǔ)編排能力,支持隊(duì)列管理、基礎(chǔ)資源分配等策略,為上層專業(yè)調(diào)度平臺(tái)提供任務(wù)編排適配支撐,保障通用復(fù)雜工作負(fù)載的穩(wěn)定執(zhí)行。
● NFS 與對(duì)象存儲(chǔ)本地緩存加速:集成 Fluid 云原生數(shù)據(jù)編排引擎,實(shí)現(xiàn) NFS 與對(duì)象存儲(chǔ)的智能本地緩存加速,通過(guò)數(shù)據(jù)預(yù)取與邊緣緩存機(jī)制,降低遠(yuǎn)程存儲(chǔ)訪問(wèn)延遲,顯著提升 I/O 密集型應(yīng)用的數(shù)據(jù)讀寫吞吐量,確保業(yè)務(wù)高并發(fā)場(chǎng)景下穩(wěn)定高效運(yùn)行。
這些能力共同構(gòu)建了一個(gè)更高效、更靈活、更貼近企業(yè)生產(chǎn)實(shí)際的云原生基礎(chǔ)設(shè)施平臺(tái),助力企業(yè)在不改變現(xiàn)有架構(gòu)的前提下,為上層各類調(diào)度平臺(tái)提供標(biāo)準(zhǔn)化的異構(gòu)算力底座,保障算力資源穩(wěn)定供給,提升整體資源運(yùn)營(yíng)效率。
其他重要更新
● 應(yīng)用管理:優(yōu)化操作超時(shí)控制機(jī)制、日志查看便捷性及命名空間配置流程,新增歷史部署清理能力,體驗(yàn)更流暢。
● 可觀測(cè)性:支持指標(biāo)告警、事件告警的持久化存儲(chǔ);支持采用 Doris 作為審計(jì)、事件、日志、通知?dú)v史的后端存儲(chǔ);開放租戶級(jí)網(wǎng)絡(luò)可觀測(cè)功能權(quán)限。
● 資源管理:容器健康檢查新增 HTTP 請(qǐng)求頭探針配置;支持 Pod 事件滾動(dòng)更新。
總結(jié)
精進(jìn)不止,向新而生!KubeSphere v4.2.1 以更可靠的多集群治理能力,更精細(xì)的異構(gòu)資源協(xié)同支撐、更高效的云原生數(shù)據(jù)訪問(wèn),持續(xù)夯實(shí)企業(yè)級(jí)云原生平臺(tái)底座。我們不止于功能迭代,更致力于讓每一份算力被精準(zhǔn)使用,每一條業(yè)務(wù)流穩(wěn)定運(yùn)行,每一位開發(fā)者專注創(chuàng)新。
未來(lái)已來(lái),KubeSphere 與您共赴云原生新篇章!