【“一云多芯”是云計算平臺的核心能力之一,是芯與云的融合,是平臺+生態(tài)的協(xié)同;“分層解耦”是構建下一代云數(shù)據(jù)中心、構建私有云生態(tài)的重要路徑” 】
近年來,我國從芯片、整機、操作系統(tǒng)、云平臺、中間件到應用軟件等技術領域的創(chuàng)新鏈、產(chǎn)業(yè)鏈已初步形成,以X86、ARM、Power等不同架構處理器的為基礎的產(chǎn)業(yè)生態(tài)框架已基本就緒。國內(nèi)IT產(chǎn)業(yè)生態(tài)也隨著新一代技術應用場景不斷拓展,已經(jīng)形成了多技術路線全棧式支撐能力。在數(shù)據(jù)中心建設方面,隨著企業(yè)“上云用數(shù)賦智”的不斷加速和深化,新場景下的算力孤島問題逐漸凸顯。如何實現(xiàn)多種芯片技術路線的高效協(xié)同,以應用為導向、從系統(tǒng)設計視角出發(fā),滿足多芯共存、多云異構條件下的云原生環(huán)境構建,保障業(yè)務應用的穩(wěn)定運行、平滑切換和線性增長,成為新一代云數(shù)據(jù)中心架構體系需要攻克的新的挑戰(zhàn)。
圖:浪潮信息副總裁 張東
云計算是協(xié)同紐帶,“一云多芯”是關鍵
‘“一云多芯”是打破小生態(tài)、構建大生態(tài)的關鍵紐帶。信息技術產(chǎn)業(yè)鏈發(fā)展迅速,相關技術及產(chǎn)品已開始大規(guī)模應用于金融、通信、政府等關鍵行業(yè)。但從產(chǎn)業(yè)鏈協(xié)同上看,各環(huán)節(jié)垂直封閉、生態(tài)離散,多個小生態(tài)并行存在。自有封閉小生態(tài)的排他性不利于產(chǎn)業(yè)的健康發(fā)展,難以形成產(chǎn)業(yè)合力,同時又給行業(yè)用戶在技術選型上帶來困擾。如何打破小生態(tài)壁壘,避免因技術選型失誤帶來的業(yè)務轉(zhuǎn)型失敗是各個行業(yè)關心的話題。在我們看來,“一云多芯”無疑是個最佳選擇。同時,其在一定程度上激發(fā)了IT產(chǎn)業(yè)鏈上下游的創(chuàng)新活力,進而促進整體生態(tài)的協(xié)同發(fā)展。
“一云多芯”可滿足用戶算力多樣化需求,并且可有效規(guī)避算力孤島。隨著各行各業(yè)業(yè)務創(chuàng)新的爆發(fā)式增長,不同業(yè)務場景對算力需求的差異化也越來越多,更多的算力供給從處理器向各種加速器(包括GPU、DPU、FPGA等)轉(zhuǎn)移。為充分發(fā)揮多元異構(不同架構、不同種類)芯片的能力優(yōu)勢,金融、能源等關鍵行業(yè)應基于多種芯片架構來構建云基礎設施底座,實現(xiàn)多元算力的統(tǒng)一池化管理、統(tǒng)一調(diào)度以及業(yè)務的差異化部署等,逐步實現(xiàn)從算力并存到算力統(tǒng)一。
“一云多芯”可有效降低供應鏈風險。“一云多芯”是IT產(chǎn)業(yè)鏈承上啟下的關鍵環(huán)節(jié),具備對下納管底層各種芯片,屏蔽底層基礎設施異構芯片差異,對上提供開放、統(tǒng)一的算力接口。但是,目前在云計算產(chǎn)業(yè)中,各服務器芯片的表現(xiàn)參差不一,導致用戶體驗難以一致,應用效果也大相徑庭。用好“一云多芯”,可以最大程度的降低技術路線的選擇風險,極大提升業(yè)務穩(wěn)定性以及業(yè)務改造的靈活性。
由此可見,無論是從業(yè)務角度、技術角度,還是產(chǎn)業(yè)鏈角度,踐行“一云多芯“已經(jīng)成為當下及未來云計算產(chǎn)業(yè)發(fā)展的關鍵,是產(chǎn)業(yè)鏈相關廠商的必然選擇。
“一云多芯”勢在必行,但落地挑戰(zhàn)猶存
“一云多芯”在云計算步新中已經(jīng)成為業(yè)內(nèi)共識。雖然“一云多芯”目標明確,但在產(chǎn)業(yè)落地過程中仍存在多方面挑戰(zhàn)。
首先是理念的轉(zhuǎn)變。IT基礎架構經(jīng)過長期的發(fā)展,從大機、小機時代逐步演進到云計算時代,開放計算深入人心。但直至今日,芯片指令集、操作系統(tǒng)架構上的差異化依然制約著架構的橫向協(xié)同,比如一個應用需要同時適配多個指令集和操作系統(tǒng)的問題仍然很嚴重。IT產(chǎn)業(yè)需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉(zhuǎn)變?yōu)橐韵到y(tǒng)為核心的設計,以“以應用為導向,以系統(tǒng)為核心”構建新一代產(chǎn)業(yè)生態(tài)。“一云多芯”是就是這種理念的具體體現(xiàn)。
其次是缺乏統(tǒng)一的“一云多芯”建設標準、規(guī)范。算力標準化是產(chǎn)業(yè)的愿景,因此基于”一云多芯”打造的算力平臺需要標準化、統(tǒng)一化、服務化。各廠商因技術能力差別導致理解和落地模式均有所不同,比如部分廠商將納管多個獨立的不同芯片架構資源池的這種模式也包裝成“一云多芯”,由于無法實現(xiàn)真正的互聯(lián)互通,對業(yè)務的連續(xù)性造成很大的風險。
實現(xiàn)一云多芯,場景驅(qū)動的軟件定義是正道
一云多芯的最終目標是支撐用戶業(yè)務在不同架構處理器之間的低成本切換或者自由切換。因此,基于以系統(tǒng)設計為核心的思維,采用以場景驅(qū)動的“硬件重構+軟件定義”的融合架構,是數(shù)據(jù)中心體系結構的發(fā)展方向。我們認為可以分“有-好-優(yōu)”三步走來實現(xiàn)一云多芯的中長期目標。
圖:“一云多芯”三步走技術路線
第一階段,混合部署、統(tǒng)一管理、統(tǒng)一視圖
第一階段解決“有”的問題。以云為入口,通過云操作系統(tǒng)實現(xiàn)異構處理器服務器的統(tǒng)一管理,覆蓋國內(nèi)外主流處理器,提供統(tǒng)一操作界面、操作方式及統(tǒng)一監(jiān)控運維等,解決云資源池只能承載單一廠商或單一架構處理器的服務器而導致的應用無法跨架構部署、協(xié)同的問題。
第二階段,業(yè)務牽引、分層解耦、架構升級
第二階段解決“好”的問題。在第一階段的基礎上,進一步實現(xiàn)應用的低成本跨架構切換。通過資源層、平臺層和應用層的“分層解耦”設計,實現(xiàn)架構升級。
在資源層面,通過跨平臺的遷移實現(xiàn)應用跨架構快速部署。
在平臺層面,實現(xiàn)平臺應用的跨架構混合部署,如數(shù)據(jù)庫集群在一云多芯平臺上實現(xiàn)跨架構的狀態(tài)同步、數(shù)據(jù)同步,實現(xiàn)了多實例在不同處理器架構的服務器上的并行運行。
在應用層面,可通過服務網(wǎng)格等技術實現(xiàn)應用的跨架構流量切分。
第三階段,算力標準、全棧多芯、生態(tài)共建
這個階段是解決“優(yōu)”的問題。從業(yè)務連續(xù)性的維度,我們認為”一云多芯”的終極目標是實現(xiàn)應用與芯片架構的徹底解耦。這需要硬件、云以及應用等產(chǎn)業(yè)鏈上下游的共同協(xié)同,完善異構架構下有效算力的量化方法,以支持應用在不同架構處理器間的等價切換。共同推動應用與云基礎設施的一云多芯相結合,打造垂直一體化方案,實現(xiàn)應用層面的跨架構無感知切換。在標準和測評方面,聯(lián)合專業(yè)軟件測評機構及產(chǎn)業(yè)鏈上下游生態(tài),形成一云多芯行業(yè)標準。
寫在最后:
“一云多芯”已經(jīng)不再是一個簡單的口號,而是構建我國IT產(chǎn)業(yè)新生態(tài)的關鍵路徑。浪潮信息參編的基礎設施云管理軟件、虛擬化云平臺和容器平臺等多個國家級、行業(yè)級標準,也是以分層解耦、生態(tài)共建的理念推進我國信息產(chǎn)業(yè)健康有序發(fā)展。同樣,中國人民銀行印發(fā)的金融科技發(fā)展規(guī)劃中,也對金融行業(yè)“一云多芯”的發(fā)展以及相關金融云平臺應用標準提出了明確的目標及要求。浪潮信息配合某國有大型銀行進行了“一云多芯”的實踐,采用多種芯片服務器和云海OS,完成了核心MPP數(shù)倉產(chǎn)品的認證測試并實現(xiàn)大規(guī)模生產(chǎn)系統(tǒng)應用。同時,針對大數(shù)據(jù)、消息中心、緩存系統(tǒng)等核心業(yè)務平臺也全面開展了合作。浪潮信息參與建設的多個行業(yè)云平臺,在支持一云多芯的基礎上,遠程跨域管理、集群規(guī)模及線性擴展能力同樣達到業(yè)界領先水平,單資源池規(guī)模超過1000節(jié)點并可按控制器實現(xiàn)線性擴展,支撐了金融、能源、交通等行業(yè)云數(shù)智多樣化業(yè)務需求。
由此可見,遵從“以應用為導向、以系統(tǒng)為核心”的設計理念,秉承“分層解耦、開放標準”的“一云多芯”建設原則,在云計算步新的發(fā)展中顯得愈發(fā)重要,這必將加速IT產(chǎn)業(yè)生態(tài)的繁榮。