品質(zhì)算力服務(wù)助力“好”算力
勢頭好、新突破我國算力總規(guī)模居世界前列
近年來,我國扎實推進算力基礎(chǔ)設(shè)施建設(shè),不斷強化產(chǎn)業(yè)創(chuàng)新能力,持續(xù)推動算力應(yīng)用落地。據(jù)中國信息通信研究院測算,截至2023年底,全球算力基礎(chǔ)設(shè)施總規(guī)模達到910EFLOPS(FP32),同比增長40%。美國、中國算力基礎(chǔ)設(shè)施規(guī)模位列前兩名,算力占比分別為32%、26%。與此同時,我國算力結(jié)構(gòu)不斷調(diào)整,智算規(guī)模增長勢頭強勁;存力規(guī)模持續(xù)擴大,先進占比不斷提升;運力質(zhì)量顯著提升,網(wǎng)絡(luò)設(shè)施不斷升級。截至2024年6月,我國在用算力中心超過830萬標準機架,算力規(guī)模達246 EFLOPS(FP32),智算同比增速超過65%。
在這背后,得益于產(chǎn)業(yè)鏈的扎實推進,積極推動算力網(wǎng)絡(luò)從概念創(chuàng)新到產(chǎn)業(yè)實踐應(yīng)用的落地。比如,中國電信已構(gòu)建云智、訓推一體的算力布局,在京津冀、長三角建成國內(nèi)領(lǐng)先的全液冷萬卡池,31個省級行政區(qū)部署推理池,智能算力規(guī)模達到21 EFLOPS。中國移動已初步建成業(yè)界領(lǐng)先的算力網(wǎng)絡(luò),并在河南規(guī)劃建設(shè)了中原人工智能計算中心,成為全國首個社會算力并網(wǎng)商用案例,目前中國移動智算規(guī)模超26 EFLOPS。中國聯(lián)通已建成260多個資源池,覆蓋超200個地市,實現(xiàn)三線以上城市通算能力全面覆蓋,并打造兩個萬卡智算集群,縱深推進智能算力梯次化布局打造場景化、專業(yè)化、差異化的智算算力服務(wù),推出“AICC算力集群”“AICP算力平臺”“星羅先進算力調(diào)度平臺”“AI邊緣一體機”“云GPU”五大智算產(chǎn)品,升級面向智算需求的創(chuàng)新服務(wù)。
當前,我國緊密跟蹤算力產(chǎn)業(yè)發(fā)展趨勢,持續(xù)出臺相關(guān)政策,促進算力基礎(chǔ)設(shè)施的高質(zhì)量發(fā)展。隨著我國智能計算中心建設(shè)火熱,越來越多地方政府積極開展前瞻布局,加快推動人工智能計算中心規(guī)劃建設(shè),支撐和引領(lǐng)數(shù)字經(jīng)濟、智能產(chǎn)業(yè)、智慧城市以及智慧社會的發(fā)展。
然而,算力創(chuàng)新技術(shù)的更迭和業(yè)務(wù)發(fā)展依然面臨諸多挑戰(zhàn)。由于算力規(guī)模的不斷增長,算力能耗問題日益突出?!吨袊撬阒行姆?wù)發(fā)展報告》顯示,2022年我國數(shù)據(jù)中心能耗總量1300億千瓦時,同比增長16%;2023年,我國數(shù)據(jù)中心能耗總量1500億千瓦時,同比增長15.4%;按目前的增長速度,預(yù)計到2030年,我國數(shù)據(jù)中心耗電量將超過4000億千瓦時。
其次,供需配置匹配度低,硬件資源利用率不足。智能計算涉及CPU、GPU、TPU等多種類型的硬件資源,異構(gòu)環(huán)境下難以實現(xiàn)虛擬資源的統(tǒng)一高效管理。由于計算任務(wù)類型、規(guī)模和優(yōu)先級各不相同,資源難以充分分配,任務(wù)需求規(guī)格往往與硬件配置無法對齊,導致算力資源碎片化。
此外,大型智算中心組件眾多、產(chǎn)品種類繁雜,組網(wǎng)規(guī)模龐大,不同廠商之間存在較高的技術(shù)壁壘和各自獨立的生態(tài)系統(tǒng),導致計算平臺多樣化,資源調(diào)度和能耗分發(fā)難以統(tǒng)一。智算中心在容量、流量、功耗方面面臨指數(shù)級增長的挑戰(zhàn),運行過程中出錯風險增加,威脅到業(yè)務(wù)的安全性和可靠性,運營團隊也難以及時適應(yīng)市場與客戶的變化需求。
在開發(fā)方面,大模型的訓練對資源需求較高,且遷移部署難度大,模型訓練中存在很多的不穩(wěn)定性和不確定性。隨著模型規(guī)模的擴大,訓練過程變得更加復(fù)雜和難以預(yù)測。在軟硬件協(xié)同方面,需要處理底層硬件差異,涉及技術(shù)、管理和運營等多個層面的挑戰(zhàn)。同時,協(xié)調(diào)工作還需從整體規(guī)劃建設(shè)到持續(xù)運營維護的宏觀角度,進行全方位的統(tǒng)籌考慮。
如何進一步推動智算產(chǎn)業(yè)發(fā)展、創(chuàng)新,更好地把握人工智能、數(shù)據(jù)要素和數(shù)字經(jīng)濟發(fā)展的歷史機遇?在近日舉辦的2024中國算力大會“智算集成服務(wù)論壇”上,多位大咖齊聚一堂,共同探討最優(yōu)解。
中國信息通信研究院副院長魏亮提綱挈領(lǐng)式地提出3點建議:一是進一步激發(fā)產(chǎn)業(yè)的創(chuàng)新能力,廣泛聯(lián)合科研院所、高校、領(lǐng)軍企業(yè)聚焦智能算力、算力芯片、算法優(yōu)化等關(guān)鍵技術(shù)領(lǐng)域,突破技術(shù)瓶頸,提升算力效能、碳效表現(xiàn)。同時鼓勵跨界融合,促進算力技術(shù)和人工智能、大數(shù)據(jù)、區(qū)塊鏈等新興技術(shù)的深度融合,推動算力技術(shù)向更高層次、更廣領(lǐng)域邁進。二是進一步深化智算的應(yīng)用場景,積極推動智算技術(shù)和各行業(yè)深度融合,特別是在智慧交通、智慧城市、智慧醫(yī)療等領(lǐng)域,積極探索并構(gòu)建智算中心服務(wù)新模式,加速傳統(tǒng)產(chǎn)業(yè)的數(shù)字化、智能化轉(zhuǎn)型。通過算力賦能,助力企業(yè)提升生產(chǎn)效率,優(yōu)化運營模式、創(chuàng)新服務(wù)模式,為社會經(jīng)濟發(fā)展注入強大動力。三是進一步完善產(chǎn)業(yè)的生態(tài)體系,深化各行業(yè)的交流合作,推動全社會用數(shù)賦質(zhì),構(gòu)建互利共贏的開放合作新生態(tài),依托中國算力平臺,高效整合資源,深化智算產(chǎn)業(yè)鏈的上下游企業(yè)的協(xié)同,推動技術(shù)創(chuàng)新與產(chǎn)業(yè)融合。
“AI不僅是一門技術(shù),更是新的生產(chǎn)關(guān)系和新的綜合生產(chǎn)力,要發(fā)揮出其真正的價值,除了持續(xù)的技術(shù)和產(chǎn)品創(chuàng)新,更需要通過優(yōu)質(zhì)的高效的服務(wù)加速行業(yè)數(shù)字化轉(zhuǎn)型的落地,真正實現(xiàn)用得上、用得好、用得放心,共贏智算的新時代?!?/span>華為服務(wù)Fellow、2012服務(wù)實驗室主任孫虎在會上表示。華為基于智算項目集成實踐以及30多年在服務(wù)領(lǐng)域的積累,對智算服務(wù)提出“三縱三橫”的建議。具體來看,“三縱”是指圍繞智算服務(wù)三個垂直的價值流(智算平臺建設(shè)、智算模型和應(yīng)用使能、智算系統(tǒng)的運維運營),“三橫”是指圍繞智算服務(wù)的三個水平能力帶(服務(wù)規(guī)范的標準化、服務(wù)能力模型化、服務(wù)人才綜合化)?;凇叭v三橫”,打造智算三個高地——能力高地、人才高地、生態(tài)高地,讓算力系統(tǒng)更高效、更穩(wěn)定、更安全,加速算力中心高質(zhì)量發(fā)展,真正讓智能無所不在、無所不至、無所不及。
在2024華為全聯(lián)接大會上,中國工程院院士倪光南曾提出,要用工程系統(tǒng)思維統(tǒng)籌規(guī)劃智算集群建設(shè),以標準引領(lǐng)智算產(chǎn)業(yè)高質(zhì)量發(fā)展。他強調(diào),智算集群是引領(lǐng)這一時代發(fā)展的主要新質(zhì)生產(chǎn)力,是支撐數(shù)字中國建設(shè)和數(shù)字經(jīng)濟運行的重要基礎(chǔ)設(shè)施。要實現(xiàn)高質(zhì)量智算建設(shè),需在大力發(fā)展算力、存力、運力的同時還要注重加強智算集群的服務(wù)體系建設(shè)。
“大集群不等于大算力,如何更加有效地利用現(xiàn)有的算力資源,需要算力、存力、運力與智算服務(wù)緊密協(xié)同的‘3+1’算力產(chǎn)業(yè)體系保駕護航?!?/span>華為IT咨詢與系統(tǒng)集成領(lǐng)域總裁張岳普談到。區(qū)別于通用計算時代分層解耦的建設(shè)和運維模式,全棧的智算建設(shè)工程系統(tǒng)需要統(tǒng)一規(guī)劃和建設(shè),整體考慮生命周期服務(wù)。華為智算集成打造的品質(zhì)算力平臺服務(wù),涵蓋了數(shù)據(jù)中心Facility集成、算力/存力/網(wǎng)絡(luò)基礎(chǔ)設(shè)施的統(tǒng)一規(guī)劃與集成、AI計算使能與優(yōu)化、運維保障的全棧服務(wù)解決方案。目前華為已為全球300多個大規(guī)模的廠家、運營商、互聯(lián)網(wǎng)等領(lǐng)域客戶建立了整體的算力平臺。建好、用好、管好算力是智算產(chǎn)業(yè)鏈共同的目標,華為積極打造品質(zhì)算力服務(wù),支撐客戶建設(shè)高質(zhì)量算力集群,加速行業(yè)智能化升級。
算力是賦能產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)要素,對推動數(shù)字中國建設(shè)、實現(xiàn)中國式現(xiàn)代化具有重要意義。單絲不成線,獨木不成林。聚力,為釋放每一份算力。建好、用好、管好算力需要產(chǎn)業(yè)鏈上下游攜手共進,構(gòu)建適應(yīng)中國式現(xiàn)代化發(fā)展的算力產(chǎn)業(yè)體系,共筑算力高地。