以智算中心加快形成新質(zhì)生產(chǎn)力
發(fā)布時間:2024-10-31 點擊:287
近年來,生成式人工智能(AIGC)技術(shù)的快速發(fā)展,極大地提升了人工智能的應(yīng)用范圍和服務(wù)水平,使人工智能具備了先進的生產(chǎn)創(chuàng)作和決策支撐能力,更好地服務(wù)于人們的生產(chǎn)生活。與此同時,作為AIGC的基礎(chǔ),大模型在訓(xùn)練過程中,需要大規(guī)模智能算力的支撐。
我國持續(xù)支持智算產(chǎn)業(yè)發(fā)展,加快推動數(shù)字經(jīng)濟和實體經(jīng)濟融合發(fā)展,并面向經(jīng)濟社會發(fā)展和國家重大戰(zhàn)略需求,充分發(fā)揮算力驅(qū)動作用,以智算中心為抓手協(xié)同帶動智算上下游產(chǎn)業(yè)發(fā)展,為數(shù)字經(jīng)濟高質(zhì)量發(fā)展注入了新動能。2023年10月,工信部等六部門聯(lián)合發(fā)布《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,提出到2025年,我國算力規(guī)模超過300EFlops,智能算力占比達到35%。同時,在重點任務(wù)中提出鼓勵各方創(chuàng)新探索智算建運模式和多方協(xié)作機制,滿足智算在公共場景中的應(yīng)用需求。
順應(yīng)數(shù)字經(jīng)濟大潮,全國各地均在積極布局算力賽道,為我國經(jīng)濟發(fā)展提供了強大的算力支撐。從算力規(guī)模來看,截至2023年6月,我國智能算力規(guī)模占整體算力規(guī)模比例提高到25.4%,增速達到45%。從建設(shè)布局來看,包括北京、上海、深圳、武漢、西安、成都、南京、大連等在內(nèi),全國已有超過30個城市正在積極推動智算中心建設(shè),北上廣等東部城市智算中心建設(shè)數(shù)量多且規(guī)模大。從產(chǎn)業(yè)生態(tài)來看,我國已形成了涵蓋供配電、制冷、異構(gòu)芯片、算法、框架為一體的智算產(chǎn)業(yè)鏈,且產(chǎn)業(yè)鏈各環(huán)節(jié)均有國內(nèi)廠商參與。智算產(chǎn)業(yè)發(fā)展面臨的挑戰(zhàn)主要表現(xiàn)為四個方面。
一是單體智算中心規(guī)模較小,“小高爐煉鐵”模式難以為大模型數(shù)據(jù)訓(xùn)練提供足夠的算力支持。大模型進行模型訓(xùn)練需要大量智能算力支撐,隨著模型規(guī)模的不斷提升,完成模型訓(xùn)練所需的智能算力規(guī)模也在持續(xù)提升。以GPT為例,訓(xùn)練一次需要的總算力約為3640PF-days,即假如每秒計算一千萬億次,需要計算3640天。我國現(xiàn)有智算中心規(guī)模大多在100P~200P,單體規(guī)模不足,難以支撐大模型訓(xùn)練。
二是自研芯片性能與國外品牌存在差距,存在基礎(chǔ)不牢的風(fēng)險。當(dāng)前,全球智算芯片市場以英偉達為主,技術(shù)水平處于絕對領(lǐng)先地位。為突破國外限制,國產(chǎn)芯片廠商不斷創(chuàng)新突破,涌現(xiàn)出華為、寒武紀等一批優(yōu)秀智算芯片企業(yè),基本能夠滿足推理場景下的算力需求,但由于單芯片能力與國外品牌仍存在較大差距,在支撐海量數(shù)據(jù)訓(xùn)練時表現(xiàn)不足,難以有效推動智算產(chǎn)業(yè)高效研發(fā)及應(yīng)用。
三是現(xiàn)有網(wǎng)絡(luò)難以適應(yīng)智算互聯(lián)需求,亟需以太網(wǎng)技術(shù)革命性突破。與通用計算相比,智算卡間通信以及算存設(shè)備間通信變得更為頻繁,鏈路流量明顯增大,對擁塞、丟包等網(wǎng)絡(luò)問題更為敏感。傳統(tǒng)以太網(wǎng)在擁塞控制、帶寬等方面表現(xiàn)不足,IB網(wǎng)絡(luò)可實現(xiàn)服務(wù)器間高速互聯(lián),但技術(shù)封閉且長期由國外廠商掌握。中國信通院、中國移動等國內(nèi)企事業(yè)單位正在積極推動以太網(wǎng)技術(shù)創(chuàng)新。
四是智算功率密度大幅提升,對供配電、制冷等配套設(shè)施提出了新的要求。為了適應(yīng)海量數(shù)據(jù)大規(guī)模運算,智算服務(wù)器、處理器性能相對更高,且服務(wù)器大多采用高密部署,其功率是通用服務(wù)器的數(shù)倍,這對電源功率、供電效率、安全保護等提出了更高的要求。除此之外,由于功率的提升,服務(wù)器散熱量也進一步提高,傳統(tǒng)風(fēng)冷解決方案亟需創(chuàng)新突破,以滿足智算發(fā)展要求。(作者:中國信息通信研究院云大所總工程師,正高級工程師 郭亮)