當(dāng)前,算力正以前所未有的姿態(tài)重塑著世界。
在上海臨港片區(qū)的中國電信“臨港智算谷”(以下簡稱“智算谷”)內(nèi),一場數(shù)字革命正悄然上演。科技時代,如何高效擁抱“數(shù)字”浪潮?從千卡到萬卡,十萬卡、百萬卡,這個趨勢是可持續(xù)的嗎?算力能為企業(yè)帶來哪些效能?在這里,能尋覓到答案。
步入智算谷機房,映入眼簾的是井然有序的機房景象,上千臺服務(wù)器整齊排列,猶如科技矩陣,在風(fēng)冷與液冷技術(shù)的雙重守護下高效運行,為各類前沿科技應(yīng)用提供著源源不斷的動力。
2023年9月,智算谷在行業(yè)期待中正式啟動,這不僅是上海臨港新片區(qū)發(fā)展歷程中的一個里程碑時刻,更是上海區(qū)域數(shù)字經(jīng)濟發(fā)展的強勁脈搏。尤為矚目的是,智算谷打造了中國電信“兩彈一優(yōu)”高標準AIDC示范基地,即彈性供電、彈性供冷與優(yōu)化氣流組織。2024年1月,上海電信重磅發(fā)布了全國首個單體萬卡液冷智算集群,作為長三角最大規(guī)模的運營商級算力資源,創(chuàng)新性的“魔方”式布局實現(xiàn)了單體超萬卡的極致集群能力,能夠支持萬億參數(shù)大模型訓(xùn)練。
數(shù)字推動經(jīng)濟變革,算力解鎖未來潛能。作為臨港新區(qū)數(shù)字化轉(zhuǎn)型的“橋頭堡”,臨港智算谷不僅肩負著推動科技創(chuàng)新和產(chǎn)業(yè)升級的重任,更承載著構(gòu)建可持續(xù)發(fā)展社會的愿景。
首個國產(chǎn)液冷萬卡算力池已啟用
站在一塵不染的2號樓機房內(nèi),冷風(fēng)在耳邊呼嘯,風(fēng)冷和液冷兩套系統(tǒng)同時運轉(zhuǎn),要將萬卡算力池運行所散發(fā)出的熱量轉(zhuǎn)移至另外一個空間,柜機上儀表盤顯示的數(shù)字表明機房正處于20攝氏度左右的標準溫度值區(qū)間!叭珖讉國產(chǎn)液冷萬卡集群就在我們眼前,目前在運行的已有6000卡,預(yù)計今年底前將實現(xiàn)萬卡!迸R港算力(上海)科技有限公司市場部經(jīng)理曹春說。
為了打通單池萬卡算力集群,而非將千卡池“拼”在一起,智算谷創(chuàng)新性的“魔方”式布局實現(xiàn)了單體超萬卡的集群能力。
如同魔都繁華地段的高架橋,上下層疊,左右延伸,似經(jīng)絡(luò)般貫穿城市肌理,“魔方”三層立體架構(gòu)便依靠核心交換機在中間樓層的巧妙布局,實現(xiàn)了Spine網(wǎng)絡(luò)層的近距離全鏈接,巧妙繞過了IB網(wǎng)絡(luò)50米傳輸?shù)木窒。每層樓單獨能承載10000張算力卡,為萬卡級別的超級集群開辟了新天地。
服務(wù)器內(nèi)部GPU總線帶寬飆至T比特級,令數(shù)據(jù)飛馳無阻。對外,每臺服務(wù)器如同擁有八車道的超級入口,提供400Gbps的高速接入。網(wǎng)絡(luò)構(gòu)建上,無論是追求速度的IB網(wǎng)絡(luò),還是兼顧效率與穩(wěn)定的ROCE無損以太網(wǎng),都能確保數(shù)據(jù)傳輸時延極低,前者不到1微秒,后者則需10微秒,真正實現(xiàn)數(shù)據(jù)交流的“零等待”,為高性能計算和人工智能的飛速發(fā)展鋪設(shè)了堅實的數(shù)字跑道。
“誕生”不到一年時間,臨港智算谷已為中國電信千億參數(shù)“星辰”大模型產(chǎn)品的運行奠定了堅實基礎(chǔ)。其中,星辰政務(wù)大模型已于2023年率先在上海12345市民熱線實現(xiàn)應(yīng)用落地。未來,還將為智慧城市、醫(yī)療、自動駕駛、金融等領(lǐng)域添光增彩。
如今,臨港智算谷既滿足了人工智能大模型訓(xùn)練高速網(wǎng)絡(luò)和算力需求,又保障超大集群內(nèi)部的高帶寬、低延遲、零丟包需求,為推動人工智能研究與應(yīng)用的邊界拓展提供了強大的基礎(chǔ)設(shè)施支持。
在這里,千卡、萬卡已經(jīng)實現(xiàn)。“只要技術(shù)持續(xù)進步,智能計算卡的性能將繼續(xù)提升,算力規(guī)模也會持續(xù)擴大!辈艽罕硎尽
“兩彈一優(yōu)”顯現(xiàn)創(chuàng)新能力
隨著GPU算力不斷攀升,對智算中心的供電、散熱等基礎(chǔ)條件提出了更高挑戰(zhàn)。
中國電信領(lǐng)先一步,采用創(chuàng)新的彈性模塊化設(shè)計方案,讓先進的風(fēng)冷與高效的液冷機柜能在同一機房和諧共存,液冷機柜能輕松應(yīng)對48千瓦的高功率需求,而風(fēng)冷機柜則在25千瓦以內(nèi)靈活調(diào)節(jié)。這種設(shè)計不僅高效還節(jié)能環(huán)保,為中國電信打造了“兩彈一優(yōu)”的超前數(shù)據(jù)中心示范點。
這里,“兩彈一優(yōu)”意味著供電和供冷都能隨需應(yīng)變。
想象一下,電力像水流一樣,在“水管”中自如流通,無論跨越樓層還是機房,都能快速、彈性地分配到每一臺服務(wù)器。而站在一列供冷系統(tǒng)面前,則能體驗到數(shù)臺智能空調(diào)開到最大風(fēng)力的感受,根據(jù)服務(wù)器的發(fā)熱情況進行自動調(diào)節(jié),確保每個機架都“涼爽”適宜。加上利用人工智能優(yōu)化的氣流管理,讓數(shù)據(jù)中心的冷空氣運用得恰到好處,既節(jié)約能源,又提升效率,為數(shù)字世界的綠色發(fā)展樹立了新標桿。
液冷技術(shù)相較于傳統(tǒng)風(fēng)冷模式,能顯著降低數(shù)據(jù)中心的PUE(電源使用效率)值。智算谷的一般PUE值可達到國家新建數(shù)據(jù)中心1.25的標準,部分區(qū)域更是達到1.08,接近理想水平。
盡管液冷系統(tǒng)的初期投資成本較高,大約比傳統(tǒng)系統(tǒng)高出20%~30%,但其帶來的長期節(jié)能效益與穩(wěn)定性優(yōu)勢,使它成為目前高性能計算服務(wù)器的優(yōu)選方案。
算力背后,節(jié)能更重要
在當(dāng)今科技日新月異的浪潮中,中國算力產(chǎn)業(yè)正以破竹之勢飛速前行。
截至2023年底,我國算力服務(wù)的在用機架總量已突破810萬個,穩(wěn)居全球第二。伴隨算力需求的激增,電力供應(yīng)面臨前所未有的挑戰(zhàn),全球數(shù)據(jù)中心的電力消耗預(yù)計將在四年間翻番,達到1050太瓦時,中國亦不例外,數(shù)據(jù)中心耗電量占全社會用電量的比例逐年上升,2022年已達到約3%。
在這一背景下,綠色算力成為緩解“比特與瓦特”這對“最強能源CP”供需矛盾的關(guān)鍵解法。
早在幾年前,中國電信便開始在青浦區(qū)和臨港新片區(qū)前瞻布局“東西兩翼”智算中心,支撐人工智能產(chǎn)業(yè)發(fā)展,加大智算基礎(chǔ)設(shè)施投入。2021年成立的臨港算力(上海)科技有限公司,建設(shè)運營中國電信臨港園區(qū)智算基礎(chǔ)設(shè)施建設(shè)項目,并將項目打造成中國電信臨港智算中心。
臨港智算谷率先落地實施應(yīng)用,整體占地300畝,分三期建設(shè),目前一期規(guī)劃10萬張卡,包括訓(xùn)練、推理、渲染等各類算力集群。在“碳中和、碳達峰”的大背景下,智算谷在設(shè)計之初就融入了綠色低碳的理念,風(fēng)能、光伏等設(shè)施均在園區(qū)內(nèi)可落座的區(qū)域搭建,與自然環(huán)境和諧共生,液冷技術(shù)的應(yīng)用不僅大幅提升了能源利用效率,更是大大降低了運營成本。
作為該地區(qū)首個實現(xiàn)220千伏直供園區(qū)的項目,其電力供應(yīng)系統(tǒng)的可靠性與應(yīng)急準備的周密性可見一斑。變電站與柴油發(fā)電機的配置,不僅確保了電力供應(yīng)的不間斷,也為應(yīng)對突發(fā)情況提供了堅實保障。
在2號樓的供電監(jiān)控室內(nèi),一面壯觀的模擬控制面板引人注目。各式表盤與指示燈交織,紅綠藍三色光點交織閃爍,如同精心編排的燈光秀,實則是園區(qū)電網(wǎng)健康狀況的直觀反映。數(shù)十根線條在面板上交錯縱橫,每一條線路都承載著智算谷服務(wù)器的正常運轉(zhuǎn)和輸出!斑@里的供電設(shè)備可以負載智算谷一期全部電力,目前的負載率占總電力的10%!惫ぷ魅藛T介紹道。
當(dāng)下,臨港智算中心正積極探索綠電應(yīng)用,與多方合作引入光伏等可再生能源。通過虛擬電廠等創(chuàng)新模式,提高能源使用效率,并有望參與電力市場交易,為數(shù)據(jù)中心運營帶來更多經(jīng)濟效益,同時減輕社會能源負擔(dān),尤其是在用電高峰期。
隨著數(shù)據(jù)洪流的不斷涌動,算力作為支撐人工智能、大數(shù)據(jù)、云計算等高新技術(shù)的基石,正以前所未有的姿態(tài)重塑著世界。(完)
注:請在轉(zhuǎn)載文章內(nèi)容時務(wù)必注明出處!
編輯:許兵