超算互聯(lián)網:讓算力走進千行百業(yè)
深入推進建設以國家超算互聯(lián)網為代表的新一代算力網絡基礎設施,并不能靠簡單的算力堆砌,而是要實現(xiàn)網絡、算力調度、產業(yè)鏈、數據要素治理等多方面的資源協(xié)同,強化東西部跨域統(tǒng)籌發(fā)展。
吳曉明 國家超級計算濟南中心主任
讓算力像電力一樣走進千家萬戶、賦能千行百業(yè),這一20年前提出的設想如今正成為現(xiàn)實。8月26日,2023年CCF全國高性能計算學術年會在山東省青島市落下帷幕,超算互聯(lián)網成為與會專家學者熱議的話題。
目前,我國算力網絡基礎設施不斷完善,各行各業(yè)數字化進程持續(xù)加速,人工智能、數字孿生等技術迅速發(fā)展,對算力,尤其是高性能算力的需求呈爆發(fā)式增長。與此同時,高性能算力地區(qū)供需分布不均、應用生態(tài)不完善、持續(xù)運營困難等問題制約著我國數字經濟高質量發(fā)展。在這一背景下,超算互聯(lián)網應運而生,成為破解我國超算發(fā)展難題的一把關鍵“鑰匙”。
用互聯(lián)網思維發(fā)展超算服務
作為當之無愧的“國之重器”,超級計算機距離我們的日常生活并不遙遠。小到每天看到的天氣預報,大到國產大飛機C919,背后都有超算的身影。中國工程院院士、清華大學計算機系教授鄭緯民表示,超算如今已廣泛應用于氣象預測、生物制藥、航空工業(yè)等領域,并在產業(yè)數字化過程中發(fā)揮著重要作用。
鄭緯民指出,我國超算的實力毫無疑問處于國際第一梯隊。在6月份發(fā)布的最新一期全球超算500強榜單中,我國有兩臺超級計算機位列前十,超級計算機總數更是達到了134臺,位列全球第二。
但也應該看到,我國超算面臨著算力設施分布不均衡、水平參差不齊、應用軟件自主研發(fā)和推廣應用不足等問題。國家超級計算濟南中心主任吳曉明表示,由于超算的技術門檻比較高,且尚未形成豐富的應用軟件生態(tài),目前超算的應用仍局限于比較傳統(tǒng)的高性能計算領域,如天氣預報、大型工程設計、基礎科學研究等。
超算互聯(lián)網的核心目標是讓超級計算機實現(xiàn)從傳統(tǒng)的提供算力到提供服務的革命性轉變?!拔覀兿Mㄟ^打造超算互聯(lián)網,把各個超算中心連在一起,形成更大的算力平臺,并且利用互聯(lián)網思維,打造更為豐富的超算應用生態(tài),從而能夠直接通過平臺對外提供超算服務?!眳菚悦鞅硎?,超算互聯(lián)網及其應用生態(tài)的打造,將有利于降低超算應用的門檻,讓超算從“陽春白雪”走向普及普惠,加快滲透千行百業(yè)、走進千家萬戶。
未來,有超算需求的用戶可以直接打開超算互聯(lián)網,實現(xiàn)一站式的超算產品瀏覽、下單、支付、應用等。用戶看到的將不再是某個超算中心、某臺計算機,而是一個能夠直接解決問題的完整應用軟件或解決方案?!拔覀兿M慊ヂ?lián)網未來能像淘寶、京東一樣,直接向用戶提供可應用的超算產品,降低超算的應用門檻,更好地賦能數字經濟發(fā)展?!眳菚悦髡f。
研發(fā)新技術破解互聯(lián)難題
超算互聯(lián)網的關鍵在于互聯(lián)。只有實現(xiàn)高速互聯(lián),分布在各地的超算資源才有可能整合為一個有機整體,面向各行各業(yè)提供高性能的計算服務?!半m然叫作超算互聯(lián)網,但在網絡中流動的并不是算力,而是數據。”國家超級計算濟南中心副主任潘景山表示,在超算互聯(lián)網中,數據的傳輸速度直接影響到計算效率。
影響數據傳輸速度的兩大因素是帶寬和延遲。帶寬即單位時間內能夠通過的最大數據量,延遲則是信息在傳輸介質中傳輸所用的時間。
“比如,在網絡正常的情況下,從北京的清華大學傳輸4T大小的數據到江蘇的國家超級計算無錫中心太湖之光超級計算機需要5天。但若我們把數據都刻成盤,然后用快遞寄過去,第二天下午就到無錫了?!闭劶澳壳皫捿^低、延遲較高帶來的影響,鄭緯民形象地解釋道。
目前我國正式掛牌的超算中心有十余家。讓這十余家超算中心連在一起成為一臺“大機器”,需要網絡具有極高的帶寬和極低的延遲。高帶寬、低延遲實現(xiàn)起來并不容易。
“以往我們用的光纖鏈路最大的帶寬約為100G或200G,每百公里延遲約為1.5毫秒,但這并不能滿足超算互聯(lián)網建設的需求?!迸司吧浇榻B,通過持續(xù)攻關,國家超級計算濟南中心已在高速網絡通信、網絡資源感知調度、算力網絡融合和安全方面突破了一批關鍵技術,并首次建立起了基于長距IB通信技術的濟南—青島超算互聯(lián)網試驗網,它的帶寬達400G,500公里通信距離的網絡延遲由原先的雙向10毫秒以上降低至5毫秒左右?!巴ㄟ^這一網絡,濟南、青島兩地的超級計算機可以連接成一個整體,發(fā)揮更大的作用。”潘景山舉例道,當借助濟南—青島超算互聯(lián)網試驗網進行地球系統(tǒng)模擬計算時,可以將其拆分為大氣和海洋兩個模式,在兩地分別進行協(xié)同計算,大大提升計算效率。
高帶寬、低延遲給超算互聯(lián)網帶來的極致性能,也將顯著擴大其在產業(yè)中的應用規(guī)模。例如國家超級計算濟南中心與濰柴集團合作開展的發(fā)動機仿真模擬計算項目,產生的數據量達到TB級?!叭绻覀冇脗鹘y(tǒng)互聯(lián)網傳輸這些數據,可能需要傳2—3天,對設計人員來說,這嚴重影響工作效率?!迸司吧奖硎?,借助高帶寬、低延遲的超算互聯(lián)網,TB級的數據量只需極短時間便可完成傳輸。“如果說傳統(tǒng)互聯(lián)網是數據傳輸的‘高速公路網’,那么高帶寬、低延遲的超算互聯(lián)網則是運行能力成倍提升的‘高鐵網’?!迸司吧饺缡钦f。
壯大平臺生態(tài)賦能產業(yè)發(fā)展
相比傳統(tǒng)的超算應用模式,超算互聯(lián)網可提供統(tǒng)一、完整的超算服務。實現(xiàn)這個目標,需要在運營模式、平臺生態(tài)、產業(yè)培育等方面同步發(fā)力。
“我們深知,深入推進建設以國家超算互聯(lián)網為代表的新一代算力網絡基礎設施,并不能靠簡單的算力堆砌,而是要實現(xiàn)網絡、算力調度、產業(yè)鏈、數據要素治理等多方面的資源協(xié)同,強化東西部跨域統(tǒng)籌發(fā)展。”吳曉明建議,超算互聯(lián)網未來發(fā)展需要連接產業(yè)生態(tài)中的算力供給、應用開發(fā)、運營服務、用戶等各方能力和資源,構建一體化超算算力網絡和服務平臺。同時,還需要緊密連接供需雙方,通過市場化的運營和服務體系,實現(xiàn)算力資源統(tǒng)籌調度,降低超算應用門檻,并推動計算技術向更高水平發(fā)展,促進核心軟硬件技術深度應用,輻射帶動產業(yè)生態(tài)的發(fā)展與成熟。潘景山也指出,應聯(lián)合超算中心、運營商、軟件供應商和用戶合作建設超算互聯(lián)網,打造超算共同體,這樣才能讓我國數字經濟真正實現(xiàn)以“高鐵速度”發(fā)展。
高性能算力能夠驅動產業(yè)的發(fā)展,大范圍、大規(guī)模的產業(yè)應用也能為算力升級提供動力。目前,國家超算互聯(lián)網平臺已開放第三方企業(yè)入駐,并明確了入駐企業(yè)條件:可提供基礎超算IAAS服務等基礎資源;提供行業(yè)應用軟件資源;提供多學科行業(yè)應用服務等平臺資源;提供多樣數據模型、源碼等資產資源,以及提供各種類型的算力服務。截至8月,已有35家超算上下游單位成功入駐國家超算互聯(lián)網平臺,另外有近百家單位遞交了聯(lián)合體入會申請,這將為超算互聯(lián)網平臺持續(xù)注入活力。(記者都芃 通訊員 申暢 王聰)
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。