近日,中共中央、國務院印發(fā)《數字中國建設整體布局規(guī)劃》,提出系統(tǒng)優(yōu)化算力基礎設施布局,促進東西部算力高效互補和協(xié)同聯(lián)動,引導通用數據中心、超算中心、智能計算中心、邊緣數據中心等合理梯次布局;科技部啟動國家超算互聯(lián)網部署工作,通過超算互聯(lián)網建設打造國家算力底座,促進超算算力的一體化運營,助力科技創(chuàng)新和經濟社會高質量發(fā)展……
算力建設,已成為夯實數字中國建設基礎、打通數字基礎設施大動脈的重要手段。而作為科學研究和人才培養(yǎng)重地的高校,隨著科研、教學、管理對算力需求的不斷增加,也掀起了一股算力建設浪潮。
2023年4月,復旦大學透露,正與阿里云共建中國高校最大的科研算力平臺,預計在6月正式上線試運行;2021年12月,中國高校最強算力基座“思源一號”落戶上海交通大學;2020年,南京航空航天大學成立校級高性能計算中心,在運維管理、科研服務、課程開發(fā)等方面開展了一系列有益探索;2019年,西湖大學高性能計算中心成立,為學?!案咂瘘c、小而精、研究型”的辦學定位提供堅實的高性能計算基礎支持……
在數字化轉型的大時代,高校算力服務發(fā)展也處在風口。高校算力服務現狀如何?如何建設算力平臺?如何服務師生用戶?如何持續(xù)不斷發(fā)展?這些問題都有待探索和解答。
高校算力服務發(fā)展狀況
近年來,我國高校算力服務得到了迅速發(fā)展和提升。許多高校紛紛建立了自己的算力中心,并且不斷擴大硬件設施和軟件服務范圍。算力服務形式多樣,包括高性能計算集群、虛擬化技術支持的云計算平臺、自主研發(fā)的數據中心等各種形式,為高校師生用戶提供了大規(guī)模的計算存儲資源。
總體來看,目前許多重點高校已具備了成熟的建設和運營模式,二三線高校也正處于成長期,不斷加大對算力的投入力度,增強計算能力。
據介紹,從算力建設來看,校級超算中心的通常規(guī)模在“百節(jié)點、萬核心”,日常使用率都達到80%以上。高校超算承擔著高校科研團隊的學生教學培養(yǎng)和科研項目所需的中小規(guī)模計算任務,成為我國新型算力網絡體系中不可或缺的組成部分。
從運營模式來看,目前大部分高校仍處于向校內提供計算服務、幫助用戶學習使用超算的階段;部分頭部高校則已經開始積極探索計算驅動的交叉學科發(fā)展模式,推動更多符合我國科研實際情況的自主可控超算軟件的研發(fā)。
但從整體來看,高校的算力儲備還很不足,算力使用也很不均衡。一項相關調研顯示,當前,大約8.4%的高校已建設校級算力平臺,校級算力平臺的運算能力主要分布在250Tflops以下;存儲空間主要分布在500TB以下。[1]
在算力平臺運營過程中,高校也面臨諸多問題和挑戰(zhàn),如設備更新速度緩慢、平臺管理和運維水平不高、人才團隊建設受困于機制、算力儲備難以滿足科研數據增長等。
此外,高校用戶對算力服務的需求也越來越高。除了大規(guī)??蒲袛祿奶幚矸治龊驮诰€教學平臺支持,用戶還希望算力中心能提供“性價比高”“按需供給”“提供完整的解決方案”“安全可靠”“資源共享”“云計算”“免費測試”等算力服務。
算力支撐高??蒲薪虒W管理
在高等教育領域,數字化轉型已成為推動高等教育創(chuàng)新發(fā)展,培養(yǎng)適應信息時代人才的大勢所趨。數字化轉型需要大量的計算資源和技術支撐,這就為算力服務提供了發(fā)展空間,讓算力服務成為高校數字化轉型中不可或缺的一部分。
通過算力服務,高??梢钥焖佾@取必要的計算資源和技術支持,實現數字化轉型的各種需求。在對高校算力中心的調查和采訪中,我們得知,算力服務對高校數字化轉型的支持主要體現在以下幾個方面:
一是科研支持。
高??蒲行枰罅康挠嬎阗Y源和數據存儲空間,而算力平臺可以為高校研究人員提供高效、可靠的科學研究環(huán)境。在科學研究中,算力服務可以為高校提供大量的計算資源,人們可以在云端進行模擬、計算等處理,進一步提高研究效率和研究成果??蒲兴懔Φ奶嵘惋w躍,使得研究人員將有機會探索和嘗試各種新事物,有助于加快解決人們面臨的各種棘手問題。
例如,南京航空航天大學高性能計算中心提供的科研服務包括科學計算和仿真計算,覆蓋學校所有理工科學院、科研技術部門和部分文科學院;對華中農業(yè)大學作物遺傳改良全國重點實驗室來說,計算平臺助力實驗室完成生物學研究的重要手段基因組測序,并對測序的數據進行存儲分析。
二是教學支持。
通過算力服務,高??焖俅罱ㄔ诰€教育平臺,在云端構建虛擬課堂、制定個性化教學方案、開展遠程教學等活動。而學生則可以通過網絡學習、在線交流和互動學習等方式,獲取更加豐富和高效的學習體驗。同時,算力服務還可以為高校提供強大的課程管理系統(tǒng),幫助高校更好地管理和組織課程資源。
以上海交通大學為例,將計算深度融入教學,是富有交大特色的定制教學模式。交大組建了專職教輔團隊,與專業(yè)課老師共同改造計算相關課程。交大還在教學支撐中使用最先進的計算平臺,免費向校內師生提供優(yōu)質的計算服務。優(yōu)質的計算資源為課程升級賦能,讓學生的使用體驗、教師的教學成果都顯著提升。
三是管理支持。
通過算力服務支撐,高??梢詫⒔逃虒W、學生管理、課程管理等業(yè)務實現信息化、數字化,簡化運營和管理過程,提高教學與管理效率。
算力作為數字時代新的生產力,正廣泛融合到社會生產生活的各個方面。在高校,算力作為一種重要的基礎設施,具有廣泛的應用前景,其重要性和地位將不斷彰顯,為教育領域的數字化轉型提供有力的支撐和保障。
人工智能之火點燃算力需求
日前,ChatGPT和GPT-4等以大型語言模型(LLM)為代表的通用人工智能工具爆火,表明人工智能到了一個新的發(fā)展階段,可能成為推動社會發(fā)展和科研創(chuàng)新的顛覆性工具。無論是計算分析還是人工智能領域的研究,都依賴于高質量成規(guī)模的算力。
上海交通大學網絡信息中心副主任林新華認為,GPT-4的出現引爆了算力危機,但也引起民眾對算力的關注,讓算力對人工智能的重要性成為一種共識。
“這些需求投射至高等學校,就體現在對高校計算中心或超算中心建設的要求?!蔽骱髮W超算中心技術主任李南表示。
高校作為基礎研究的主陣地,正扛起推進AI研發(fā)和應用的大旗,如何構建AI所需的超高算力并加速科研成果轉化,也早已悄悄提上日程。北京大學高性能計算平臺主任工程師樊春表示,當前有很多科研項目既需要超算算力,又需要智算算力,從應用的需求上看就需要將這兩種算力融合。計算支撐部門則要順應時代潮流,為學校人工智能發(fā)展提供更多的支撐服務。比起分別建設算力平臺和人工智能平臺,高??梢钥紤]建立人工智能和超算的融合平臺。
進一步推動高校算力服務建設
面對未來,隨著GPU等協(xié)處理器技術、大數據、人工智能技術的發(fā)展,高校將越來越依賴于算力,算力平臺的建設也將越來越重要。下一步,高校算力服務建設應該從哪方面發(fā)力?在調查和采訪中,我們總結出,進一步推動高校算力服務發(fā)展可以從以下幾方面布局:
第一,計算團隊建設。
超算的管理是非常專業(yè)的,需要專門的研究和管理團隊。當前,很多高校在超算的硬件設備投入上并不差,但超算中心能夠提供的服務往往受限于團隊的規(guī)模和能力。
首先,除了計算機學科領域出身的人才,計算團隊還需要應用行業(yè)領域出身的人才,才能在提供計算服務中更好地溝通交流。在這方面,上海交通大學組建了具有“學科融合”特色的計算團隊,將計算思維培養(yǎng)融入專業(yè)課教學中,并讓科研團隊專注于科研創(chuàng)新,讓算力服務充分支撐教學和科研。
其次,面對人才編制等方面的限制和要求,算力團隊建設不應局限于計算中心的有限范圍,要拓展思維,加強與其他部門的合作,設計好相應的體制機制,打造建設、運維、管理、宣傳的全鏈條人才團隊。
此外,由于算力人才在互聯(lián)網和其他IT行業(yè)可能擁有廣泛的職業(yè)選擇和晉升機會,因而高校需要特別關注人才待遇和職業(yè)規(guī)劃。在這方面,中國科學技術大學出臺了技術支撐績效管理辦法。績效以技術支撐學??蒲械馁|量、貢獻和影響以及人才培養(yǎng)成效為導向,綜合考慮技術支撐工作者年度工作情況,建立了科學合理的評價標準。
第二,建設模式選擇。
從校級算力平臺的所屬單位看,比起隸屬院系,或隸屬獨立的計算中心,將校級算力平臺放在網絡中心/信息中心可以更加專注于服務,對各院系和學科更中立更公正。中國科學技術大學、上海交通大學的實踐表明,這種模式是很多學校在建設模式選擇時的最優(yōu)解。作為非科研單位,網絡中心工作人員的評價體系主要與建好平臺服務好用戶相關,而不是自己發(fā)表多少論文等,人員可安心做好技術支持服務,更好服務用戶。同時,網絡中心已經有行政、財務、技術等各種人員配置,可以對超算平臺進行更好的統(tǒng)籌和管理。
第三,體制機制建設。
“高校建設超算,如果只是買機器、買設備是遠遠不夠的?!绷中氯A表示,“體制機制這種軟性層面的東西往往是高校算力服務發(fā)展的重要保障?!睂W校建設了校級超算平臺之后,是否還應該允許院系建自己的平臺?就是體制機制問題的一種體現。院系分散建設有很多局限性,其計算資源難以共享,利用率低;運維人員往往沒有崗位編制,水平也參差不齊。
在這方面,上海交通大學出臺政策,不允許院系自行購買信息系統(tǒng)程序服務器。南京航空航天大學立項建設高性能計算平臺后,已不再批準各單位自行建設高性能計算的相關采購,初步估算,節(jié)約建設經費累計約500萬元,節(jié)約計算費累計近80萬元。
第四,軟件建設。
隨著大量傳統(tǒng)學科紛紛開始在研究中使用算力,在此情況下,傳統(tǒng)的HPC軟件接入就顯得過于復雜,使用門檻過高。這就需要更多關注用戶的科研環(huán)境,提供更加精準的科研環(huán)境和軟件,提高算力資源使用效率。
在這方面,北京大學自主研制的開源算力中心門戶和管理平臺SCOW(Super Computing On Web)通過簡化集群軟件部署流程、統(tǒng)一平臺管理模式、提供圖形化操作界面、降低用戶使用門檻,實現算力中心資源易管理、易使用的目標,提高算力資源使用效率。
“未來的一流大學,除了學科科研之外,誰對數字能力的把握更好,誰就能夠脫穎而出。我們需要用更大的格局、更高的戰(zhàn)略眼光來看待算力服務,它有可能成為未來整個大學變革的巨大源泉。”相關人士指出。
總而言之,面向未來,高校算力建設的持續(xù)投入很關鍵,而創(chuàng)新是持續(xù)發(fā)展的前提。高校要更多地探索、發(fā)展國產計算技術,在自主創(chuàng)新上更多“探路”,讓算力建設持續(xù)發(fā)展,更好地服務于高校數字化轉型。
[1]來源:賽爾網絡《高校網絡服務情況和教育信息化需求調研報告(2022 年度)》
編撰:項陽