日前,一場(chǎng)以高校高性能計(jì)算建設(shè)為主題的會(huì)議召開。會(huì)上,各高校專家圍繞高校算力中心如何可持續(xù)發(fā)展這一問題展開討論。
用好算力中心是長(zhǎng)遠(yuǎn)發(fā)展的關(guān)鍵
在算力需求逐漸攀升,高性能計(jì)算越發(fā)受到重視的當(dāng)下,高校獲得第一桶金建設(shè)自有的超算中心已不再成為難題。然而,在第一桶金后,第二桶金、第三桶金是否還能繼續(xù)跟進(jìn)?超算中心能否可持續(xù)、高質(zhì)量、始終如一地發(fā)展下去?依舊是擺在超算中心工作人員眼前的難題。
上海交通大學(xué)原高性能計(jì)算中心主任顧一眾表示,高校超算中心如何可持續(xù)發(fā)展是他們十幾年來一直在考慮的問題。在高校對(duì)算力需求持續(xù)走高的形勢(shì)下,第一桶金的獲取難度并不大,算力中心的創(chuàng)建只是技術(shù)上的問題,而不是資金上的問題。但建成后,如何使中心發(fā)展得更美好,這就需要一種可持續(xù)的機(jī)制。而如何把算力中心用好,可能是決定其能否可持續(xù)發(fā)展的核心,也是他們努力的主要目標(biāo)。
他強(qiáng)調(diào),使機(jī)器用滿不難,但如何高效使用機(jī)器卻并不容易。如何把資源放大,使算力中心的效率提升到最高,使高?;蛘耐度脒_(dá)到最佳收益,這是大家應(yīng)當(dāng)關(guān)注的焦點(diǎn)。比如有些用戶開發(fā)運(yùn)行的軟件效率不高,浪費(fèi)了大量的計(jì)算資源,而這就需要超算中心的工作人員去幫助用戶優(yōu)化軟件和運(yùn)行環(huán)境,提高計(jì)算效率。通過自身努力讓本來只能支撐10個(gè)用戶的算力,去支撐20個(gè)甚至更多的用戶。
同時(shí),除資金之外,人才也是中心可持續(xù)發(fā)展的核心要素。顧一眾表示,上海交通大學(xué)校領(lǐng)導(dǎo)充分重視計(jì)算人才隊(duì)伍建設(shè),給予超算中心有力支持,使中心有人力和能力為各學(xué)科用戶提供貼身細(xì)致的服務(wù),提升用戶的使用體驗(yàn)。
此外,他表示超算中心的可持續(xù)發(fā)展,離不開校領(lǐng)導(dǎo)的支持和用戶對(duì)服務(wù)的認(rèn)可。對(duì)于交大及同類型高校來說,有了這兩個(gè)方面,資金就不會(huì)成為明顯的阻礙。因此,長(zhǎng)期投入的問題就轉(zhuǎn)變?yōu)槿绾瓮ㄟ^中心努力,助力學(xué)校多出高水平成果,培養(yǎng)更多高質(zhì)量人才。從而以自身作為讓學(xué)校滿意,更有力地支持超算中心的可持續(xù)發(fā)展。
想清定位才能避免存在危機(jī)
華東師范大學(xué)計(jì)算中心主任鄭駿認(rèn)為,定位準(zhǔn)確對(duì)高校算力中心十分重要。他表示,作為算力中心,一定要考慮自身是定位于用戶服務(wù),還是定位于科研。對(duì)于中小型高校的算力中心來說,如果定位于用戶服務(wù),而欠缺強(qiáng)勢(shì)的專業(yè)能力,那么隨著未來網(wǎng)速、帶寬的增加,隨著國家超算中心的增加,隨著通信技術(shù)的發(fā)展,其自身存在可能受到明顯威脅,中小型高校算力中心的生存空間也可能會(huì)受到擠壓。
以上海超級(jí)計(jì)算中心為例,如果公共超算平臺(tái)能完全滿足校內(nèi)的算力需要,那么中小型高校算力中心的存在是否還有必要?為了預(yù)防這一問題,他建議中小型高校的超算中心一定要對(duì)超算領(lǐng)域技術(shù)進(jìn)行研究,有拿得出手的成果,有自己寫出的高水平期刊論文并嘗試對(duì)超算領(lǐng)域做出貢獻(xiàn)。
雖然用戶服務(wù)的重要性無可厚非,但中心人員的個(gè)人能力如何繼續(xù)提升也是重要問題。所以他認(rèn)為,在國家一次性投入如此巨大的狀態(tài)下,算力中心可以考慮深耕科研,在用戶服務(wù)之外,鉆研超算領(lǐng)域的技術(shù),培養(yǎng)一支科研能力、服務(wù)能力俱佳的人才隊(duì)伍。
上海超級(jí)計(jì)算中心主任李根國表示,高校算力中心需要有自己的研究方向,也可與自身的優(yōu)勢(shì)學(xué)科相結(jié)合,提升中心的科研能力。而上海超算中心作為政府支持的公共服務(wù)平臺(tái),其特色和定位就是用戶服務(wù),因此要在服務(wù)上不斷打磨,不斷自我超越。
據(jù)他介紹,上海超算中心共有兩個(gè)重要團(tuán)隊(duì),一個(gè)是機(jī)器選型的團(tuán)隊(duì),一個(gè)是代碼撰寫的團(tuán)隊(duì)。機(jī)器選型的團(tuán)隊(duì)需要在機(jī)器方面進(jìn)行深入研究,調(diào)查哪種類型的機(jī)器最適合中心運(yùn)行,最適合不同類型的學(xué)科和應(yīng)用,這樣在機(jī)器選型的過程中,中心就有一定的發(fā)言權(quán)和選擇權(quán)。
而代碼撰寫的團(tuán)隊(duì)則要結(jié)合用戶需求和實(shí)際應(yīng)用,幫助用戶撰寫代碼。當(dāng)下,大部分用戶都在使用開源代碼,但是,如果國內(nèi)70%到80%的用戶都能具備自己撰寫程序代碼的能力,那就說明學(xué)科發(fā)展和超算發(fā)展都達(dá)到了蒸蒸日上的狀態(tài)。他表示,希望上海超算中心能擔(dān)負(fù)起這個(gè)重任,幫助用戶一同撰寫代碼,這是中心應(yīng)當(dāng)追求的境界。
參與科研才能收獲更多關(guān)注
清華大學(xué)高性能計(jì)算研究所高級(jí)工程師張武生表示,超算平臺(tái)是否可以長(zhǎng)遠(yuǎn)發(fā)展,根本上取決于能否得到校領(lǐng)導(dǎo)的長(zhǎng)期支持。雖然各高校具體情況不同,但總體架構(gòu)應(yīng)當(dāng)類似,有校領(lǐng)導(dǎo)主管超算中心,也有相應(yīng)的資產(chǎn)部門。在超算中心起步時(shí),必須面對(duì)來自校領(lǐng)導(dǎo)的提問:中心到底能幫助學(xué)校解決多少問題?這一問題就是一切的關(guān)鍵。由于算力中心建設(shè)成本、運(yùn)維成本都十分高昂,如果沒有顯著成果支撐,校領(lǐng)導(dǎo)對(duì)于后續(xù)投入的意愿也不會(huì)十分強(qiáng)烈。
因此,清華大學(xué)算力中心的重要任務(wù)之一就是想方設(shè)法幫助師生解決問題,幫助他們快速、高質(zhì)量地產(chǎn)出科研成果,使科研過程更為順利。而在論文發(fā)表時(shí),也要爭(zhēng)取讓師生在論文最后列上中心的名字。通過這些努力,疊加上一段時(shí)間的積累與正反饋的迭代,學(xué)校會(huì)逐步認(rèn)識(shí)到中心的作用,認(rèn)可中心的存在,中心在校內(nèi)的頭銜、地位與級(jí)別也會(huì)逐漸提高,得到的支持也就更有保障。
同時(shí),張武生進(jìn)一步強(qiáng)調(diào),超算中心人員,尤其是較為年輕的人員,一定要想辦法參與到課題組的科研中去,要有開發(fā)科研計(jì)算代碼的能力。一旦能幫助科研人員解決代碼方面的問題,那么雖然依舊不算科研崗位的人員,但其自身地位會(huì)非常穩(wěn)固,績(jī)效評(píng)價(jià)也有所保障。
他舉例表示,2020年初,清華有一位教師進(jìn)行了新冠病毒傳染途徑的研究,即通過分析某一國家的機(jī)場(chǎng)數(shù)據(jù),預(yù)測(cè)人流量與傳染速度之間的關(guān)系,并自己建立了數(shù)學(xué)模型。雖然數(shù)據(jù)量并不是非常龐大,但計(jì)算運(yùn)行一周后還是無法得出結(jié)果。于是中心人員查看了原始代碼,發(fā)現(xiàn)教師從純數(shù)學(xué)角度去寫程序,代碼的時(shí)間復(fù)雜度非常高,所需時(shí)間就會(huì)很長(zhǎng)。
因此,中心重新調(diào)整、撰寫了程序,一天時(shí)間內(nèi)就得出了多個(gè)結(jié)果,有效加快了論文發(fā)表的速度,也趕上了新冠疫情的論文熱點(diǎn)期。而這位教師也在很多場(chǎng)合宣傳了中心的工作,表揚(yáng)中心人員所提供的幫助。所以,為了應(yīng)對(duì)此類情況的出現(xiàn),算力中心人員必須具備一定的代碼開發(fā)能力。
通過多種方式培養(yǎng)人才留住人才
中國科學(xué)技術(shù)大學(xué)超級(jí)計(jì)算中心副主任李會(huì)民表示,科大算力中心的定位是提供技術(shù)支撐服務(wù),全心全意幫助師生用戶解決問題,幫助他們優(yōu)化程序、構(gòu)建算法,從而發(fā)表更多論文,而非自己?jiǎn)为?dú)進(jìn)行科學(xué)研究。也就是說,中心人員的使命是在維護(hù)好平臺(tái)的前提下,幫助校內(nèi)師生用戶去發(fā)Nature、Science,而不是自己去發(fā)Nature、Science。
而高質(zhì)量論文的產(chǎn)出離不開高水平人才,因此,他亦強(qiáng)調(diào)了留住人才、挖掘人才的重要性。
他表示,由于高??蒲袓彵燃夹g(shù)支撐崗待遇更為優(yōu)越,而比起高校,IT人才在企業(yè)的薪資待遇也往往更高,所以算力中心的人才流失問題非常嚴(yán)峻,人才結(jié)構(gòu)也有進(jìn)一步優(yōu)化的空間。
為了解決人才流失問題,加強(qiáng)人才隊(duì)伍建設(shè),科大制定了相應(yīng)的人才政策,出臺(tái)了技術(shù)支撐績(jī)效管理辦法。例如,中心到賬經(jīng)費(fèi)的30%都會(huì)被用來作為人才獎(jiǎng)勵(lì),希望借此激發(fā)中心技術(shù)支撐人員的積極性、主動(dòng)性與創(chuàng)造性。他表示,一年投入50萬購入新設(shè)備,不如一年投入50萬去招攬新的人才,人才所帶來的收益將遠(yuǎn)遠(yuǎn)高于設(shè)備。因此,算力中心一定要想辦法建立合理的績(jī)效晉升體系,想辦法留住人才。
此外,為了提升中心的曝光率,形成良好的口碑效應(yīng),科大還設(shè)置了專門的超級(jí)計(jì)算專家組,這一組織由不同學(xué)科的重要計(jì)算用戶與計(jì)算機(jī)專家組成,作為超算與學(xué)科之間深度溝通的橋梁,為中心發(fā)展提供重大決策指導(dǎo)。他特別指出,如果中心能為專家提供優(yōu)質(zhì)服務(wù),反過來,專家也會(huì)憑借自己的影響力宣傳中心工作,在涉及資源分配時(shí),一些校內(nèi)地位較高的專家也能幫助中心爭(zhēng)取一些資源。因此,高校算力中心也應(yīng)與專家密切合作,提升中心的知名度與美譽(yù)度,為長(zhǎng)遠(yuǎn)發(fā)展奠定良好基礎(chǔ)。
撰文:王雅靜
責(zé)編:陳永杰