來(lái)源:中國(guó)青年報(bào)
2018-05-16 09:51:05
超級(jí)計(jì)算機(jī)到底能干啥
中國(guó)青年報(bào)·中青在線見(jiàn)習(xí)記者 王嘉興
除了呼呼的風(fēng)扇聲,賽場(chǎng)一片沉寂,在場(chǎng)的上百名大學(xué)生緊盯著電腦,手指飛快地敲擊鍵盤。
這群平均年齡不到22歲的大學(xué)生,面對(duì)的是當(dāng)下最前沿的研究:機(jī)器閱讀理解、獲2017年諾貝爾化學(xué)獎(jiǎng)的冷凍電鏡技術(shù)、美國(guó)國(guó)家航空航天局(NASA)的流體力學(xué)模擬軟件……
面對(duì)海量的數(shù)據(jù),清華大學(xué)的大四學(xué)生李北辰估算后決定調(diào)整方案,“幾乎沒(méi)法跑完”。臨到結(jié)束,他甚至能聽(tīng)到自己的心臟“咚咚”地跳動(dòng)。
這是2018年世界大學(xué)生超級(jí)計(jì)算機(jī)競(jìng)賽(簡(jiǎn)稱ASC18)的現(xiàn)場(chǎng),在2天20小時(shí)的規(guī)定時(shí)間里,每個(gè)隊(duì)伍需要自己搭建小型超級(jí)計(jì)算機(jī),完成組委會(huì)布置的4道題目,運(yùn)算的結(jié)果將作為最后成績(jī)的評(píng)分依據(jù)。
李北辰隊(duì)伍搭建的機(jī)器的運(yùn)算能力,約為1萬(wàn)臺(tái)現(xiàn)在市面上主流家用電腦運(yùn)算能力之和,但相比目前世界上最快的超級(jí)計(jì)算機(jī)“神威·太湖之光”,他們的算力還不到百分之一。
在幾個(gè)國(guó)家超級(jí)計(jì)算中心的超級(jí)計(jì)算機(jī)里,日夜運(yùn)行著全國(guó)各地發(fā)來(lái)的運(yùn)算指令。不管是天文觀測(cè)、航空模擬計(jì)算,還是天氣預(yù)報(bào)、生物醫(yī)療等日常生活的需求,都需要超級(jí)計(jì)算機(jī)的支撐。
“超級(jí)計(jì)算機(jī)的研究水平?jīng)Q定了一個(gè)國(guó)家的尖端科研實(shí)力。以天氣預(yù)報(bào)為例,如果計(jì)算明天天氣的時(shí)間超過(guò)一天,那這個(gè)預(yù)報(bào)就毫無(wú)意義了。”國(guó)家超級(jí)計(jì)算濟(jì)南中心主任張?jiān)迫嬖V中國(guó)青年報(bào)·中青在線記者。目前中、美、日、俄等國(guó)對(duì)高性能超級(jí)計(jì)算機(jī)研究大力投入的背后,也是搶占科研制高點(diǎn)的競(jìng)賽。
1后面17個(gè)0
這是一個(gè)以萬(wàn)億為計(jì)量單位的世界。
在超級(jí)計(jì)算機(jī)領(lǐng)域,有著一份世界500強(qiáng)榜單。根據(jù)最新的排名,如果一臺(tái)機(jī)器的運(yùn)算能力達(dá)不到500萬(wàn)億次每秒,它將被無(wú)情地“除名”。衡量超級(jí)計(jì)算機(jī)的標(biāo)準(zhǔn)“簡(jiǎn)單粗暴”:運(yùn)算能力夠快。上一代超級(jí)計(jì)算機(jī)使用的架構(gòu)與目前主流的不同,現(xiàn)在的技術(shù)將來(lái)也可能被量子計(jì)算機(jī)取代。
這份榜單每隔半年更新一次,總是能引起全世界的關(guān)注,人們津津樂(lè)道冠軍的更替,哪個(gè)國(guó)家上榜的超級(jí)計(jì)算機(jī)最多、總算力最高還被美國(guó)總統(tǒng)寫進(jìn)國(guó)情咨文。
2013年至今,中國(guó)自主研發(fā)的超級(jí)計(jì)算機(jī)就一直穩(wěn)坐榜首。最近兩年,這個(gè)位置屬于“神威·太湖之光”,它的峰值運(yùn)算速度達(dá)到每秒12.5億億次,“1”后面17個(gè)“0”,大致相當(dāng)于200萬(wàn)臺(tái)普通電腦同時(shí)運(yùn)行。
但它遠(yuǎn)不止是堆積用于運(yùn)算的中央處理器(CPU)和圖形處理器(GPU)這么簡(jiǎn)單。張?jiān)迫嬖V記者,超級(jí)計(jì)算機(jī)的運(yùn)算速度不遵循“1+1=2”的公式,還得考慮它們之間工作分配、數(shù)據(jù)傳輸?shù)膿p耗。“這就像領(lǐng)導(dǎo)10個(gè)人和領(lǐng)導(dǎo)1000個(gè)人的區(qū)別,如果不能合理管理,每個(gè)人的工作效率都會(huì)大大降低,即每個(gè)CPU和GPU的性能都沒(méi)有得到充分運(yùn)用。”
在國(guó)家超級(jí)計(jì)算濟(jì)南中心,“神威·藍(lán)光”超級(jí)計(jì)算機(jī)黑色的機(jī)箱緊密排布,圍成一個(gè)大圈,被小心安放在數(shù)百平方米的一樓大廳內(nèi)。當(dāng)這臺(tái)研發(fā)費(fèi)用數(shù)億元的機(jī)器運(yùn)轉(zhuǎn)時(shí),功耗是1兆瓦,大致相當(dāng)于1.5萬(wàn)戶家庭的家電功率總和,每年僅電費(fèi)一項(xiàng)支出就接近2000萬(wàn)元人民幣。
相比國(guó)家超級(jí)計(jì)算中心的“大手筆”,李北辰參加的ACS18則要求機(jī)器總功耗在3000瓦以內(nèi),這意味著能使用的CPU、GPU數(shù)量有一個(gè)上限。
為了最大化利用它們的運(yùn)算能力,他們必須精打細(xì)算,一方面仔細(xì)分配每個(gè)節(jié)點(diǎn)的運(yùn)算內(nèi)容,另一方面還要簡(jiǎn)化復(fù)雜的運(yùn)算,讓每個(gè)節(jié)點(diǎn)能同時(shí)計(jì)算盡可能多的內(nèi)容。
在這次比賽中,他們隊(duì)伍用了16塊GPU,總價(jià)值超過(guò)60萬(wàn)元人民幣。為了分?jǐn)傦L(fēng)險(xiǎn),幾位隊(duì)員一人負(fù)責(zé)幾塊,小心翼翼地將這些寶貝從學(xué)校的實(shí)驗(yàn)室運(yùn)到比賽現(xiàn)場(chǎng)。賽前,場(chǎng)地上趴滿了選手,大家都在緊張地安裝和調(diào)試設(shè)備。
租用超算一天,花費(fèi)上萬(wàn)元
比賽開(kāi)始不多久,參賽的選手就開(kāi)始冒汗。除了心理因素,還因?yàn)楝F(xiàn)場(chǎng)設(shè)備高速運(yùn)轉(zhuǎn)時(shí),會(huì)釋放大量的熱量,隊(duì)員戲稱“可以攤雞蛋了”。每個(gè)GPU都必須配備降溫風(fēng)扇,否則就會(huì)因溫度過(guò)高而停止運(yùn)行。
對(duì)超級(jí)計(jì)算機(jī)來(lái)說(shuō),如何有效地帶走這些“大腦”思考時(shí)散發(fā)的熱量一度是發(fā)展瓶頸。在國(guó)家超級(jí)計(jì)算廣州中心,工程師專門建造了冷水廠,不間斷運(yùn)送8攝氏度的水進(jìn)入“天河二號(hào)”的水冷系統(tǒng)。
機(jī)房還安排人員24小時(shí)值班,監(jiān)控機(jī)器的運(yùn)轉(zhuǎn)狀況,清理垃圾進(jìn)程,實(shí)現(xiàn)效率的最大化。“是機(jī)器就有損壞和出問(wèn)題的概率,怎樣讓它們的影響盡可能小也是門學(xué)問(wèn)。”張?jiān)迫f(shuō)。
李北辰曾參加另一場(chǎng)大學(xué)生超算競(jìng)賽,48小時(shí)不間斷地比賽,他和隊(duì)員只能輪流睡覺(jué),保證有人時(shí)刻盯著機(jī)器運(yùn)行。此外,組委會(huì)還隨機(jī)對(duì)賽場(chǎng)斷電,考查程序及時(shí)備份的能力。在實(shí)際使用中,這些都是極可能出現(xiàn)的挑戰(zhàn)。
中山大學(xué)腫瘤防治中心的博士后趙齊對(duì)此深有體會(huì),他所在的團(tuán)隊(duì)是最早用“天河二號(hào)”測(cè)試生物應(yīng)用的團(tuán)隊(duì)之一。因?yàn)樾枰幚泶罅康纳锘蚪M數(shù)據(jù),他們從2012年起就開(kāi)始使用超級(jí)計(jì)算機(jī)。
他告訴中國(guó)青年報(bào)·中青在線記者,他曾遇到各種奇怪的報(bào)錯(cuò)和任務(wù)丟失,環(huán)境配置也不定時(shí)出問(wèn)題,經(jīng)常算出他自己都不敢相信的結(jié)果。
這是因?yàn)樯镄畔㈩I(lǐng)域在超級(jí)計(jì)算機(jī)上的應(yīng)用還在起步階段,成熟的軟件不多,很多時(shí)候需要用戶和超算中心的工作人員合作開(kāi)發(fā)解決問(wèn)題。
在過(guò)去5年,光他一個(gè)人就用“天河二號(hào)”處理了超過(guò)100TB的數(shù)據(jù)。超級(jí)計(jì)算機(jī)能在幾天或幾小時(shí)里,處理一般計(jì)算機(jī)半年乃至幾年才能處理完的工作。以前,等待運(yùn)算結(jié)果是他最苦悶的時(shí)候,“用上超級(jí)計(jì)算機(jī)算是奔小康了。”
因?yàn)樾枰幚淼臄?shù)據(jù)太多,網(wǎng)絡(luò)傳輸較慢,趙齊有時(shí)會(huì)采用郵寄硬盤的方式,“郵遞員最快”。
只是這樣的代價(jià)很高。趙齊所在的實(shí)驗(yàn)室每年消耗在數(shù)據(jù)存儲(chǔ)上的錢就在5萬(wàn)元左右。租用超級(jí)計(jì)算機(jī)進(jìn)行數(shù)據(jù)處理,有時(shí)一天就會(huì)花費(fèi)上萬(wàn)元。
對(duì)多數(shù)用戶來(lái)說(shuō),使用超級(jí)計(jì)算機(jī)和自己的電腦沒(méi)什么區(qū)別,登錄賬號(hào),上傳數(shù)據(jù)就行了,運(yùn)算遠(yuǎn)在千里之外進(jìn)行。
超算世界500強(qiáng)前兩名是中國(guó)
當(dāng)你拿起智能手機(jī),向語(yǔ)音助手詢問(wèn)天氣,遠(yuǎn)在美國(guó)的超級(jí)計(jì)算機(jī)在不到1秒的時(shí)間里理解了你的意思。甜美的女聲播報(bào)的結(jié)果,則由濟(jì)南、廣州、無(wú)錫等多地的超級(jí)計(jì)算機(jī)共同計(jì)算得出。
大量影視公司利用它進(jìn)行后期特效處理,傳統(tǒng)制造業(yè)也倚仗這個(gè)技術(shù),部分公司洗衣液的瓶子都是超級(jí)計(jì)算機(jī)設(shè)計(jì)的。
有了超級(jí)計(jì)算機(jī),研究者可以模擬出人類器官對(duì)藥物的反應(yīng),大大縮短新藥的研發(fā)時(shí)間,節(jié)省成本。在抗埃博拉病毒藥物的篩選中,超級(jí)計(jì)算機(jī)能夠在一天內(nèi)完成超過(guò)4000萬(wàn)分子化合物的篩選,以最快的速度應(yīng)對(duì)爆發(fā)性惡性傳染病。
此外,使用超級(jí)計(jì)算機(jī)進(jìn)行核爆炸模擬還是美國(guó)研究核武器的方式。
過(guò)去,超級(jí)計(jì)算機(jī)的主要任務(wù)是進(jìn)行科學(xué)計(jì)算。最近幾年,有關(guān)人工智能的運(yùn)算請(qǐng)求也越來(lái)越多。
為此,ASC競(jìng)賽也開(kāi)始引入人工智能的問(wèn)題,李北辰打比方說(shuō),過(guò)去他們的工作類似于計(jì)算式子的結(jié)果,但現(xiàn)在,他們更像是在做應(yīng)用題,要先讀懂問(wèn)題,從中抽象出式子,再進(jìn)行計(jì)算。
目前,“天河二號(hào)”的用戶已經(jīng)超過(guò)1200家,包括各大高校、研究所,支撐國(guó)家級(jí)課題超過(guò)400項(xiàng)。
2001年時(shí),超級(jí)計(jì)算機(jī)500強(qiáng)名單中沒(méi)有一臺(tái)來(lái)自中國(guó)。而現(xiàn)在,榜單前兩名都被中國(guó)占據(jù)。此外,中國(guó)的上榜數(shù)量達(dá)到204,排名第二的美國(guó)只有143。
2015年,美國(guó)開(kāi)始對(duì)中國(guó)超級(jí)計(jì)算機(jī)領(lǐng)域施行芯片禁運(yùn),在那以前,美國(guó)對(duì)中國(guó)出口超級(jí)計(jì)算機(jī)也有諸多限制,例如出售的機(jī)器性能不能高于中國(guó)自己所能研發(fā)的機(jī)器性能。
張?jiān)迫嬖V記者,我國(guó)已經(jīng)掌握超級(jí)計(jì)算機(jī)的制造技術(shù),包括“神威·太湖之光”“神威·藍(lán)光”的一系列設(shè)備,從芯片、操作系統(tǒng)到冷卻系統(tǒng)都完全由我國(guó)自主研發(fā)。
雖然中國(guó)在硬件條件上取得領(lǐng)先地位,但軟件方面仍需要大量的投入。目前應(yīng)用于超級(jí)計(jì)算機(jī)的商用軟件幾乎全部由美國(guó)、日本等國(guó)開(kāi)發(fā),中國(guó)的市場(chǎng)占有率基本為零。
“應(yīng)用于超算的生物信息學(xué)軟件開(kāi)發(fā)起來(lái)舉步維艱。”趙齊感慨,“人才缺口很大。”他所在的專業(yè),很多人都放棄使用“天河二號(hào)”,因?yàn)閷W(xué)習(xí)和溝通成本太高。他覺(jué)得,超算中心應(yīng)該做更多對(duì)超算技術(shù)的科普和培訓(xùn)。
在計(jì)算機(jī)科學(xué)領(lǐng)域,超級(jí)計(jì)算機(jī)不是熱門方向。李北辰的同學(xué)中,每年只有10%左右的同學(xué)對(duì)這個(gè)方向有興趣,多數(shù)人還是投身人工智能的研究。
在張?jiān)迫磥?lái),解決軟件問(wèn)題需要政策和財(cái)政兩方面的支持。“西方國(guó)家在超算領(lǐng)域多是制訂10-20年的計(jì)劃,背后有點(diǎn)軍備競(jìng)賽的意思。但中國(guó)一直是制訂5年計(jì)劃,完成后再討論下一個(gè)5年要不要繼續(xù)。這樣規(guī)劃不夠長(zhǎng)遠(yuǎn),技術(shù)團(tuán)隊(duì)也難以保持穩(wěn)定。”
他介紹,我國(guó)對(duì)超級(jí)計(jì)算機(jī)領(lǐng)域研究的總投入與美國(guó)接近,但對(duì)軟件的投入偏低,目前僅占總投入的20%。他認(rèn)為,這個(gè)比例應(yīng)該到50%比較合適,美國(guó)、日本也是這個(gè)比例。
“美國(guó)對(duì)超級(jí)計(jì)算機(jī)的研究已經(jīng)超過(guò)了50年,而我國(guó)才剛剛30年,我們需要多一些耐心。”張?jiān)迫f(shuō),“過(guò)去我們是跟在別人后面跑,就只顧得上追了。現(xiàn)在我們超前了,該看清前進(jìn)的方向,這比追趕花功夫得多。”
想爆料?請(qǐng)登錄《陽(yáng)光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網(wǎng)官方微博(@齊魯網(wǎng))提供新聞線索。齊魯網(wǎng)廣告熱線0531-81695052,誠(chéng)邀合作伙伴。