第5章 攻關超級計算機(1 / 1)

260攻關超級計算機   二、互連網絡。高性能計算機的互連網絡是非常核心的部件,新陸和長島兩國的超級計算機一般采用商用的infiniBand。   富嶽采用了Tofu-D互聯網絡技術,將15萬節點(430萬個處理器核)連接,數據集成到芯片中了,可以直接從芯片傳送數據到互連網絡中,而不需要先到pcle總線,然後再轉到互連網絡中,極大提升了效率。   三、功耗散熱控製。富嶽功耗是28MW,中規中矩。湖光在散熱方麵采用了液冷技術,是超級計算機領域中的一個突破。   新陸國的頂峰(summit)采用了240萬個處理器,長島富嶽采用了430萬個處理器,湖光采用了1000萬個處理器。所以湖光的功耗很大,每天的電費十幾萬元。   張沖誌設計的超級計算命名夏盛甲型,采用“片上融合異構無核”的架構,通過各核之間協同,達到A64fx的作用。   這樣還使用液冷技術,一心追求超算的功能。   但是處理器卻采用世界上最先進的大芯片的技術,整個芯片由450毫米晶元整塊加工而成,比一般的筆記本電腦都大。   與新陸國WSE由整片英寸晶園直接加工而成的工藝差不多,但是以WSE2采用的是5納米的技術。   而夏盛甲超級計算機卻采用2納米的技術,張沖誌單獨改造了一臺光刻機專門生產這樣的大芯片。   這張芯片總麵積達到15萬平方毫米,擁有AI核心1000萬個,30萬億個晶體管,它比最大的GPU大1400多倍,計算核心是其2000多倍。   也就是說富嶽超算隻要這樣的大芯片處理個2000就足以勝任,加上處理器之間的傳輸效率,有可能1000多個就可以,這節約多少電力,節約多少維護費用。   這樣的超級計算機,工業園計劃建設九臺,兩臺用於物理類計算,一臺用於化學類高分子類計算,一臺用於海洋氣象類計算,一臺用於生物製藥類,一臺用於智能機械人和虛擬技術類計算,一臺用於其它類。   兩臺用於鴻盛集團及工業園管理,這是為了將企業管理全部采用超算管理,讓黑星從中解放出來。   當然這九臺超級計算機隻是在某一領域有善長,他方麵的計算稍弱,實際還可以九臺聯合起來提供更強大的計算。   這些處理器都是全能型選手,既可以做高性能計算,也能做AI計算。   采用相似但經過優化的Tofu互連網絡技術,使數據直接從芯片就可以傳輸到互連網絡中,又提升了互連網絡的效率,減少超算的功效。   張沖誌還將杜平院士的研究團隊請來,擔任指導工作,這讓杜平院士很高興,經過這次攻關後,海大計算機學院就可以開設超算專業科目了,師兄孫振開和師姐王鴿全力靠上。   夏盛集團的餘向東CE0專門成立一個攻關小組,堅決組成一支專業隊伍,因為以後會有許多這樣的超級計算機需要他們去架設。   八月一號,九臺超算開始架設,張沖誌幾乎將精力全靠在這裡,黑星的算力也被抽過來一部分,其他人更是吃住在超算中心,采用流水作業的方式進行施工。   杜平院士等人怕出現問題想先建設完成一臺,看看效果再進行下一步建設,被張沖誌自信地否決了。   第一臺是主要偏重於數學物理方麵的超算,基本上是張沖誌動手,所有人為輔助。   完成第一階段後,就開始第二臺偏重物理研究方麵的超算,這次張沖誌邊指導邊動手,二分之一的人開始動手參與。   第三臺超算張沖誌僅指導,由其餘二分之一的人參與動手,第四臺就全部放手讓王鴿指揮進行。   張沖誌又返回開始第一臺的第二階段的安裝,完成後開始第二臺超算的第二階段的安裝,有二分之一人員在張沖誌邊指導邊動手的帶領下參入安裝。   到第三臺超算安裝時第二階段時,張沖誌變成了純指導者。   在開始安裝第四臺起算時,張沖誌從第一隊中抽回三分之一的人,又從第二隊中抽回三分之一的人,這些跟著他安裝第一臺超算的第三階段,也就是最後一個階段的設備、線路等。   在第三隊人開始第四臺電腦的第三階段時,張沖誌抽調五個軟件操作係統編程好的人,再加上超算中心主任孫振開,從第一臺超算進行天宮超算操作係統安裝,接著進行超算運行調試,並尋找bug和設備缺陷進行完善。   由於經過黑星的多次虛擬模擬,再加上全部由張沖誌動手安裝,所以第一臺超算啟動很順利,出了幾個程序bug,基本沒有設備缺陷。   從這個方麵就反應出超算在工業應用中的巨大作用,如果沒有黑星的虛擬模擬,找書苑www.zhaoshuyuan.com 僅憑借人工試錯,這臺超算最低需要幾個月的時間才能交付使用。   這樣基本每臺超級計算機用工三天三夜,經過27天,到8月27日,九臺超級計算機都正常運行。   最後通過測算,九臺超算可以同時聯合工作,使最高浮點計算力比單機提升五倍。   第一臺夏盛甲一號,由於是為了數學和物理的計算,因此它的速度最快。   在正式調試時,最高浮點速度達到每秒1008億億次,直接比富嶽的算力高出一個數量級,22倍多,並跨越千億億次大關,無可爭議的成為世界第一名。   其他超算都在300-800億億次之間,都是在世界前十名之內。九臺超算聯合可以達到每秒鐘四千億億次以上。   夏盛甲一號用了一萬個大芯片,每張造價20萬玄元,總造價達到30億玄元,功耗5MW。   這一結果在8月24日下午就被餘向東報告尹總,接著由尹總通過專線報告給了陸院長,於是8月24日晚上,尹總和陸院長都失眠了。   尹總靜靜地躺在床上任由大腦在飛翔,自從執掌夏為公司以來,他已經有許多年沒有這種感覺了。   在這個知識和信息快速增長的時代,它的快速發展和變化為每一個人都提供著大量的機會,人們有機會施展自己的能力和才華。   對企業而言,新的技術和發展環境讓企業有了更大實現旁道超車的機會。全球範圍內的資源配置,使得一家獨大的可能性降低。   每日穩定更新4000+,求支持、收藏、推薦!!