“源”力覺醒 浪潮開啟智算時代新紀元
當數字化轉型走入深水區,其顯著特征之一就是越來越多的智能化元素與產業應用和業務場景融合得更加緊密,背后則是數據量的指數級增長、計算力的強勁推動,以及各類算法框架的涌現和發展。這一趨勢也催生了基礎設施和硬件架構上的革新,比較有代表性的就是AI服務器和AI芯片的加速演進。IDC預測,2021年中國在AI市場的支出規模將達到82億美元,其中約70%的相關支出來自于AI硬件。《全球人工智能市場半年度追蹤報告》顯示,中國AI服務器頭部廠商市場規模同比增長率超過50%。在全球AI服務器市場增速放緩的情況下,中國仍能保持高增長勢頭,與各產業鏈的領軍企業的貢獻密不可分。
在2021人工智能計算大會(AICC2021)上,中國工程院院士、浪潮首席科學家王恩東談到:“人工智能帶來指數級增長的算力需求,計算產業正面臨著多元化、巨量化、生態離散化交織的趨勢與挑戰。”如王恩東院士所言,計算產業的多元化正在芯片領域顯現——2020年以GPU為代表的AI加速芯片所交付的計算力總和已超過通用CPU,預計到2025年,加速芯片提供的計算力可能超過80%。屆時,非GPU的芯片占比會超過20%,用于AI推理工作的芯片會達到市場規模的60.8%。
可以說,差異化的場景需求為AI發展指出了一條新道路,泛化能力成為AI在各行各業應用時實現規模化創新的基礎,而這離不開超大參數量模型對大規模數據的訓練。事實上,包括谷歌、微軟、英偉達、浪潮、阿里在內的企業都相繼推出了各自的巨量模型。2020年,OpenAI發布了GPT-3深度學習模型,GPT-3模型憑借1750億個參數,在文本分析、機器翻譯、機器寫作等自然語言處理領域表現出色。前不久,浪潮人工智能研究院開發出了全球最大規模的中文AI巨量模型“源1.0”,參數量達到2457億,訓練數據集規模達到5000GB。相比GPT-3模型的1750億參數量和570GB訓練數據集,“源1.0”的參數規模增加了40%,訓練數據集規模增加近10倍。
模型進入巨量化階段
“我欲與歸,道旅遼遠,山川悠長……”這是源1.0以戰爭為題所創作的一首詩。“大模型會帶來很多令人驚艷的東西。”浪潮信息副總裁、浪潮信息AI&HPC產品線總經理劉軍在接受媒體采訪時表示,“比如對于媒體行業來說,它可以寫出非常漂亮的文章、詩歌、戲劇,充滿著無限的想象力,可以讓人們打開思維的翅膀,通過AI讓人們的表達更加藝術、科學和高效。以前,賈島要苦吟‘二句三年得,一吟淚雙流’,現在借助大模型三秒鐘就能得一首詩。”
浪潮信息副總裁、浪潮信息AI&HPC產品線總經理劉軍
OpenAI的GPT-3帶來了較好的小樣本學習和泛化能力,前者的小樣本甚至是零樣本的學習能力,可以削弱預訓練階段基礎模型的復雜性,以及針對不同場景進行模型調整所引發的大量工作,后者可以使得模型訓練一次后得到的大模型用于支持各類任務,具有更好的普適性。因此,大模型的特性更符合人們對于通用智能的期待。相比此前GPT-3完成訓練需要1萬塊GPU,源1.0只需要2000多塊GPU即可完成。為了訓練源1.0,浪潮研發了業界最大規模的中文高質量數據集5TB,為此清洗了近860TB的互聯網數據。在精度上,源1.0在自然語言處理任務CLUE零樣本學習和小樣本學習的榜單中排名第一,在中文問答任務如WebQA上也大幅提升了性能。
在劉軍看來,要想做好大模型,算力、算法、數據的協同創新缺一不可,浪潮的優勢在于很擅長把這三個元素整合到復雜的系統工程中。通常,構建一套AI服務器系統需要處理超過1萬個零部件,包括50多種專用芯片,30多個技術方向,要優化100多種傳輸協議,涉及材料學、熱學、電池學、流體力學、化學等學科的技術問題。在浪潮的系統設計和開發過程中,有30多個開發流程、150多種加工和制造工藝、280多個關鍵控制點,實現了資源的精細化管理。同時,解決了在AI服務器系統12V母線架構、母線電流1000A的情況下,高功耗、高速率、高電流的可靠性挑戰,以及多用戶、多資源分配和多元算力、AI應用的適配問題。
在技術平臺上,浪潮突破了高密度的高速互聯技術,可以做到40層以上PCB的高密設計,布線密度每平方英寸超過16萬。對于高功率服務器,通過新型金屬相變材料可在一個4U空間內實現8顆500瓦最高功耗的AI芯片風能的散熱,并且支持靜默式液冷等新型綠色節能技術。在復雜系統的可靠性設計方面,浪潮研發了支持多元化AI芯片的高端服務器,可支持8顆像寒武紀等高端AI芯片的高速互聯,搭配風冷、液冷等散熱方式。根據IDC的數據,浪潮在全球AI服務器市場占有率中排名第一,在中國市場的份額連續三年保持50%以上。
大模型助力AI突圍
當然,模型并不是一味的在比大。斯坦福大學計算機科學系教授李飛飛曾指出,對于均質和突現來說,均質就是有更好的泛化能力,突現就是表現出來的零樣本學習和小樣本學習的能力,這些能力是模型參數量較小時看不到的,只有當參數量變大之后,才會出現一些獨特的性質。“大不是目的。AI的下一步是從系統1到系統2、從感知到認知,從專用智能走向通用智能。”浪潮人工智能研究院首席科學家吳韶華稱,“我們研究過不同尺寸的模型結構,發現隨著模型參數量的增大,尤其是小樣本學習的能力會持續改進,‘大’能帶來在算法、結構等方面的改進,加速對于前沿技術的探索。”
浪潮人工智能研究院首席科學家吳韶華
不過,大模型也有一些局限性,有些問題同樣困擾著深度學習相關的幾乎所有模型,例如不可解釋性,難度會隨著模型參數量的增長而加大。除此之外,概率的不可控性,以及約束推理(在受限的條件下/給定的條件下對模型進行推理)等問題也需要被解決。在落地實踐的過程中,模型的針對性、精準性都會根據行業應用場景而改善,這就離不開模型的開放性,要與合作伙伴共同優化。自源1.0上線以來,已經接收到很多來自產業各界的企業和機構申請使用。
眾所周知,中國已經將人工智能技術視為產業變革的核心力量。從2017年至今陸續推出一系列政策,鼓勵人工智能不斷從基礎理論研究到行業應用實現全產業鏈發展。在“十四五”規劃綱要中,將新一代人工智能作為要攻關的七大前沿領域之一,鼓勵加速人工智能前沿基礎理論突破、專用芯片研發、深度學習框架等開源算法平臺構建,促進學習推理與決策、圖像圖形、語音視頻、自然語言識別處理等領域創新,加速人工智能與諸如大數據、 物聯網、邊緣計算等數字信息技術的融合發展,促進產業優化升級、生產力整體躍升。此次,源1.0的數據集、API、源代碼會完全的開放和開源,并且會充分支持國產AI芯片。依托于浪潮的智算中心作為基礎設施,巨量模型對產業智能化勢必會產生更大的推動作用。
吳韶華認為,任何技術的發展都會有從興起到成熟再到落地的階段,“從這個規律來看,大模型正處于興起的階段,大家正在圍繞模型的體量,以及模型體量帶來的精度效應開展持續探索,當大模型探索走向成熟之后,一定會考慮應用等具體問題,比如響應化,運用響應化、高性能的推理部署等等,會有一個比較科學的曲線。”
開源開放推動產業共進
源1.0的主要目標有兩個:一、探索前沿技術,推動智能算法的創新;二、落地應用,建設算力基礎設施,推動產業發展。要想實現這兩點,開源和開放是必經之路。為此,浪潮希望與三類對象進行合作,包括高校和科研院所的AI研究團隊,以及浪潮的元腦的生態伙伴和智能計算中心等,并且還會推動面向AI芯片的模型移植開發,與開源社區加深合作。未來, “源2.0”會與產業合作更為緊密,加速實現應用在場景落地,加強在多模態、視覺領域的研發工作。
當模型算法進入到“巨量時代”,單靠任何一家企業或機構都難以完成大模型的研發、訓練、交互,生態的重要性被提升到了更高的優先級。對此,浪潮有著清晰的認知。埃森哲的一份調研報告顯示,70%以上有技術的研究機構、科技公司缺少需求場景、領域知識和數據,70%以上的行業用戶缺少技術人才、AI平臺和實踐能力。一直以來,浪潮都在推動元腦生態的建設,將AI算法、芯片等領域的前沿技術與行業場景連接起來,攜手伙伴向客戶交付整體解決方案。期間,浪潮提供了算力平臺、資源平臺和算法平臺。
劉軍談到,我們始終在關注如何讓產品滿足客戶、市場、應用的需求。同時,把目光投向科研創新和探索。對于這兩種發展方向,浪潮有著明確的戰略,針對前者會有嚴謹的商業計劃、產品規劃、營銷策略、銷售目標、客戶需求實現路徑,確保目標順利實現,針對后者則會更加激進一些,給予科研人員足夠的自由度,支持他們把無限的想象力變成現實,形成組織合力讓前沿技術服務于產業。
根據IDC數據顯示,2021年全球企業在人工智能軟件、硬件和服務的總投資將超過850億美元,預計在2025年增至2045億美元,五年復合增長率達到24.5%。可以看到人工智能已成為引領社會和經濟發展的戰略性技術之一。
“算力推動著中國人工智能產業快速發展,在技術、區域、行業、應用產業等多個維度都在加速邁進。與此同時,智算也呈現出多元化、巨量化、生態化的趨勢,平臺創新和開放生態是多元算力高效釋放的關鍵,智算中心將在數字經濟的高質量發展中承擔重要的新型基礎設施的作用。”劉軍表示,“通過源1.0中文巨量模型的開源開放,我們希望能夠實現‘產學研用’攜手共進,一起推動智能生態創新的高質量發展。”
浪潮(INSPUR) NF5270M5機架式服務器 1顆3204丨16G丨2T SATA企業級丨雙千兆丨550W丨導軌丨三年質保
進入購買
華為AX3 Pro
每滿299減10
進入購買
西部數據(Western Digital)8TB HC320 SATA6Gb/s 7200轉256M 企業級硬盤(HUS728T8TALE6L4)
進入購買
標簽: 浪潮
2022-01-13 08:29:23
2022-01-13 08:27:53
2022-01-13 08:25:49
2022-01-13 08:24:48
2022-01-13 08:23:24
2022-01-13 08:21:58
2022-01-13 08:19:20
2022-01-13 08:17:53
2022-01-13 08:12:40
2022-01-13 08:11:31
2022-01-13 08:08:09
2022-01-12 16:50:28
2022-01-12 14:16:53
營業執照公示信息
相關新聞