首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

聚焦大模型訓(xùn)練效率提升 北大依托昇騰突破細(xì)粒度混合并行技術(shù)

2025年8月1日 15:31  CCTIME飛象網(wǎng)  

在人工智能大模型迅猛發(fā)展的當(dāng)下,大模型參數(shù)和計算量呈指數(shù)級增長,大規(guī)模深度學(xué)習(xí)模型的訓(xùn)練離不開多硬件設(shè)備的分布式計算。在鯤鵬昇騰科教創(chuàng)新卓越中心的算力支持下,北京大學(xué)計算機(jī)學(xué)院崔斌教授團(tuán)隊創(chuàng)新研發(fā)了面向大模型的高效分布式訓(xùn)練框架,大幅提升了大規(guī)模分布式訓(xùn)練模型的效率。

針對模型訓(xùn)練任務(wù)的多樣性和復(fù)雜性所帶來的負(fù)載不均問題,研究團(tuán)隊創(chuàng)新設(shè)計出了細(xì)粒度模型切分與并行策略搜索算法。此方法依托昇騰強(qiáng)大的計算資源管理能力,及算子優(yōu)化技術(shù)對訓(xùn)練策略的適配,完成了統(tǒng)一訓(xùn)練接口到智能切分策略的全過程。首先通過總結(jié)多種大模型訓(xùn)練的共同特點,設(shè)計出統(tǒng)一的接口來啟動和管理不同任務(wù)負(fù)載的模型訓(xùn)練任務(wù),對訓(xùn)練時所花費的算力、內(nèi)存、網(wǎng)絡(luò)通信等進(jìn)行精確地計算。接著基于這些數(shù)據(jù)細(xì)致拆解龐大且復(fù)雜的大模型,根據(jù)不同模塊分配不同的訓(xùn)練策略以適應(yīng)各模塊的負(fù)載差異,實現(xiàn)訓(xùn)練任務(wù)的高效并行。目前,該方案已實現(xiàn)比分片數(shù)據(jù)并行、3D 并行等全局模版化并行方案提升15% 的訓(xùn)練效率。

除此之外,團(tuán)隊還解決了分布式計算所涉及的硬件間通信傳輸效率問題。結(jié)合昇騰高速互聯(lián)總線技術(shù)的高帶寬低時延優(yōu)勢,系統(tǒng)會很根據(jù)不同的通信需求,對硬件設(shè)備進(jìn)行分組以優(yōu)化組隊時間,運用計算通信重疊技術(shù)讓“計算”和“通信”同步進(jìn)行,提高訓(xùn)練流水線的效率,并在模型切分的決策時考慮計算通信重疊的性能影響,綜合多方面因素選取最適合的分布式運行方案,最終實現(xiàn)數(shù)據(jù)傳輸效率和資源利用率的最大化。

該研究成果不僅為模型大規(guī)模訓(xùn)練提供了高效的解決方案,更展現(xiàn)了自主算力在分布式計算領(lǐng)域的巨大潛力。目前,研究成果已在國際頂級學(xué)術(shù)會議NeurIPS、ICLR、AAAI發(fā)表3篇論文,為國內(nèi)AI技術(shù)突破提供了理論支撐與實踐范式。

北京大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心的這一突破彰顯了校企協(xié)同創(chuàng)新的顯著成效。未來,中心將持續(xù)加速AI前沿技術(shù)在自主計算平臺的深度落地,為我國人工智能產(chǎn)業(yè)的自主化突破提供強(qiáng)勁動能。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中國電信柯瑞文:星辰智惠 共治共享
精彩視頻
2025WAIC|探館中國電信展臺 AI全景圖 滿滿“科技范兒”
中國電信總經(jīng)理劉桂清:星辰智惠,共治共享,賦能產(chǎn)業(yè)變革新未來
中國電信柯瑞文:打造全方位人工智能動態(tài)防護(hù)體系,構(gòu)建共創(chuàng)、共治、共享的產(chǎn)業(yè)生態(tài)
2025世界人工智能大會:才藝比拼、技能比武!機(jī)器人“大顯身手”
精彩專題
2025世界人工智能大會暨人工智能全球治理高級別會議
2025中國聯(lián)通合作伙伴大會
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像