當(dāng)前,人工智能(AI)大模型技術(shù)已成為推動(dòng)國(guó)家科技和經(jīng)濟(jì)高質(zhì)量發(fā)展的新引擎,但其發(fā)展仍面臨幾個(gè)重大挑戰(zhàn),包括算力掣肘、推理幻覺(jué)和產(chǎn)業(yè)落地壁壘等挑戰(zhàn)。為充分發(fā)揮AI對(duì)我國(guó)科技和經(jīng)濟(jì)發(fā)展的賦能作用,需從模型架構(gòu)創(chuàng)新、測(cè)試標(biāo)準(zhǔn)體系構(gòu)建和產(chǎn)學(xué)研協(xié)同三方面突破,打造具有國(guó)際競(jìng)爭(zhēng)力的AI創(chuàng)新高地。
推動(dòng)模型架構(gòu)創(chuàng)新,探索智能本質(zhì)與高效實(shí)現(xiàn)路徑
當(dāng)今AI模型發(fā)展以Transformer架構(gòu)及其變體為主導(dǎo),以大參數(shù)量、大算力為基礎(chǔ),其訓(xùn)練成本正以驚人的速度增長(zhǎng),這種模式在長(zhǎng)期運(yùn)行中可能面臨能耗與訓(xùn)練效率的挑戰(zhàn),同時(shí)高昂的成本也可能對(duì)規(guī);瘧(yīng)用和推廣造成一定制約。AI訓(xùn)練過(guò)程中,算力需求的持續(xù)膨脹已成為制約AI創(chuàng)新的一項(xiàng)關(guān)鍵因素。為推動(dòng)我國(guó)AI研發(fā)實(shí)現(xiàn)跨越式發(fā)展,亟須在模型架構(gòu)層面進(jìn)行根本性創(chuàng)新。
從認(rèn)知科學(xué)視角看,人腦在能耗極低的情況下實(shí)現(xiàn)了高效的智能處理。人腦通過(guò)分層處理、注意力機(jī)制和預(yù)測(cè)編碼,以稀疏編碼、模塊化分工、抽象表征等方式實(shí)現(xiàn)高效運(yùn)算。這些認(rèn)知機(jī)制為突破算力瓶頸提供了重要思路:通過(guò)模擬大腦的預(yù)測(cè)加工系統(tǒng),構(gòu)建具有主動(dòng)推理能力的生成模型;設(shè)計(jì)更高效的記憶架構(gòu),防止AI的“災(zāi)難化遺忘”;參照大腦皮層的層次化表征系統(tǒng),構(gòu)建具有多重抽象級(jí)別的計(jì)算框架。當(dāng)前,大模型普遍存在的不可解釋性問(wèn)題,也凸顯了單純依賴數(shù)據(jù)驅(qū)動(dòng)的局限性。基于對(duì)人類智能的探索,挖掘?qū)W習(xí)機(jī)制、功能模塊分區(qū),有望指導(dǎo)設(shè)計(jì)出能夠更高效自適應(yīng)環(huán)境、自主學(xué)習(xí)的AI訓(xùn)練范式。
為實(shí)現(xiàn)我國(guó)在AI研發(fā)上從“跟跑”到“并跑”乃至“領(lǐng)跑”的轉(zhuǎn)變,幾大研究方向值得重點(diǎn)布局:一是開(kāi)展基于腦科學(xué)與認(rèn)知科學(xué)的智能本質(zhì)研究,深入探索人類智能的內(nèi)在機(jī)理及其對(duì)AI架構(gòu)的啟發(fā);二是推進(jìn)受腦啟發(fā)的AI算法研發(fā),開(kāi)發(fā)更高效輕量化的AI模型;三是加強(qiáng)通用人工智能(AGI)理論創(chuàng)新,構(gòu)建新一代AGI理論體系。為推動(dòng)上述方向,建議前瞻性布局新型計(jì)算芯片、認(rèn)知神經(jīng)網(wǎng)絡(luò)、腦科學(xué)與類腦智能等前沿方向。支持科研機(jī)構(gòu)開(kāi)展跨學(xué)科交叉研究,探索更高效的模型架構(gòu)和訓(xùn)練方法,推動(dòng)AI發(fā)展模式從“算力驅(qū)動(dòng)”向“效率優(yōu)先”轉(zhuǎn)型。通過(guò)降低算力門檻,可使廣大中小企業(yè)以更低成本接入AI技術(shù),形成新的產(chǎn)業(yè)增長(zhǎng)點(diǎn)。同時(shí),理論突破將帶動(dòng)芯片、算法、云計(jì)算等全產(chǎn)業(yè)鏈協(xié)同發(fā)展,進(jìn)一步夯實(shí)數(shù)字經(jīng)濟(jì)發(fā)展基礎(chǔ)。
構(gòu)建測(cè)試標(biāo)準(zhǔn)體系,筑牢大模型發(fā)展根基
當(dāng)前,AI大模型在各行業(yè)應(yīng)用呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。然而,在模型實(shí)現(xiàn)流暢交互的同時(shí),其固有的不可解釋性、“幻覺(jué)”問(wèn)題與潛在的安全隱患,也制約著其在關(guān)鍵領(lǐng)域的深度應(yīng)用。比如,在醫(yī)療場(chǎng)景中,模型可能生成看似合理、實(shí)則錯(cuò)誤的“幻覺(jué)”信息,即在醫(yī)療診斷時(shí)提供不準(zhǔn)確的建議,帶來(lái)誤診等后果。同時(shí),大模型決策過(guò)程不透明、易受惡意攻擊導(dǎo)致數(shù)據(jù)泄露等問(wèn)題,也使得關(guān)乎國(guó)計(jì)民生的關(guān)鍵領(lǐng)域在引入大模型時(shí)不得不慎之又慎。此外,因大模型的智能尚未升維為通用的認(rèn)知與適應(yīng)能力,仍不能被廣泛認(rèn)可為AGI。
構(gòu)建面向AGI的測(cè)試標(biāo)準(zhǔn),必須克服傳統(tǒng)測(cè)評(píng)方法的局限,借鑒發(fā)展心理學(xué)與心理測(cè)量,構(gòu)建新一代測(cè)評(píng)體系:在橫向上,建立覆蓋視覺(jué)、語(yǔ)言、認(rèn)知推理、社會(huì)價(jià)值等多維度的綜合任務(wù)集;在縱向上,設(shè)計(jì)受人類心智發(fā)展啟發(fā)的“AI發(fā)展里程碑”測(cè)試,評(píng)估其能力是否遵循合理、穩(wěn)健的演進(jìn)路徑。這尤其適用于評(píng)估AI的自我認(rèn)知、情感依戀、道德判斷等對(duì)安全至關(guān)重要的高階能力,為AGI的發(fā)展提供更科學(xué)的指引。
標(biāo)準(zhǔn)化建設(shè)既能提升模型質(zhì)量,對(duì)技術(shù)落地提出更高要求,又能為監(jiān)管提供技術(shù)支撐,加速可信AI在關(guān)鍵領(lǐng)域的部署應(yīng)用。同時(shí),完善的標(biāo)準(zhǔn)體系將增強(qiáng)市場(chǎng)信心,吸引更多社會(huì)資本投入AI產(chǎn)業(yè),推動(dòng)形成規(guī);瘧(yīng)用場(chǎng)景,有望帶動(dòng)相關(guān)服務(wù)業(yè)和制造業(yè)升級(jí)發(fā)展。為此,要加快建立覆蓋測(cè)試方法、標(biāo)準(zhǔn)體系、流程評(píng)估和倫理規(guī)范的全鏈條標(biāo)準(zhǔn)體系。構(gòu)建針對(duì)AI理解能力、安全性能,以及通用性的評(píng)測(cè)框架,針對(duì)重點(diǎn)風(fēng)險(xiǎn)領(lǐng)域設(shè)計(jì)場(chǎng)景化測(cè)試基準(zhǔn),通過(guò)可解釋性評(píng)估等手段量化模型的安全和可靠性。同時(shí),積極推進(jìn)測(cè)試標(biāo)準(zhǔn)與國(guó)際接軌,支持第三方機(jī)構(gòu)參與認(rèn)證評(píng)估,為行業(yè)提供科學(xué)可靠的評(píng)判依據(jù)。
深化產(chǎn)學(xué)研協(xié)同,打通創(chuàng)新應(yīng)用“最后一公里”
全面推動(dòng)人工智能與經(jīng)濟(jì)社會(huì)各行業(yè)各領(lǐng)域的廣泛深度融合,進(jìn)一步深化產(chǎn)學(xué)研協(xié)同創(chuàng)新,加速AI技術(shù)的規(guī);涞,應(yīng)著力做好以下工作。
第一,建立跨學(xué)科人才培養(yǎng)機(jī)制?鐚W(xué)科視角對(duì)于AI發(fā)展至關(guān)重要,要培養(yǎng)既懂人工智能又懂人類智能的復(fù)合型人才和團(tuán)隊(duì),建立跨學(xué)科研發(fā)平臺(tái),為兩者的深度融合研發(fā)提供人才支撐。第二,建立需求導(dǎo)向的研發(fā)機(jī)制。組建國(guó)家級(jí)AI產(chǎn)業(yè)創(chuàng)新聯(lián)盟,推廣“政府—高!髽I(yè)—產(chǎn)業(yè)園區(qū)”協(xié)同模式。在真實(shí)應(yīng)用場(chǎng)景中形成持續(xù)優(yōu)化的反饋機(jī)制,降低科研和企業(yè)技術(shù)驗(yàn)證門檻,形成“創(chuàng)新—應(yīng)用—反饋—迭代”的閉環(huán)系統(tǒng)。同時(shí),完善知識(shí)產(chǎn)權(quán)分配和激勵(lì)機(jī)制,充分調(diào)動(dòng)科研人員參與成果轉(zhuǎn)化的積極性。第三,構(gòu)建開(kāi)放共享的AI產(chǎn)業(yè)生態(tài)。建設(shè)高質(zhì)量共享數(shù)據(jù)集和公共測(cè)試平臺(tái),促進(jìn)大中小企業(yè)融通發(fā)展。
綜上,通過(guò)人類智能啟發(fā)的理論架構(gòu)創(chuàng)新、測(cè)試標(biāo)準(zhǔn)引領(lǐng)和跨學(xué)科深度融合的產(chǎn)學(xué)研協(xié)同,有望解決算力、安全、落地等當(dāng)前AI發(fā)展的關(guān)鍵瓶頸,探索出一條獨(dú)具中國(guó)特色發(fā)展路徑,推動(dòng)我國(guó)在全球數(shù)字經(jīng)濟(jì)競(jìng)爭(zhēng)中占據(jù)有利位置,為加快建設(shè)創(chuàng)新型國(guó)家提供有力支撐。
(作者:彭玉佳、方方,分別系北京大學(xué)首都發(fā)展研究院研究員,北京大學(xué)副校長(zhǎng)、心理與認(rèn)知科學(xué)學(xué)院教授)