必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

大廠多模態(tài)Agent能力激戰(zhàn)正酣

2025年12月19日 07:45證券日報作 者:袁傳璽

12月18日,火山引擎在FORCE原動力大會上正式發(fā)布豆包大模型1.8(Doubao-Seed-1.8)及音視頻創(chuàng)作模型Seedance 1.5 pro;鹕揭婵偛米T待表示,截至今年12月份,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍;目前已有超過100家企業(yè)客戶累計token使用量超過一萬億。

“目前大廠在多模態(tài)Agent(智能體)領(lǐng)域的競爭已從單點模型能力比拼,升級為‘模型—平臺—生態(tài)’的系統(tǒng)化作戰(zhàn)!敝袊苿(101.900, -0.41, -0.40%)通信聯(lián)合會教育與科學(xué)技術(shù)研究院執(zhí)行院長陳曉華在接受《證券日報》記者采訪時表示,火山引擎此次發(fā)布的產(chǎn)品旨在依托其日均調(diào)用量的規(guī)模優(yōu)勢,在Agent生態(tài)底座上確立領(lǐng)先地位。

技術(shù)突圍

本次發(fā)布的豆包大模型1.8,其核心升級完全圍繞“打造更強大的Agent大腦”展開。與單純追求參數(shù)規(guī)模不同,該版本在設(shè)計之初便針對多模態(tài)Agent場景進行定向優(yōu)化,在復(fù)雜指令遵循、多輪交互以及操作系統(tǒng)級別的實際操作(OS Agent)能力上實現(xiàn)了系統(tǒng)性增強。

在至關(guān)重要的多模態(tài)理解層面,豆包1.8完成了視覺能力的底層升級。其單次視頻理解幀數(shù)提升至1280幀,并能以低幀率解析超長視頻,在需要時調(diào)用工具對關(guān)鍵片段進行高精度分析。這一能力使得模型能夠處理在線教育課程、工業(yè)質(zhì)檢視頻等復(fù)雜冗長的視覺信息,為Agent在真實場景中自主決策提供了感知基礎(chǔ)。

同步亮相的音視頻創(chuàng)作模型Seedance 1.5 Pro,則從內(nèi)容創(chuàng)作端展示了多模態(tài)融合的更高階形態(tài)。該模型采用創(chuàng)新的原生音視頻聯(lián)合生成架構(gòu),實現(xiàn)了毫秒級的音畫同步,并能基于畫面景深和角色數(shù)量,精準匹配多人、多語言對話的口型。這解決了AI視頻生成中長期存在的“張口無聲”或口型錯位的頑疾,將技術(shù)從“炫技”推向“實用”。

火山引擎推出上述兩個模型,標志著大模型行業(yè)已從單純的參數(shù)競賽,全面進入了以多模態(tài)Agent為核心的產(chǎn)業(yè)落地新階段。賽智產(chǎn)業(yè)研究院人工智能研究所副所長安赟對《證券日報》記者表示,這可以從三個維度來分析。其一,AI價值從“單點生成”向“全鏈路執(zhí)行”的質(zhì)變。通過多模態(tài)感知與Agent規(guī)劃能力的結(jié)合,AI能夠跨越感知與行動的鴻溝,真正具備了在垂直場景中閉環(huán)完成任務(wù)的能力。其二,IT基礎(chǔ)設(shè)施從“功能驅(qū)動”向“智能驅(qū)動”的范式重構(gòu);鹕揭嫣岢龅摹癆I云原生架構(gòu)”極具前瞻性,揭示了未來的軟件形態(tài)將不再是傳統(tǒng)的SaaS堆棧,而是以Agent為主體的智能協(xié)同網(wǎng)絡(luò)。其三,大模型應(yīng)用正在跨越“成本與穩(wěn)定性”的規(guī);T檻。

競爭加劇

事實上,主要云廠商均已將戰(zhàn)略重心調(diào)整至多模態(tài)智能體平臺,競爭維度從單一模型能力升級為全棧技術(shù)、開發(fā)生態(tài)與行業(yè)場景的立體化角逐。

阿里云在9月份的云棲大會上全面升級了其全棧AI體系,實現(xiàn)從AI大模型到AI基礎(chǔ)設(shè)施的技術(shù)更新。阿里通義旗艦?zāi)P蚎wen3-Max不僅在多項評測中躋身全球前列,更在聚焦Agent工具調(diào)用能力的Tau2-Bench測試中取得突破性高分。更重要的是,阿里云發(fā)布了全新的Agent開發(fā)框架ModelStudio-ADK和低代碼平臺ModelStudio-ADP,將Agent的開發(fā)效率提升至“1個小時就能輕松開發(fā)一個能生成深度報告的Deep Research項目”的水平。

10月15日,百度搜索宣布全面升級文心助手AIGC創(chuàng)作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作。依靠百度搜索開放平臺,文心助手支持一鍵調(diào)用多工具解決生活、健康、教育、工作等多場景問題。

在譚待看來,傳統(tǒng)的IT架構(gòu)已無法滿足Agent時代的需求,以模型為中心的AI云原生架構(gòu)正在形成,并圍繞Agent的開發(fā)與運營進行重構(gòu)。

面對競爭,火山引擎此次打出了“組合拳”。火山引擎全面升級了企業(yè)級AI Agent平臺——AgentKit,覆蓋了Agent從開發(fā)、部署到管控的全生命周期。同時,火山引擎推出了HiAgent智能體工作站,通過構(gòu)建統(tǒng)一的企業(yè)AI任務(wù)調(diào)度中心、提供一系列開箱即用的通用智能體,以及支持個性化定制智能體應(yīng)用,幫助企業(yè)實現(xiàn)Agent的規(guī);芾砼c應(yīng)用。

除了提升模型能力外,火山引擎還推出業(yè)內(nèi)首個“AI節(jié)省計劃”,該計劃通過階梯定價,承諾最高可為按量付費的企業(yè)節(jié)省47%的成本。

“通過從模型能力到基礎(chǔ)設(shè)施的全面革新,火山引擎正在推動AI應(yīng)用從單一的模型調(diào)用向復(fù)雜的Agent智能體生態(tài)演進,加速AI在各行各業(yè)的深度落地。”譚待表示。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像