必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

DeepSeek宣布V3 模型更新,各項能力全面升級

2025年3月26日 07:28新浪科技作 者:文猛

3月25日晚間消息,DeepSeek宣布V3 模型已完成小版本升級,目前版本號 DeepSeek-V3-0324,用戶登錄官方網頁、APP、小程序進入對話界面后,關閉深度思考即可體驗。

據悉,DeepSeek-V3-0324 API 接口和使用方式保持不變。如非復雜推理任務,建議使用新版本 V3 模型,即刻享受速度更加流暢、效果全面提升的對話體驗。

模型推理任務表現(xiàn)提高,新版 V3 模型借鑒 DeepSeek-R1 模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現(xiàn)水平,在數學、代碼類相關評測集上取得了超過 GPT-4.5 的得分成績。

DeepSeek-V3-0324 與之前的 DeepSeek-V3 使用同樣的 base 模型,僅改進了后訓練方法。私有化部署時只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相關變動)。模型參數約 660B,開源版本上下文長度為 128K(網頁端、App 和 API 提供 64K 上下文)。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網 CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像