首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車(chē)|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

OpenAI正式發(fā)布GPT-5

2025年8月8日 07:38  環(huán)球市場(chǎng)播報(bào)  

OpenAI 已推出全新旗艦人工智能模型 GPT-5,該模型將為公司下一代 ChatGPT 提供技術(shù)支持。

于周四發(fā)布的 GPT-5 是 OpenAI 的首個(gè) “統(tǒng)一” 人工智能模型,它融合了 o 系列模型的推理能力與 GPT 系列的快速響應(yīng)優(yōu)勢(shì)。這款下一代模型標(biāo)志著 ChatGPT 及其開(kāi)發(fā)者 OpenAI 邁入新紀(jì)元,也彰顯了 OpenAI 更宏大的野心 —— 開(kāi)發(fā)更接近智能代理而非聊天機(jī)器人(19.330, -0.76, -3.78%)的人工智能系統(tǒng)。

如果說(shuō) GPT-4 讓人工智能聊天機(jī)器人能夠?qū)Ω黝?lèi)問(wèn)題給出智能回應(yīng),那么 GPT-5 則讓 ChatGPT 能夠代表用戶(hù)完成多種任務(wù),例如生成軟件應(yīng)用、管理用戶(hù)日程或創(chuàng)建研究簡(jiǎn)報(bào)。

借助 GPT-5,OpenAI 還致力于讓 ChatGPT 更易于使用。GPT-5 配備了實(shí)時(shí)路由機(jī)制,無(wú)需用戶(hù)手動(dòng)選擇設(shè)置,就能自主決定如何提供最佳答案 —— 無(wú)論是快速回應(yīng)用戶(hù)問(wèn)題,還是花更多時(shí)間 “思考” 答案。

在記者簡(jiǎn)報(bào)會(huì)上,OpenAI 首席執(zhí)行官山姆・奧特曼稱(chēng) GPT-5 是 “世界上最出色的模型”,并表示它代表著公司在開(kāi)發(fā) “能在大多數(shù)高經(jīng)濟(jì)價(jià)值工作中超越人類(lèi)” 的人工智能(即人工通用智能,AGI)道路上邁出了 “重要一步”。

“在歷史上任何時(shí)期,像 GPT-5 這樣的技術(shù)都幾乎是無(wú)法想象的,” 奧特曼說(shuō)。

從周四開(kāi)始,GPT-5 將作為默認(rèn)模型向所有 ChatGPT 免費(fèi)用戶(hù)開(kāi)放。OpenAI 負(fù)責(zé) ChatGPT 的副總裁尼克・特利表示,這是公司首次讓免費(fèi)用戶(hù)接觸到人工智能推理模型(此前,這類(lèi)更先進(jìn)的模型僅對(duì)付費(fèi)用戶(hù)開(kāi)放)。

“這只是我為踐行使命而感到興奮的方式之一,確保這些技術(shù)真正惠及大眾,” 特利在談及這一決定時(shí)說(shuō),他提到了 OpenAI 長(zhǎng)期以來(lái)的使命 —— 讓盡可能多的人接觸到先進(jìn)的人工智能。

外界對(duì) GPT-5 的期待極高,它是自 2022 年 ChatGPT 讓 OpenAI 聲名鵲起以來(lái),該公司最受期待的產(chǎn)品發(fā)布之一。據(jù)該公司稱(chēng),從那以后,ChatGPT 已成長(zhǎng)為全球最受歡迎的消費(fèi)級(jí)產(chǎn)品之一,每周用戶(hù)超過(guò) 7 億 —— 接近全球人口的 10%。

許多人將 GPT-5 視為人工智能整體發(fā)展的風(fēng)向標(biāo),硅谷對(duì)該模型的反響可能會(huì)對(duì)大型科技公司、華爾街以及監(jiān)管科技的政策制定者產(chǎn)生深遠(yuǎn)影響。這些利益相關(guān)方正密切關(guān)注 GPT-5 是否能像其前代產(chǎn)品 GPT-4 那樣,在人工智能能力上實(shí)現(xiàn)重大飛躍,打破人們對(duì)軟件功能的固有預(yù)期。

GPT-5 略勝競(jìng)爭(zhēng)對(duì)手一籌

OpenAI 稱(chēng),GPT-5 在多個(gè)領(lǐng)域達(dá)到了最先進(jìn)水平,在關(guān)鍵基準(zhǔn)測(cè)試中略?xún)?yōu)于 Anthropic、谷歌 DeepMind 和埃隆・馬斯克的 xAI 等公司的頂尖人工智能模型。不過(guò),在其他一些領(lǐng)域,GPT-5 的表現(xiàn)略遜于前沿人工智能模型。

該公司表示,GPT-5 在編程領(lǐng)域展現(xiàn)出前沿水平;奧特曼稱(chēng),該模型尤其擅長(zhǎng)按需生成完整的軟件應(yīng)用,也就是人們所說(shuō)的 “氛圍編程”。

在 SWE-bench Verified(一項(xiàng)基于 GitHub 真實(shí)編程任務(wù)的測(cè)試)中,GPT-5 首次嘗試的得分達(dá)到 74.9%。這意味著 GPT-5 略?xún)?yōu)于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。

在 “人類(lèi)終極考試”(一項(xiàng)衡量人工智能模型在數(shù)學(xué)、人文和自然科學(xué)領(lǐng)域表現(xiàn)的高難度測(cè)試)中,具備擴(kuò)展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情況下得分 42%。這略低于 xAI 的 Grok 4 Heavy 模型,后者在該測(cè)試中得分 44.4%。

在 GPQA Diamond(一項(xiàng)針對(duì)博士級(jí)科學(xué)問(wèn)題的測(cè)試)中,GPT-5 Pro 首次嘗試得分 89.4%,超過(guò) Claude Opus 4.1(得分 80.9%)和 Grok 4 Heavy(得分 88.9%)。

OpenAI 表示,GPT-5 在回答健康相關(guān)問(wèn)題方面表現(xiàn)更出色。在衡量人工智能模型健康領(lǐng)域回應(yīng)準(zhǔn)確性的測(cè)試 “HealthBench Hard Hallucinations” 中,OpenAI 稱(chēng) GPT-5(啟用思考功能時(shí))的幻覺(jué)率僅為 1.6%。這遠(yuǎn)低于該公司此前的 GPT-4o 和 o3 模型,后兩者的得分分別為 12.9% 和 15.8%。

盡管人工智能聊天機(jī)器人并非醫(yī)療專(zhuān)業(yè)人員,但數(shù)百萬(wàn)用戶(hù)正借助它們獲取健康建議。針對(duì)這一現(xiàn)象,該公司表示,GPT-5 會(huì)更主動(dòng)地提示潛在的健康問(wèn)題,并幫助用戶(hù)解讀醫(yī)療檢查結(jié)果。

此外,OpenAI 稱(chēng),在創(chuàng)意設(shè)計(jì)、寫(xiě)作等更難衡量的主觀領(lǐng)域,GPT-5 也優(yōu)于其他人工智能模型。特利表示,在創(chuàng)意任務(wù)中,GPT-5 的回應(yīng)更自然,且展現(xiàn)出 “更好的品味”。

“這款模型的‘氛圍’真的很棒,” 特利說(shuō)。

GPT-5 也比 OpenAI 之前的模型更準(zhǔn)確,該公司稱(chēng),與 o 系列模型相比,GPT-5 的幻覺(jué)現(xiàn)象(即人工智能模型編造信息的傾向)大幅減少。此前,在 OpenAI 最新的人工智能推理模型(如 o3)中,幻覺(jué)問(wèn)題似乎愈發(fā)嚴(yán)重,而該公司此前表示尚未完全弄清楚原因。

在對(duì) ChatGPT 提示詞的回應(yīng)中,OpenAI 發(fā)現(xiàn) GPT-5(啟用思考功能時(shí))產(chǎn)生幻覺(jué)并給出錯(cuò)誤信息的概率為 4.8%。這較 o3 和 GPT-4o 有顯著降低,后兩者在測(cè)試中的幻覺(jué)率分別為 22% 和 20.6%。

在衡量人工智能模型完成模擬在線任務(wù)的代理能力基準(zhǔn)測(cè)試 Tau-bench 中,GPT-5 的表現(xiàn)好壞參半。在測(cè)試人工智能瀏覽航空公司網(wǎng)站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在測(cè)試人工智能瀏覽零售網(wǎng)站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。

OpenAI 還表示,GPT-5 比其之前的模型更安全。盡管人工智能推理模型偶爾會(huì)表現(xiàn)出針對(duì)人類(lèi)的謀劃傾向,或?yàn)榱诉_(dá)成自身目標(biāo)而說(shuō)謊,但 OpenAI 發(fā)現(xiàn) GPT-5 的欺騙率低于其他模型。

OpenAI 安全研究負(fù)責(zé)人亞歷克斯・比圖爾表示,降低欺騙性不僅提高了 GPT-5 的安全性,還改善了用戶(hù)體驗(yàn),打造出一個(gè) “在用戶(hù)可信賴(lài)的層面上更透明、更誠(chéng)實(shí)” 的模型。

比圖爾還指出,GPT-5 能更好地區(qū)分試圖濫用 ChatGPT 的惡意用戶(hù)和提出無(wú)害請(qǐng)求的用戶(hù)。這使得 GPT-5 能夠拒絕更多不安全的問(wèn)題,同時(shí)減少對(duì)尋求無(wú)害信息用戶(hù)的拒絕次數(shù)。

為消費(fèi)者和開(kāi)發(fā)者打造的升級(jí)功能

隨著 GPT-5 的發(fā)布,ChatGPT 迎來(lái)了多項(xiàng)用戶(hù)體驗(yàn)升級(jí)。用戶(hù)現(xiàn)在可以在 ChatGPT 的設(shè)置中選擇四種新的人格:憤世嫉俗型、機(jī)器人型、傾聽(tīng)者型和書(shū)呆子型。該公司表示,這些人格將自動(dòng)調(diào)整 ChatGPT 的回應(yīng)方式,無(wú)需用戶(hù)專(zhuān)門(mén)要求模型以特定方式回應(yīng)。

每月支付 20 美元的 ChatGPT Plus 訂閱用戶(hù)比免費(fèi)用戶(hù)擁有更高的 GPT-5 使用限額。而每月支付 200 美元的 Pro 訂閱用戶(hù)可無(wú)限制使用 GPT-5,并能訪問(wèn)增強(qiáng)版的 GPT-5 Pro—— 該版本使用額外的計(jì)算資源生成更優(yōu)質(zhì)的答案。采用 OpenAI Team、Edu 和企業(yè)版計(jì)劃的機(jī)構(gòu)將在下周獲得 GPT-5 作為默認(rèn)模型。

對(duì)于開(kāi)發(fā)者,GPT-5 將以三種規(guī)格通過(guò) OpenAI 的 API 開(kāi)放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它們?cè)谌蝿?wù) “推理” 上花費(fèi)的時(shí)間長(zhǎng)短不同。開(kāi)發(fā)者現(xiàn)在還可以通過(guò) OpenAI API 控制回應(yīng)的詳細(xì)程度,決定人工智能模型的回應(yīng)篇幅長(zhǎng)短。

GPT-5 基礎(chǔ)模型對(duì)開(kāi)發(fā)者的收費(fèi)為:每百萬(wàn)輸入令牌 1.25 美元(約合 75 萬(wàn)個(gè)單詞,比整套《指環(huán)王》系列的字?jǐn)?shù)還多),每百萬(wàn)輸出令牌 10 美元。

GPT-5 的發(fā)布之前,OpenAI 度過(guò)了忙碌的一周。該公司發(fā)布了開(kāi)源權(quán)重推理模型 gpt-oss,開(kāi)發(fā)者和企業(yè)可免費(fèi)下載,且運(yùn)行成本極低。這款開(kāi)源模型的能力幾乎與 OpenAI 之前的頂級(jí)模型 o3 和 o4-mini 相當(dāng),但 GPT-5 在編程等部分領(lǐng)域樹(shù)立了新的前沿性能標(biāo)準(zhǔn)。

不過(guò),在多個(gè)領(lǐng)域,GPT-5 似乎與其他前沿人工智能模型大致相當(dāng)。當(dāng)然,基準(zhǔn)測(cè)試只能反映人工智能模型的部分表現(xiàn),開(kāi)發(fā)者將如何在現(xiàn)實(shí)世界中使用 GPT-5,以及該模型是否真的超越競(jìng)爭(zhēng)對(duì)手,仍有待觀察。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中國(guó)電信柯瑞文:星辰智惠 共治共享
精彩視頻
華為史振鈺:智能體從辦公走向生產(chǎn),AI成為生產(chǎn)力
俄羅斯工程院外籍院士孫立寧:構(gòu)建具身智能的免疫系統(tǒng),從安全服務(wù)到人機(jī)共生的新范式
廣汽副總經(jīng)理閤先慶:安全是智能網(wǎng)聯(lián)汽車(chē)的基石
IDC中國(guó)副總裁鐘振山:未來(lái)的市場(chǎng)趨勢(shì)是從單一智能體產(chǎn)品逐步轉(zhuǎn)向智能體集群
精彩專(zhuān)題
2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議
2025中國(guó)聯(lián)通合作伙伴大會(huì)
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像