馬斯克 狂吹的 Grok 3,終于發(fā)布了
埃隆·馬斯克旗下的人工智能初創(chuàng)公司xAI發(fā)布最新版Grok 3聊天機(jī)器人,同OpenAI和DeepSeek等大模型展開新一輪競(jìng)爭(zhēng)。馬斯克曾多次將Grok 3描述為“地球上最聰明的人工智能”,在上線之前便引起了業(yè)界的廣泛關(guān)注。
馬斯克表示,Grok 3首先面向X的Premium Plus 訂閱用戶開放,他們將作為首批體驗(yàn)者。此外,xAI還為忠實(shí)粉絲推出了名為Super Grok的獨(dú)立訂閱服務(wù),提供最先進(jìn)的功能和最早的新特性訪問權(quán)限。
xAI表示,Grok 3的預(yù)訓(xùn)練已經(jīng)完成,整個(gè)團(tuán)隊(duì)一直在積極地將推理能力整合到當(dāng)前的Grok 3模型中。然而,這種集成仍處于早期階段,需要更多的改進(jìn)。Grok 3目前正在繼續(xù)接受訓(xùn)練。
除了Grok 3推理模型外,xAI還在訓(xùn)練一個(gè)該推理模型的迷你版。可以將Grok 3的推理數(shù)據(jù)與迷你推理模型進(jìn)行對(duì)比,有時(shí)其后者的表現(xiàn)甚至?xí)晕?yōu)于Grok 3推理模型。
01 號(hào)稱性能超越DeepSeek和ChatGPT
在發(fā)布會(huì)上,馬斯克表示,xAI 之所以將其聊天機(jī)器人命名為Grok,是因?yàn)檫@個(gè)詞源自美國(guó)科幻作家 羅伯特·海因萊因的小說 《異鄉(xiāng)異客》(Stranger in a Strange Land)。在書中,“Grok” 由一位在火星上長(zhǎng)大的角色使用,意指對(duì)某事物全面且深刻的理解。
馬斯克和他的人工智能團(tuán)隊(duì)聲稱,Grok 3測(cè)試版的推理能力超過了現(xiàn)有的人工智能模型。在有關(guān)推理和測(cè)試時(shí)間的基準(zhǔn)測(cè)試中,Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更優(yōu)的效果。
根據(jù)xAI的比較基準(zhǔn)顯示,Grok 3在科學(xué)、編碼和數(shù)學(xué)方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且,在盲測(cè)方面,xAI的Grok-3(早期版本) 在 lmArena 排行榜中以1402 分的歷史最高成績(jī)登頂,成為首個(gè)突破1400分的AI模型。這一成績(jī)超越了Google、OpenAI、DeepSeek等業(yè)界主要競(jìng)品。
02 122天打造AI超算中心,使其性能翻倍
在演示過程中,馬斯克和xAI的幾位高管分享了他們?nèi)绾螛?gòu)建Grok。馬斯克透露,由于xAI希望盡快推出Grok 3,時(shí)間非常緊迫。因此,他們意識(shí)到必須在短短四個(gè)月內(nèi)建成數(shù)據(jù)中心。
xAI表示,他們花了122天讓首批10萬顆GPU上線并運(yùn)行,這是目前全球最大的全連接H100集群。隨后,xAI進(jìn)一步加速擴(kuò)建數(shù)據(jù)中心,僅用92天便完成第二階段建設(shè),使計(jì)算能力再次翻倍(依此計(jì)算約有20萬塊GPU)。
xAI團(tuán)隊(duì)還展示了Grok 3如何執(zhí)行有趣的任務(wù)。例如計(jì)算從地球到火星的航天器任務(wù)。Grok 3 生成了一張?zhí)瞻l(fā)射的動(dòng)畫 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復(fù)雜的物理知識(shí),Grok 3需要理解這些內(nèi)容。
Grok 3還展示了在自動(dòng)化游戲開發(fā)方面的潛力。xAI團(tuán)隊(duì)要求Grok 3現(xiàn)場(chǎng)創(chuàng)造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素,并呈現(xiàn)出獨(dú)特玩法:當(dāng)連接了至少三個(gè)相同顏色的方塊時(shí),會(huì)觸發(fā)重力機(jī)制使方塊消除,這種方式類似《寶石迷陣》。
此外,Grok 3包含一個(gè)名為Big Brain的功能,這是一個(gè)推理模型模式,允許在處理查詢時(shí)進(jìn)行更深入的思考。馬斯克指出,17個(gè)月前,最初的Grok模型幾乎不能解決高中問題,而現(xiàn)在它已經(jīng)進(jìn)步了很多,他幽默地比喻“Grok已經(jīng)準(zhǔn)備好上大學(xué)了”。
03 開發(fā)深度搜索功能、考慮開源Grok 2
除了推出 Grok 3 之外,xAI 還透露,該公司正在籌建一家人工智能游戲工作室,該工作室將專注于為消費(fèi)者提供服務(wù)。
此外,xAI正在為Grok開發(fā)深度搜索功能(DeepSearch)。這將成為其AI智能體的核心能力之一。DeepSearch是一款推理聊天機(jī)器人,能夠闡述其理解查詢內(nèi)容的過程以及規(guī)劃回復(fù)的方式。演示顯示,DeepSearch具有研究、頭腦風(fēng)暴和數(shù)據(jù)分析等功能。馬斯克團(tuán)隊(duì)還表示,他們打算“盡快”推出一款基于語音的聊天機(jī)器人。
對(duì)于Grok 3是否會(huì)開源,馬斯克表示,“我們通常會(huì)在新模型發(fā)布的時(shí)候,開源上一代模型,所以幾個(gè)月后,我們也會(huì)對(duì)Grok 2進(jìn)行開源。”
隨著Grok-3不斷刷新紀(jì)錄,人工智能競(jìng)賽正加速升溫。xAI通過強(qiáng)化推理能力、構(gòu)建超大算力集群,并在游戲等應(yīng)用領(lǐng)域進(jìn)行實(shí)驗(yàn)性探索,正快速躋身DeepSeek、ChatGPT 等頭部大模型的競(jìng)爭(zhēng)行列。Grok-3 的持續(xù)迭代表明,AI競(jìng)賽不僅未見終點(diǎn),反而正在進(jìn)入更激烈的階段。