黃仁勛、扎克伯格 巔峰對談,揭秘 Meta 的未來AI圖景
作為擁有600,000塊H100的男人,在AI界占據著開源制高點的扎克伯格會如何看待AI的未來?
也許你已經有了一些答案。他在最近發布最強開源大模型Llama 3.1之后,已經密集的接受了一系列采訪,講述了他對AI產業的諸多看法。
但在7月30日的SIGGRAPH大會上,你看到的可能是最真實的扎克伯格。在和黃仁勛的巔峰對談中,他自曝自己開源也有自私的一面,飆臟話怒斥閉源供貨商的傲慢。還深刻反思了自己過去不夠潮,做的產品不夠酷了。
而且這還可能是看到的最全面的Meta未來圖景。這長達一個小時的對談中,他們從產品到產業,從開源的信仰到計算平臺的迭代。基本上把AI這個產業的未來都聊通了。
對AI產品方面的未來,扎克伯格表示AI正在徹底改變社交媒體平臺的運作方式:未來的Facebook和Instagram將成為一個統一的AI模型,能夠整合不同類型的內容和系統,為用戶提供更加個性化和豐富的體驗。特別提到了推薦系統的革新,預測未來的內容不僅會基于用戶興趣進行推薦,還會通過AI工具實時創作或合成。
他還非常堅定的認定了智能體就是AI產品的下一個形態。他認為,“在未來,就像每個企業都有一個電子郵件地址、一個網站和一個或多個社交媒體賬戶,我認為在未來,每個企業都將擁有一個與客戶交互的AI智能體”,而智能體的可能性之大,即使基礎模型的進展現在停滯不前,還會有五年的時間來讓行業基本上弄清楚如何最有效地利用迄今為止已經構建的所有東西。
而在AI產業方面,扎克伯格表達了對開放生態系統的堅定支持。扎克伯格透露私心,認為就算為了確保Meta等公司不會被封閉的生態系統所限制,也得自己做開源。而且只有開放的生態才能導致技術標準的形成,能用用戶飛輪去更快速的迭代產品。而且,在這樣的開源生態中,他預見到未來將出現大量針對特定任務和領域的專門AI模型,而不是由少數幾個大型通用模型主導。
關于下一代計算平臺,扎克伯格重點討論了智能眼鏡和混合現實設備的前景。因為AI始料未及的快速發展,小扎現在的元宇宙不再是非得虛擬現實了。而是AI+眼鏡就行。和雷朋的合作就是他這個新認知的具象體現。
而且在整個對談中,老黃和小扎棋逢對手,互相揶揄和玩笑不斷。自稱自己“不善言辭”的黃仁勛和素有“機器人”之稱的扎克伯格坐在一起互相調侃,甚至拉到自家農場的家常。不由得讓人覺得,人,確實是會變的。
黃仁勛:你能相信嗎?這是現代計算的先驅之一,推動者。我邀請他來參加SIGGRAPH了。馬克,坐下吧。很高興你能來這里。歡迎。謝謝你飛過來。我聽說你已經連續飛行了大約五個小時。
扎克伯格:是的,當然。
黃仁勛: 這是SIGGRAPH,你知道吧?這里有90%是博士。SIGGRAPH真正了不起的地方是,它是計算機圖形學、圖像處理、人工智能和機器人技術的綜合展示。多年來,一些公司如迪士尼、皮克斯、Adobe、Epic Games,當然還有NVIDIA,在這里展示和揭露了許多令人驚嘆的東西。我們在這里做了很多工作。今年,我們在人工智能與模擬的交叉領域引入了20篇論文。
我們正在利用人工智能使模擬規模更大、速度更快,例如,可微分物理學。我們創建了用于人工智能合成數據生成的模擬環境。這兩個領域正在真正融合。我對我們在這里所做的工作感到非常自豪。Meta,你們在AI方面做了令人驚嘆的工作。我發現有趣的一點是,媒體寫到Meta在過去幾年如何涉足AI領域。FAIR做了很多工作——記住,我們都使用PyTorch。那源自Meta。
你們在計算機視覺方面的工作,語言模型方面的工作,實時翻譯上都有開創性的工作。我想問你的第一個問題是,您如何看待Meta當前在生成式AI方面取得的進展?以及您如何應用它來增強您的運營或引入您正在提供的新功能?
扎克伯格:是的,有很多內容需要解釋。
首先,非常高興能來到這里。Meta已經連續八年參加SIGGRAPH。與你們相比,我們還是新手。但我想是在2018年——(被打斷)
黃仁勛:你的裝扮很合適(指扎克伯格的黑色襯衫和自己撞衫)。
01 Meta AI改變臉書的雙核心:
推薦系統和創作能力
扎克伯格:(笑)這里是你的地盤。
(2018年)我們展示了一些為我們的VR和混合現實頭顯所做的早期手部追蹤工作。我認為我們那時討論過Meta在編解碼數字人方面取得的進展。我們希望從消費者級頭顯中驅動那種逼真的數字化身,而我們正越來越接近這一目標。此外,我們還完成了很多顯示系統的工作。我們正在研發的未來原型,旨在使混合現實頭顯能夠變得非常輕薄。我們在光學堆棧和顯示系統方面已經相當先進,這是一個集成系統。這些通常是我們首先在這里展示的內容。
所以很興奮今年能來到這里,不僅討論元宇宙相關的內容,還有所有的人工智能部分。正如你所說,我們當初開始時,人工智能研究中心還是Facebook。現在是Meta,在我們成立Reality Labs之前就已經在這方面工作了一段時間。所有圍繞生成式AI的內容——這是一場有趣的革命。我認為這將最終使我們所做的所有不同產品以有趣的方式變得不同。
我先大概梳理一下我們已經擁有的大型產品線。比如信息流和推薦系統,還有Instagram和Facebook。我們一直在這樣的旅程中,從僅僅是為了與朋友聯系開始(發展到如今的復雜系統)。排序機制一直很重要,因為即使你僅僅關注了朋友,如果某人做了非常重要的事情,比如你的表親生了孩子之類的,你會希望這個消息排在最前面。如果我們把它埋在你的信息流某個角落,你肯定會很生氣。
但如今,在過去幾年里,用戶的關注已經發展到更多是關于外面世界的各種公共內容了。推薦系統變得極其重要,因為現在不再是只有幾百或一千條來自朋友們的潛在發布,而是有數百萬條內容。這就變成了一個非常有趣的推薦問題。而借助生成式AI,我認為我們將很快進入這樣一個領域:你今天在Instagram上看到的大部分內容都是根據你的興趣和是否關注這些人,從外界匹配推薦給你的。但我認為在未來,很多這類內容也將通過這些AI工具來創作。其中一部分將是創作者使用這些工具創作的新內容。而另一部分,我想,最終會是為了你即時創作或從現有內容中整合合成的內容。這只是我們核心業務如何進化的一個例子。而且它已經發展了20年。
黃仁勛:嗯,很少有人意識到,世界上構想過的最大的計算系統之一就是推薦系統。
扎克伯格:是的,我的意思是,這是一條完全不同的道路。它并不是人們談論的那種熱門的生成式AI。但我認為,推薦系統用到的也是Transformer架構。(生成式AI)也是一種類似的情況,(我們現在)只是不斷構建越來越通用的模型。
黃仁勛:就是將非結構化數據嵌入到特征中。
扎克伯格:是的,其中一個重要方面是它推動了質量的提升。過去,每種內容類型都有不同的模型。最近的一個例子是,我們有一個模型用于排名和推薦短視頻,另一個模型用于排名和推薦更長的視頻。然后需要一些產品工作來確保系統能夠在線展示所有內容。但如果你能創建更通用的推薦模型,覆蓋所有領域,效果只會越來越好。我認為部分原因在于內容的經濟性和流動性。你能夠從中汲取的內容池子越廣,你就不會像從不同池子中抽取那樣遇到奇怪的低效問題。
黃仁勛:是的,隨著模型變得更大更通用,效果會越來越好。
扎克伯格:所以我夢想有一天,你可以想象整個Facebook或Instagram就像一個統一的AI模型,整合了所有不同類型的內容和系統,這些內容和系統實際上在不同的時間框架下有著不同的目標。因為其中一部分只是向你展示今天你想要看到的有趣內容。但另一部分則是幫助你長期構建你的社交網絡,推薦你可能認識的人,或是你可能想要關注的賬號。而這些多模態模型往往能提供更好的陪伴。
黃仁勛:你一直在構建GPU基礎設施,長時間運行這些大型推薦系統。
扎克伯格:實際上,談到GPU,在這方面的進展就有點慢了。(笑)
黃仁勛: 是的。你總是盡量表現出善意。
扎克伯格:是的,你知道的,非常善意。
黃仁勛:確實,應該總是保持善意的。你是我的客人。你知道,在他上臺前,在后臺的時候,你提到了關于承認自己的錯誤之類的事兒,對吧?所以...(笑)你沒必要這么主動的想講出來是吧?
扎克伯格:(笑)我覺得這點我已經很好地嘗試過了。
黃仁勛:(笑)是的。但一旦你進入表演狀態,你就會全力以赴。這就對了。
現在,關于生成式AI真正酷的一點是,如今我用WhatsApp時,感覺就像在與WhatsApp合作。我喜歡Imagine。我坐在這里打字,它隨著我的輸入生成圖像。我回頭修改文字,它就生成其他圖像。比如一個中國老人在黃昏時分享受一杯威士忌,身邊有三條狗:金毛尋回犬、金毛貴賓犬和伯尼山犬。它就根據這個生成了一張相當不錯的圖片。
扎克伯格:是的,我們正朝著那個方向前進。
黃仁勛:現在你實際上可以把我的照片上傳上去進去。(所以那個老人)那就是我。
02 AI產品的未來:就算現在模型停止迭代,
我們也得用五年才能發掘出智能體的全部產品潛力
扎克伯格:我最近花了很多時間和女兒們在一起,想象她們變成美人魚之類的角色。非常有趣。一方面,我認為,生成式AI將是對我們長期使用的所有工作流程和產品的一次重大升級。但另一方面,現在它可以創造出許多全新的東西。
所以MetaAI,不光擁有一個能幫你處理不同任務的AI助手的想法,而且在我們的世界它也將會非常注重創意。就像你說的那樣。它們非常通用,所以你不必僅僅局限于此。它能回答任何問題。
隨著時間的推移,當我們從Llama 3類模型發展到Llama 4及以后,我認為,它將會感覺不像是一個聊天機器人,那種你給它一個提示,它就簡單回應,然后你再給它一個提示,它又回應。就這樣一來一回。我覺得它會很快進化到,你給它一個意圖,它實際上就能在多個時間框架內處理它。我的意思是,它可能會根據之前的談話預判你的意圖。但我想,AI最終會變成能啟動需要數周或數月的計算任務,并在世界上發生某些事情時回來找你(并告知你處理方法)。我認為那將會非常強大。
黃仁勛:所以,我的意思是我不太確定。如你所知,今天的AI基本上是回合制的。你說一句話,它回你一句話。但顯然,當我們思考,當我們被賦予一個任務或面對一個問題時,你知道,我們將考慮多種選擇,或者我們可能會提出一個選項樹,一個決策樹,我們會在心中模擬沿著決策樹走下去,你知道,我們可能會做出的每個決策的不同結果是什么。所以我們正在進行規劃。因此,未來的人工智能也會做類似的事情。當你談到你對Creator AI的愿景時,我感到非常興奮,坦白說,我認為那是一個絕佳的想法。請向大家介紹一下Creator AI和AI工作室,正是它們將使你能夠實現那個愿景。
扎克伯格:是的。實際上,我們之前已經討論過一些,但今天我們將更廣泛地推出它。我們的愿景是,我不認為只會有一款人工智能模型,對吧?這是行業內一些其他公司所不具備的,他們似乎在構建一個中心化的智能體系統。而我們確實提供了MetaAI助手供您使用,但我們的愿景更多在于賦能每一位使用我們產品的用戶,讓他們能夠為自己打造專屬的智能體。
無論是平臺上眾多的數百萬創作者還是數億小型企業,我們最終目標是將您的所有內容整合,并迅速搭建一個業務智能體,構建與客戶的互動、進行銷售及客戶支持等全方位服務。因此,我們正在逐步推出的,就是我們稱之為AI工作室的項目,它旨在助力您快速啟動并運營這一智能體系統。這基本上是一套工具,最終將使每位創作者都能構建一個自己的AI版本,作為某種智能體或助手,讓他們的社區能夠與之互動。
這里存在一個根本問題,即一天中根本沒有足夠的時間,對吧?就像如果你是一位創作者,你希望更多地與你的社區互動。但你受限于時間做不到。同樣地,你的社區也希望與你互動。但這很困難。我的意思是,能用來做這件事的時間是有限的。所以,次佳的選擇是,讓人們能夠創造一種智能體,你通過訓練它,讓它基于你的素材來代表你,以你希望的方式呈現。
我認為這是一項非常具有創造性的努力,幾乎像是一種藝術品或你發布的內容。而且,很明顯,它并不是在與創作者本人互動,但我認為這將是一種有趣的方式,就像創作者在社交平臺上發布內容這樣的人,就能夠擁有智能體來完成。同樣地,我認為人們將會創造自己的智能體,用于各種不同的用途。有些會是定制化的實用工具,他們希望對其進行精細調整和訓練。
有些則會是娛樂性質的。人們創造的一些東西只是有趣,你知道的,它有些可能有點傻或者對事物有一種幽默的態度,我們可能無法預料。
用戶可能不會將MetaAI構建為助手,但我認為人們對看到和與之互動相當感興趣。然后我們看到的其中一個有趣的應用場景是人們使用這些智能體進行支持。這一點是讓我有點驚訝的,MetaAI最受歡迎的用途之一是人們基本上用它來模擬他們即將面臨的復雜社交情境。無論是職業場合,比如說,"我想問我的經理,我怎樣才能得到晉升或加薪",或者"我和朋友發生了爭執",或者"我和女朋友遇到了困難",基本上在一個完全沒有偏見的空間里,你可以模擬這種情況并看看會如何發展,如何進行對話并獲得反饋。
很多人,他們不僅僅想與同類型的智能體交互,無論是MetaAI還是ChatGPT,或者其他大家都在使用的工具,他們想要創造自己的東西。
所以這就是我們大致上在AI工作室所要做的方向。但這些都是我們更大的觀點的一部分,我們認為不應該只有一種大型AI供人們交互。我們只是認為,如果存在多種不同的AI,世界會變得更好、更有趣。
黃仁勛:我認為這非常酷,如果你是一位藝術家并且有自己的風格,你可以采用你的風格,你所有的作品集,你可以微調你的一個模型,現在這變成了一個AI模型,你可以來使用它并給出提示。你可以讓我,比如說,創作一些與我所擁有的藝術風格類似的作品,你甚至可以給我一幅作為繪圖的藝術品,一個草圖作為靈感,我就能為你生成一些東西。然后,其他用戶會來到來到我的AI那里(獲得這些能力)。每一個餐廳,每一個網站在未來可能都會有這些AI。
扎克伯格:是的,我有點認為在未來,就像每個企業都有一個電子郵件地址、一個網站和一個或多個社交媒體賬戶,我認為在未來,每個企業都將擁有一個與客戶交互的AI智能體。
黃仁勛: 對。
扎克伯格:這些事情我認為是歷史上一直很難做到的。比如你考慮任何公司,客戶支持部門與銷售部門是兩個完全獨立的組織。而作為CEO,你并不希望它們這樣運作。只是,好吧,它們所需的技能確實有所不同。當你是CEO時,你得處理所有這些事情。
我的意思是,一般來說,當你搭建組織的時候,組織是分開的。因為它們各自優化于不同的事務。但我認為理想化的狀態是它應該是一種統一的存在,對吧?作為消費者,你不想在購買東西時走一條路線,而在遇到已購商品問題時又走另一條路線,你只想有一個地方可以去,能解答你的問題,并且能夠以不同的方式與企業互動。我認為這對創作者也同樣適用。
黃仁勛:我認為這種個人消費者方面的互動,尤其是他們的投訴,將會使你的公司變得更好。
扎克伯格:是的,完全正確。
黃仁勛:所有這些AI與客戶的互動都會讓AI捕捉到那些機構知識,而這些又都可以進入分析系統,這會提升后續人工智能。
扎克伯格:是的。你說的這個版本我認為是個整合度更高的版本,我們仍處于相當早期的alpha階段。但AI工作室讓人們能夠創建自己的UGC智能體和其他內容,開始進入這個讓創作者創作的飛輪。我對這個挺興奮的。
黃仁勛:那么,我能用AI工作室來微調我的圖片,我的圖片集嗎?
扎克伯格: 是的,我們正朝那個方向發展。
黃仁勛:好的。然后,我能把我寫的所有東西都加載進去,讓它作為我的RAG(檢索增強生成)使用嗎?
扎克伯格: 是的,基本上可以。
黃仁勛:好的,是的。每次我回來,它都會重新加載記憶。所以它記得上次離開的地方,我們繼續對話,就像什么都沒發生過一樣。
扎克伯格: 是的。而且我的意思是,就像任何會隨著時間改進的產品一樣,用于訓練它的工具也會變得更好。這不僅僅是關于你希望它說什么。我認為通常創作者和企業也有他們想要避開的主題。
黃仁勛:對。所以在這方面不斷進步。
扎克伯格:是的。你知道,我認為理想的版本不僅僅是文本,對吧?這和我們隨著時間在做的一些編解碼虛擬形象的工作有些交集。你肯定希望能夠和那個智能體進行像視頻聊天一樣的交互,我認為我們隨著時間會達到那一步的。我不認為這些東西離我們太遠,這個飛輪正在非常快速地旋轉。所以這是令人興奮的。有很多新東西需要構建。
我認為即使基礎模型的進展現在停滯不前,盡管我不認為它會停滯,我想我們還會有五年的時間來讓行業基本上弄清楚如何最有效地利用迄今為止已經構建的所有東西。但實際上,我認為,基礎模型和基礎研究方面的進展正在加速。所以,這是一個非常狂野的時期。
黃仁勛:你的愿景是這一切,你某種程度上促成了這一切。所以,謝謝你。你知道,我們是CEO,我們是脆弱的花朵。我們需要很多支持。(笑)
扎克伯格:是的。我們現在已經相當堅韌了。我認為我們是行業中兩位任職時間最長的創始人。對吧?
黃仁勛:我的意思是,這是真的。這是真的。
扎克伯格:而且你的頭發變灰了。我的只是變長了。(笑)
黃仁勛:我的頭發是變灰了。你的變卷了。這是發生了什么?
扎克伯格:它一直都很卷。所以我一直保持短發。
黃仁勛: 是啊。我只是,如果我知道成功需要這么長時間……
扎克伯格:你可能一開始就不會開始。(笑)
黃仁勛:不,我可能會像你一樣從大學退學。早點開始。(笑)
扎克伯格:嗯,這是我們性格的一個好差別。(笑)
黃仁勛:你已經領先了12年。那很不錯。
扎克伯格:你知道,你做得相當不錯。
黃仁勛:我會繼續前進的。(笑)
所以,我喜歡的,關于您對每個人都能擁有AI,每個企業都能在我們公司擁有AI的愿景。我希望每位工程師和每位軟件開發者都能擁有一個AI。
扎克伯格:是的。我們有很多AI。
黃仁勛:我欣賞您的愿景的一點是,您也相信每個人都和每個公司都應該能夠創造自己的AI。所以您實際上是開源了。當您開源了Llama時,我認為那很棒。Llama 2.1,順便說一下,我認為Llama 2可能是去年AI領域最大的事件。
扎克伯格:我原本以為(去年AI領域最大的事件)是H100。(笑)
黃仁勛: 這是個先有雞還是先有蛋的問題。是的。所以這兩者哪個先出現的?
扎克伯格: H100。嗯,Llama 2實際上不是H100。(笑)
黃仁勛: 是的,它是A100。(笑)
03 開源的未來:
不受限制的構建,恢復開放黃金時代
黃仁勛:是的,謝謝。因此,但我說這是最大事件的原因在于,當Llama 2.1 發布時,它激活了每一家公司、每一個企業和每一個行業。突然之間,每家醫療公司都在開發AI,每家公司,無論大小,初創企業都在構建AI。它讓每一位研究者都能重新投入到AI領域,因為他們有了一個起點去做些什么。而現在,3.1版本已經發布,你知道的,我們共同努力部署Llama 3.1,將其推向全球企業。這種興奮之情簡直難以言表。我認為它將推動各種應用的發展。
但請談談你的開源理念。這一理念源自何處?你開源了PyTorch,現在它已成為人工智能開發的框架。而現在,你們已經開源了Llama 3.1。圍繞它建立了一個完整的生態系統。所以,我認為這非常棒。但這一切是從哪里來的呢?
扎克伯格:是的,這里面有很多歷史。我的意思是,隨著時間的推移,我們做了很多開源工作。我認為部分原因,坦白說,是我們在其他一些科技公司之后才開始構建分布式計算基礎設施和數據中心這類東西。而且,正因為如此,當我們構建這些東西時,它已經不是競爭優勢了。所以我們想,那好吧,我們不如干脆將其開源。然后我們將從圍繞它的生態系統中受益。所以我們有很多這樣的項目。
我認為最大的一個例子可能是開放計算項目(Open Compute),我們公開了我們的服務器設計、網絡設計,最終還包括數據中心設計,并發布了所有這些內容。通過使其成為某種行業標準,整個供應鏈基本上都圍繞它進行了組織,這帶來了為每個人節省資金的好處。因此,通過公開和開放這些設計,我們基本上通過這樣做節省了數十億美元。
黃仁勛:嗯,開放計算項目也使得NVIDIA HGX成為可能,我們為一個數據中心設計的東西突然間也能在其他數據中心工作。
扎克伯格:確實如此。太棒了。所以我們有了這次非常棒的經歷。之后,我們還將其應用于我們的一系列基礎設施工具,比如React、PyTorch等。因此,可以說到了Llama出現的時候,我們對做這件事有一種積極傾向。
特別是對于AI模型,我想我有幾種看待這個問題的方式。首先,在過去20年里,在公司里構建東西中最困難的事情之一就是不得不應對這樣一個事實:我們通過競爭對手的移動平臺發布我們的應用。一方面,移動平臺對整個行業產生了巨大的推動作用,這非常棒。另一方面,不得不通過競爭對手來交付你的產品是具有挑戰性的,對吧?
而且,在我成長的時代,Facebook的第一個版本是在網絡上,那是開放的。然后轉向移動端,其好處是,現在每個人口袋里都有一臺電腦。那真是太好了。但不利的一面是,我們在能做的事情上受到了更多限制。因此,當你審視這些計算時代的更迭,你會發現存在一個巨大的近因偏差,人們現在只關注移動設備時代,并認為封閉的生態系統(會帶來更好的結果),因為蘋果基本上贏得了這場勝利并設定了規則。是的,我知道從技術上講,有更多的安卓手機存在,但蘋果基本上掌控了整個市場,而且(贏得了)所有的利潤,基本上安卓在發展方面也在跟隨蘋果的腳步。所以我認為蘋果在這一代中明顯勝出。
但情況并非總是如此。
如果你回顧上一代,蘋果在搞他們那種封閉的模式(MacOS)。但微軟,它顯然不是一個完全開放的公司,但相較于蘋果,Windows在各種不同的OEM廠商和不同軟件、硬件上運行,是一個更為開放的生態系統。而Windows(那時)是領先的生態系統。基本上在個人電腦這一代產品中,開放的生態系統勝出了。
我有點希望在下一波計算浪潮中,我們將重返一個開放生態系統勝出并再次成為主導的領域。總是會有封閉的和開放的兩種選擇。我知道兩者都有其存在的理由。兩者都有其好處。我并不是在這方面極端的人。我的意思是,我們也有閉源的產品。我們發布的并非所有內容都是開源的。
但我認為,對于整個行業所依賴的計算平臺而言,尤其是軟件如果開放,會有很大的價值。這確實塑造了我在這方面的哲學。無論是與Llama合作的AI項目,還是我們在AR和VR領域的工作,我們基本上是在為混合現實構建一個開放的操作系統,類似于Android或Windows,旨在與眾多不同的硬件公司合作,制造各種類型的設備,我們基本上只是希望將生態系統恢復到那個開放的水平。我對下一代的發展相當樂觀,開放的系統將會勝出。
對我們來說,我只想確保我們自己能夠接入(AI)。這么說有點自私,但我的意思是,在創建這家公司一段時間后,我未來10到15年的目標之一就是,我只是想確保我們能夠構建基礎技術,因為這將是我們構建社交體驗的基礎,因為之前我嘗試構建的許多東西都受到了限制。然后你被告知,不,你無法真正構建那個,這是平臺提供商在某一層面的說法。我只想說,不,去他的。對于下一代,我們將一路構建下去。
黃仁勛:好的,我們的直播要被掐了(因為扎克伯格說了Fword)
扎克伯格:是的,抱歉。抱歉。(笑)
黃仁勛:我當時就想說,嗶。(笑)
扎克伯格:是的。你知道,我們前20分鐘做得還不錯,但一談及封閉平臺,我就生氣。(笑)
黃仁勛:有人致力于構建盡可能最好的AI,無論他們如何構建,并將其作為服務提供給世界,我認為這才是一個很棒的世界。然后,如果你想自己構建AI,你仍然可以自己構建AI,這都很棒。但在使用AI的能力這件事上,你知道,有很多東西(我更喜歡開盒即用)。我更傾向于不自己制作這件夾克。我更傾向于讓別人為我制作這件夾克。你明白我的意思嗎?
扎克伯格:是的,是的。
黃仁勛:皮革可以開源對我來說不是一個有用的概念。但我認為你可以擁有偉大的服務,令人難以置信的服務,以及開放的服務,開放的。
扎克伯格: 是的。
黃仁勛:那么我們基本上涵蓋了整個范圍。但你用Llama 3.1所做的事真的很棒,你有405B的版本,你有70B的版本,你有8B的版本,你可以用它來生成合成數據,用更大的模型來教小模型。雖然更大的模型會更通用,它也不那么脆弱,但你仍然可以構建一個更小的模型,適合于任何你希望的操作領域或運營成本。無論你希望的操作領域或運營成本是什么,你都可以構建一個更小的模型來適應。
你創建了一個守衛,我想是叫Llama守衛(Llama Guard),Llama守衛用于護欄,非常棒。所以現在你構建模型的方法,它是以一種透明的方式構建的。你擁有一個世界級的安全團隊,世界級的倫理團隊,你可以以這樣一種方式構建它,讓每個人都知道它是正確構建的。我真的很喜歡這部分。
扎克伯格:是的,我先說完在我之前被岔開話題之前想說的話。你知道,我確實認為我們有這種一致性,我們構建(開源AI)是因為我們希望它存在,并且我們不希望被某些封閉的模型所隔離。而這不僅僅像是開發一款軟件那么簡單,AI需要一個生態系統的支撐。因此,幾乎可以說,如果我們不將其開源,它甚至可能無法很好地運作。
我們這樣做并非因為我們是什么無私的人,盡管我認為這對生態系統是有益的。我們這樣做是因為我們認為,通過建立一個強大的生態系統,可以使我們正在構建的東西達到最佳狀態,看看有多少人參與到了PyTorch生態系統的建設中。
黃仁勛:(這需要)大量的工程工作。我的意思是,僅視頻處理方面,我們可能就有數百人專門致力于讓PyTorch更優秀、更具擴展性,你知道的,性能更佳等等。
扎克伯格:是的,而且當某個技術成為行業標準的時候,其他人就會圍繞它進行創新,對吧。因此,所有的硬件和系統最終都會被優化,以便非常好地運行這項技術,這將使所有人受益,同時它也能很好地兼容我們正在構建的系統。而這一點,我認為只是展示了(開源)這種方式最終會變得非常有效的一個例子。
扎克伯格:所以,我認為開源策略作為商業策略將會是一個好的選擇。我想人們可能還沒完全意識到我們有多么熱愛它。
黃仁勛:我們圍繞它建立了一個生態系統。我們創造了這個東西。
扎克伯格:是的,我發現這一點了。你們團隊的表現一直很出色。每次我們推出新產品,你們是首批發布并優化使其運作的團隊。我很感激這一點。
黃仁勛:我還能說什么呢?我們確實有不少優秀的工程師。
扎克伯格:(笑)而且,你們也總是迅速抓住這些機會。
黃仁勛:所以,我雖是長者,但行動敏捷。這就是CEO必須做的。
我認識到了一件重要的事情。我認為Llama確實非常重要。我們圍繞它構建了一個名為AI工廠(AI Foundry)的概念,以便幫助每個人構建AI。很多人,他們有構建AI的愿望。對他們來說,擁有AI非常重要,因為一旦他們將其融入數據飛輪,這就是他們公司機構知識被編碼并嵌入AI的方式。但他們承擔不起讓那個AI飛輪,數據飛輪在其他地方(通過購買服務)轉起來的成本。因此開源允許他們這樣做。但他們并不真正知道如何將這一切轉化為AI。所以我們創建了這個名為AI Foundry的東西。我們提供工具,提供專業知識,Llama的技術,我們有能力幫助他們將這一切轉化為AI服務。然后當我們完成這一切后,他們接手,他們擁有,其輸出就是我們所說的NIMM。這個NIMM,這個神經微型NVIDIA推理微服務,他們只需下載,帶走并在任何他們喜歡的地方運行,包括本地部署。我們擁有一個完整的合作伙伴生態系統,從能夠運行NIMMs的OEM到像Accenture這樣的GSIs,我們培訓并與他們合作創建基于Llama的NIMMs和管道。現在我們正在幫助全球各地的企業實現這一目標。我的意思是,這確實是一件非常令人興奮的事情。這一切實際上都是由Llama的開源引發的。
04 AI產業的未來:
模型不會一家獨大,從小到大的模型都有場景
扎克伯格: 是的,我認為,幫助人們從大型模型中提煉出自己的模型的能力,將成為一個真正有價值的新事物。就像我們在產品方面討論的那樣,至少我不認為會有一個每個人都會去跟它交流的核心AI智能體。在同一水平上,我也不認為必然會有一個模型是每個人都會使用的。
黃仁勛: 我們有一個芯片AI,芯片設計AI。我們有一個軟件編碼AI。我們的軟件編碼AI理解USD,因為我們用USD為Omniverse編寫代碼。我們有一個理解Verilog的軟件AI,我們的Verilog。我們擁有能夠理解我們的缺陷數據庫的軟件AI,并且知道如何幫助我們分類缺陷并將其發送給正確的工程師。
這些AI中的每一個都是基于Llama進行微調的。我們會對它們進行微調,并設置防護措施。你知道,如果我們有一個用于芯片設計的AI,我們并不希望詢問它關于政治、宗教之類的問題。所以我們會對它進行防護限制。因此,我認為每家公司基本上都會為它們擁有的每一個功能,配備專門為此構建的AI。他們需要幫助來實現這一點。
扎克伯格:是的,我認為未來的一大問題是,人們將多大程度上使用更大、更復雜的模型,而不是僅僅針對他們的需求訓練自己的模型。至少我可以肯定,未來會有各種各樣、數量龐大的不同模型涌現。
黃仁勛:我們使用的是最大型的那些模型。而這樣做的原因在于,我們的工程師時間極其寶貴。因此,我們現在正針對性能優化405B版本的Llama 3.1。如你所知,無論GPU多大,405B都無法完全適配。這就是為什么NVLink的性能如此關鍵。我們采用了這種技術,通過一個名為NVLink的非阻塞交換機,將每塊GPU連接起來。
例如,在一個HGX中,就有兩個這樣的交換機。我們使得所有這些GPU能夠協同工作,運行405B時性能極為出色。我們這樣做的原因是,工程師的時間對我們來說極其寶貴。你知道,我們希望使用盡可能最佳的模型。即便這樣做在成本上只節省了幾分錢,誰又會在乎呢?因為我們希望確保向他們展示的是最優質的結果。
扎克伯格:是的,我的意思是,我認為405B的成本大約是GPT-4模型的一半。所以,從這個層面來說,它已經相當不錯了。但我認為人們正在設備上使用或需要更小型的模型,他們會將其精簡。因此,這就像是AI運行的一整套不同的服務。
黃仁勛:讓我們假設一下,我們正在用于芯片設計的AI每小時可能只需10美元成本。你知道,如果你持續使用它,并且將那個AI共享給眾多工程師,那每個工程師可能都有一個成本不高的AI陪伴著他們。這個AI的成本其實并不高。而我們支付給工程師的薪酬卻很高。
因此,對我們來說,每小時幾美元就能大幅提升那些尚未接入AI的人的能力。立刻行動,接入一個AI吧。我們想說的就是這些。
那么,讓我們談談下一波趨勢。你們所做的工作中,我特別喜歡的一點是,計算機視覺,我們內部大量使用的一個模型是 Segment Everything。你知道,我們現在正在視頻上訓練AI模型,以便我們能更好地理解世界模型。我們的應用場景是機器人技術和工業數字化,將這些AI模型接入Omniverse,以便我們能更好地建模和表達物理世界。讓機器人在這些Omniverse世界中更好地運作。因此你的應用,Ray-Ban Meta眼鏡,你將AI引入虛擬世界的愿景真的很有趣。給我們講講吧。
扎克伯格:好的,嗯,這里面有很多值得探討的內容。你所談論的那個Segment Everything模型,我們實際上在SIGGRAPH上展示了它的下一個版本,Segment Everything 2。現在它已經能正常運行了,速度更快了。它現在也能處理視頻了。我覺得這些實際上是我考艾島牧場的牛。順便說一下,它們被稱為馬克的小牛,美味的小牛。
黃仁勛:美味的馬克的小牛。所以馬克下次來我家,我們得一起做費城奶酪牛排。你直接帶牛過來。
扎克伯格:然后你做奶酪,我就當副廚。這牛真的非常好吃。
黃仁勛:這是副廚的評價。
扎克伯格:好吧,聽著。然后在晚上結束時,你就像,"嘿,你吃得夠多了,對吧?"然后我就說:"不知道,我還能再吃一個。"你就像:"真的嗎?"
黃仁勛:我肯定像是在說:"對,我們還要再做一些。我們還要再做一些。你吃飽了嗎?"通常你的客人會說:"哦,是的,我很好。"
扎克伯格:“再給我做一個芝士牛排,老黃。”
黃仁勛: 所以,為了讓你知道他有多強迫癥,我轉過身去,我在準備芝士牛排。然后我說:"馬克,切一下西紅柿。" 遞給馬克一把刀。
扎克伯格: 對,我是個精確的切割者。
黃仁勛:然后他就切西紅柿。每一個都切得精確到毫米。但真正有趣的是,我以為所有的西紅柿都會被切成片,然后像一副撲克牌那樣疊起來。當我轉過身時,他說他需要另一個盤子。而他這樣做的原因是,他切的每一片西紅柿,彼此之間都不能有接觸。一旦他把一片西紅柿與其他西紅柿分開,它們就不應該再碰到一起。
扎克伯格:是啊,你看,伙計,如果你希望它們接觸,你應該提前告訴我。你需要...我只是一個副廚,好嗎?
黃仁勛:這就是為什么他需要一個不帶偏見的AI。
扎克伯格:是的。(笑)
黃仁勛: 這真的很酷。好的,所以它在識別牛的足跡...它在追蹤牛的足跡。
扎克伯格:用這個可以制作很多有趣的特效。而且因為它會被廣泛開放,行業內還會有更多嚴肅的應用。所以我的意思是,科學家用這些東西來研究珊瑚礁、自然棲息地以及地形的演變等等。但我的意思是,它能夠在視頻中實現這一點,告訴它你想追蹤的內容,你就能擁有B-roll鏡頭并能夠與之互動。這真是非常酷的研究。
黃仁勛:我舉個例子,告訴你們我們使用它的場景。比如,你有一個倉庫,里面裝滿了攝像頭。倉庫的AI正在監控著所有發生的事情。假設一堆箱子倒塌了,或者有人在地面上灑了水,或者即將發生任何意外,AI識別到這一情況,生成文字信息,發送給相關人員,救援就會在路上。這就是使用它的一個方式。不是記錄所有事情,如果有事故發生,不是記錄每一納秒的視頻,然后再回去檢索那個時刻,它只記錄重要的內容,因為它知道自己在看什么。因此,擁有一個視頻理解模型,一個視頻語言模型對于所有這些有趣的應用來說,確實非常強大。那么,你們接下來還會研究些什么呢?Ray,跟我談談...
05 計算平臺的未來:
別XR了,就AI+潮眼鏡就能賣10億個
扎克伯格:是的,還有所有智能眼鏡。我認為,當我們考慮下一代計算平臺時,我們會將其分解為混合現實(XR)、頭戴設備和智能眼鏡。而智能眼鏡,我認為人們更容易接受并佩戴它們,因為現在幾乎每個戴眼鏡的人最終都會升級為智能眼鏡。這在全球有超過十億人。所以這將是一個相當大的市場。
VR/MR頭戴設備,我認為有些人覺得它們在游戲或其他用途上很有趣,有些人則還不這么認為。我的觀點是,它們都將存在于這個世界。
我認為智能眼鏡將類似于手機,是常駐型計算平臺的下一個版本。而混合現實頭顯則更像你的工作站或游戲主機,當你坐下來進行更沉浸式的體驗,并需要更多計算資源時。眼鏡(大小)只是非常小的形式因素。因為算力將帶來很多限制,就像你不能在手機上進行(和計算機)同樣級別的計算一樣。
黃仁勛:它恰好出現在所有這些生成式AI突破發生的時候。
扎克伯格:是的,所以我們基本上,對于智能眼鏡,我們一直從兩個不同的方向來解決這個問題。一方面,我們一直在構建我們認為的那種理想全息增強現實(AR)眼鏡所需的技術,并且我們正在進行所有定制硅芯片的工作,所有定制顯示堆棧的工作,就像為了實現這一目標所需做的所有事情。而且它們是眼鏡,對吧?不是頭戴式設備。不像VR/MR頭顯。它們看起來就像普通眼鏡。但它們與你現在戴的眼鏡相比,還有相當大的差距。我是說你的眼鏡非常薄。
但即便我們制造的雷朋眼鏡,目前還無法將實現全息AR所需的所有技術完全融入其中。我們正在接近,我認為未來幾年我們會越來越接近。它仍然會相當昂貴,但我們還是會把它推出成一個產品。
我們考慮的另一個角度是,先從外觀好看的智能眼鏡開始。通過與全球頂尖的眼鏡制造商EssilorLuxottica合作,他們基本上涵蓋了你所熟知的所有大牌,比如雷朋、奧克利、奧利弗·皮普爾斯,以及其他少數幾個品牌。這些幾乎都屬于EssilorLuxottica旗下。
黃仁勛:(就像)NVIDIA眼鏡(那么大牌)。(笑)
扎克伯格我想,你知道,他們大概也會喜歡這種比喻。我是說,誰會不喜歡呢?在當下,誰會不想要這樣的眼鏡呢?
扎克伯格:但我們一直在與他們合作開發雷朋系列,現在已經是第二代了。
我們的目標是,好吧,讓我們將外形限制在看起來非常棒的范圍內。然后在這個框架內盡可能多地融入技術,盡管我們知道在技術上還無法達到我們理想中的完美整合,但最終,它們將會是外觀出色的眼鏡。到目前為止,我們配備了攝像頭傳感器,因此您可以拍照和錄像,您實際上可以實時直播到Instagram,您可以在WhatsApp上進行視頻通話并實時傳輸給對方,您知道,您所看到的畫面。它配備了麥克風和揚聲器,我是說,那個揚聲器實際上非常出色。它就像,開放式耳道設計,因此許多人覺得它比耳塞更舒適。您可以聽音樂,就像擁有一段私密的體驗,這相當不錯。人們很喜歡這一點,您可以在上面接聽電話。
但我們發現,這些傳感器組合正是與AI對話所需的。所以這可以說是個意外的發現。如果五年前你問我,我們會先實現全息AR還是AI?我可能會說,大概是全息AR吧。對吧,我的意思是,這看起來就像是所有虛擬現實和混合現實技術上的進步,以及構建新的顯示技術棧。我們正朝著這個方向不斷取得進展。然后,大型語言模型(LLMs)取得了突破,結果是我們現在擁有了高質量的人工智能,并且在全息增強現實(AR)出現之前,它的改進速度非常快。
所以這是一種我未曾預料到的轉變。幸運的是,我們處于有利位置,因為我們一直在研究這些不同的產品,但我認為最終你會得到一系列不同價格、不同技術水平的潛在眼鏡產品。所以,基于我們現在看到的Ray-Ban Meta的情況,價格在300美元左右的無顯示屏AI眼鏡將成為一個非常熱門的產品,最終可能會有數千萬甚至數億人使用。屆時,你將與高度互動的AI進行對話。
黃仁勛:它會有你剛才展示的視覺語言理解技術。實時翻譯功能。你可以用一種語言與我交談。我聽到的是另一種語言。
扎克伯格:當然,有顯示屏也會很棒,但這會增加眼鏡的重量,使其價格更高。因此,我認為很多人會想要那種全息顯示效果,但也有很多人希望最終能擁有類似超薄眼鏡的產品。
黃仁勛:對于工業應用和某些工作場合,我們確實需要(虛擬現實)這樣的技術。
扎克伯格:對于消費品也是如此。我在疫情期間思考過這個問題,當時大家都短暫地遠程工作了一段時間。就像你整天都在Zoom上,這還算過得去。雖然現在我們有這些工具已經挺棒了,但未來我們離實現虛擬會議并不遙遠。到那時我并不實際在場,你看到的只是我的全息影像,但感覺就像我們真的在那里,身體上也在場。我們可以一起工作,共同協作。但我認為這在與AI合作時尤為重要。
黃仁勛:我可以接受一個不需要我時刻佩戴的設備。
扎克伯格:哦,是的,但我認為我們終將達到那個實際應用的階段。我的意思是,在眼鏡中,有細框和粗框,還有各種風格,但我認為我們離擁有全息眼鏡的形式還有一段時間,不過我認為在不久的將來,擁有一副時尚且稍顯粗框的眼鏡并不遙遠。
黃仁勛:這些(小型智能)太陽鏡現在越來越貼合人臉了。我能看出來。
扎克伯格:是的,你知道嗎,這是一個非常有用的風格。無論你信不信,但我正努力成為一名潮男,以便在眼鏡上市前影響這種風格。(笑)
扎克伯格:我能看出你在嘗試。你的潮男之路進行得怎么樣了?(笑)
黃仁勛:還早。但我覺得,如果未來業務的一大塊是打造人們佩戴的時尚眼鏡,那我可能應該開始多關注這方面了。
扎克伯格:沒錯。完全同意。我們得讓那個每天穿同樣衣服的我退休了。(笑)但這就是眼鏡的特別之處。我覺得它不同于手表或手機,人們真的不希望都長得一樣。
黃仁勛:對,所以我認為,你知道的,這是一個平臺,我覺得它會傾向于我們之前討論的主題,成為一個開放的生態系統,因為人們對于形式多樣性和風格的需求將會非常大。并不是每個人都會想要那種你知道的,其他人設計的類似的那種眼鏡,我不認為這對這次來說會行得通。
扎克伯格:是的,我認為你說得對。
06 結束語:
軟件3.0時代已經到來
黃仁勛:馬克,我們正處在一個整個計算堆棧正在被重新發明的時代,這真是不可思議。我們對軟件的思考方式,你知道安德烈稱之為軟件1.0和軟件2.0,而現在我們基本上處于軟件3.0的時代了。從通用計算到生成式神經網絡處理方式的轉變,我們能夠開發的計算能力和應用在過去的想象中是不可思議的。這種生成式AI技術,我記不清還有哪項技術能以如此快的速度影響消費者、企業、行業和科學界,并且能夠跨越從氣候技術到生物技術再到物理科學等所有不同科學領域。在我們遇到的每一個領域,生成式AI都正處于這一根本性轉變的核心。
而且,除了你提到的生成式AI將在社會中產生深遠影響之外,我非常興奮的一件事是,有人之前問我是否會有一個"Jensen AI",那正是你所說的創造性AI,我們可以構建自己的AI,并加載所有我寫過的內容,通過我回答問題的方式進行微調,希望隨著時間的積累,它能成為一個真正出色的助手和伙伴,為那些只想提問或交流想法的人服務。這個版本的Jensen AI不會評判你,你不必擔心被評判,因此你可以隨時與它互動。我認為這些都是非常了不起的事情。我們經常寫很多東西,而僅僅給它三四個主題,讓它以我的聲音寫出我想要的基本主題,并以此為起點,這是多么不可思議。現在我們可以做的事情實在太多了,與你合作真的很棒。
我知道建立一家公司并不容易,你將你的公司從桌面轉向移動、VR再到AI,所有這些設備,這真的非常非常不尋常。我們自己也多次轉型,我知道這有多難。多年來,我們倆都經歷了很多挫折,但這就是成為先驅和創新者所需要的。看著你真的很棒,同樣,我不確定這是否算轉型,如果你一直在做之前的事情,但你也增加了新的內容,這意味著還有更多的章節等待我們。我認為對你來說也是如此,看著你們的旅程很有趣。
我的意思是,你們經歷了一個時期,當時每個人都認為一切都會轉向這些設備,計算會變得非常便宜,但你們一直堅持不懈,就像實際上你們會需要這些能夠并行處理的大型系統一樣。
扎克伯格:是的,我們曾經一段時間內制造越來越小的設備,但后來我們讓計算機變得時尚了一段時間,然后變得不那么時尚,甚至超級不時尚,但現在又酷起來了。
黃仁勛:我們制造圖形芯片GPU,現在你部署GPU。Zuck在他的數據中心里有成千上萬的H100。我想你們即將達到600,000塊GPU的機組。
扎克伯格:我們是優質客戶。這就是如何在大會上獲得Jensen問答環節的秘訣。(笑)
當他們說"你知道嗎,幾周后我們在SIGGRAPH有個活動",我就想,"是啊,我覺得那天我沒什么安排,不在丹佛,聽起來很有趣,我那天下午也沒什么安排"。
黃仁勛:(所以)你就這么出現了,但關鍵是,你們構建的這些系統,它們是巨大的系統,非常難以協調,非常難以運行,你知道你比大多數人晚進入GPU領域,但你運營的規模比任何人都大,看著你所做的一切真是令人難以置信,恭喜你所做的一切,你現在真是個潮流引領者。