国内精品免费视频-国内精品视频成人一区二区-国内精品视频免费观看-国内精品视频在线播放一区-日本狠狠操-日本狠狠干

目錄

榮譽與背叛:字節 訴訟遇到 NeurIPS 最佳論文

互聯網2024-12-05
2024年12月3日,在這個離年末僅有27天的日子里,一件AI界頗具戲劇性的事件發生在字節跳動的一個前實習生身上。北京大學研究生田柯宇憑借其在視覺生成領域的開創性工作獲得了NeurIPS大會最佳論文獎。在人工智能領域的學術殿堂中,NeurIPS的地位堪比文學界的諾貝爾獎。它創立于1987年,這個大會見證并推動了從簡單神經網絡到現代深度學習的整個革命進程。但在...

字節_副本.jpg

2024年12月3日,在這個離年末僅有27天的日子里,一件AI界頗具戲劇性的事件發生在字節跳動的一個前實習生身上。

北京大學研究生田柯宇憑借其在視覺生成領域的開創性工作獲得了NeurIPS大會最佳論文獎。

1_副本.jpg

在人工智能領域的學術殿堂中,NeurIPS的地位堪比文學界的諾貝爾獎。它創立于1987年,這個大會見證并推動了從簡單神經網絡到現代深度學習的整個革命進程。

但在頒獎當天,NeurIPS大概率會面對一張空椅子。因為獲獎者田柯宇正面臨著字節跳動八百萬元的訴訟,原因是“涉嫌破壞其AI訓練系統”。

01 公司的罪人和學術的天才

田柯宇的學術履歷堪稱完美:本科畢業于北京航空航天大學軟件學院,隨后進入北京大學攻讀研究生,師從知名學者王立威教授。

他研究的重點是深度學習優化與算法,在攻讀學位期間就已在多個頂級會議發表論文,包括ICLR 2023的Spotlight論文《Spark:Designing BERT for Convolutional Networks》,是其引用量最高的論文。

2_副本.jpg

2021年,田柯宇開始了在字節跳動商業化技術部門的實習。在這里,他參與了一個雄心勃勃的項目:開發新一代的視覺生成模型。這個后來被命名為VAR(Visual Autoregressive Modeling)的項目,試圖徹底改變AI生成圖像的方式。

然而就在今年10月18日,網上開始流傳字節實習生“投毒”大模型的聊天截圖,給公司造成了極大損失。

這起事件的細節后續得到了更多披露。矛頭很快指向了田柯宇。

一位在GitHub上發聲的知情人士描繪了這場持續兩個月的"數字破壞":"在這段時間里,他系統性地破壞集群代碼,直接導致近30位同事的工作成果付諸東流,整整一個季度的心血化為烏有。所有的日志記錄和系統審查都指向一個不容辯駁的事實。"

3_副本.jpg

10月21日,界面新聞從知情人士處了解到,字節跳動內部已經調查明確此事為田姓實習生所為。

事件曝光后,這位北大高材生試圖通過社交媒體自證清白,聲稱真正的破壞者另有其人。

4_副本.jpg

(網傳的田柯宇在社群中的回應)

這種"甩鍋"行為很快就被接近字節跳動的人士予以駁斥。一位不愿透露姓名的字節內部人士向澎湃新聞透露了公司的處理邏輯:考慮到田柯宇的在讀博士身份,公司最初選擇了相對溫和的處理方式,將其辭退并交由校方處理。這也在字節官方的回應中有所體現。

5_副本.jpg

然而,事態在田柯宇的一系列反應中急轉直下。他后續不僅多次公開否認指控,聲稱真正的攻擊者是其他實習生,甚至報警稱自己是造謠受害者。這種拒不認錯、反咬一口的態度,最終耗盡了字節的耐心。"他完全沒有意識到自己的錯誤性質和嚴重程度,"據澎湃新聞采訪到內部人士說,"這種行為已經觸及公司安全管理的紅線。"最終,字節跳動決定通過法律途徑追責,以儆效尤,防止類似事件重演。

據《南方都市報》11月27日報道,字節跳動起訴前實習生田某某篡改代碼攻擊公司內部模型訓練一案,獲北京市海淀區人民法院正式受理。字節跳動請求法院判令田某某賠償公司侵權損失800萬元及合理支出2萬元,并公開賠禮道歉。

這也反證了當年字節極力否認的網傳“1000萬”的損失。

但也正是在字節工作期間,田柯宇寫出了他的這篇含金量極高的獲獎論文。論文的五位作者中,有四位都是來自于字節,而田柯宇是第一作者。

6_副本.jpg

02 含金量極高的獲獎論文

要理解NeurIPS最佳論文的分量,我們不妨回望2014年的一個歷史性時刻。那年《Sequence to Sequence Learning with Neural Networks》都未獲得最佳論文,僅僅進入了oral(口頭演講》環節。

這篇出自Ilya Sutskever、Oriol Vinyals和Quoc V. Le之手的論文不僅是一項學術成就,更像是為人工智能劃出了一條全新的航道。

彼時還默默無聞的三位作者,如今已是AI領域的標志性人物:Sutskever成為了OpenAI的聯合創始人,在GPT系列的開發中發揮核心作用;Vinyals在DeepMind主導了AlphaFold的突破;Le則在Google Brain推動了大語言模型的革新。他們的序列到序列學習框架,為今天ChatGPT、Claude這樣的自回歸語言模型奠定了理論基石。

而當年獲得了最佳論文的李平教授,在回國后曾任百度首席架構師(T11)和百度研究院副院長。

7_副本.jpg

NeurIPS的錄用門檻極其嚴苛,獲得這個獎的難度有多高呢?

據數據統計顯示,以2023年為例,大會收到12,343篇投稿,最終接受率為26.1%。而能夠入選口頭報告(Oral)的論文更是鳳毛麟角,通常不到1%。

在這樣的背景下,VAR論文不僅入選Oral,還以近乎滿分的評審分數(7,8,8,8)摘得最佳論文桂冠,其學術分量可見一斑。田柯宇北大同一實驗室的同學對騰訊科技表示,此論文為第一篇來自中國大陸的NIPS最佳論文。

這篇名為《視覺自回歸建模:基于下一尺度預測的可擴展圖像生成》的論文,發布于2024年5月,它代表了AI系統生成圖像方式的重大突破。

傳統的圖像生成方法就像在一頁紙上從左到右、從上到下依次填寫文字。VAR則采用了一種更接近人類直覺的方法:先勾勒出大致輪廓,再逐步添加細節。

具體來說,VAR包含兩個訓練階段:首先通過多尺度VQVAE將圖像編碼為不同分辨率的標記映射,然后訓練VAR Transformer來預測更高分辨率的細節。

8_副本.jpg

這篇論文提出的視覺自回歸建模(VAR)方法首次證明了GPT式模型可以在圖像生成方面超越擴散模型——這是許多人認為不可能的里程碑。在ImageNet 256×256基準測試中,VAR將圖像質量評估指標FID從18.65提升至1.73,生成速度提高了20倍。

9_副本.jpg

更重要的是,VAR展現出此前只在大型語言模型中觀察到的特征:清晰的冪律縮放和零樣本泛化能力。

用更簡單的話來說就是,系統隨著規模增大而可預測地變得更好,并且能夠處理它沒有專門訓練過的任務——這是更高級AI系統的標志。這些特性暗示了視覺AI可能與語言AI走向統一的道路。

10_副本.jpg

目前,VAR的代碼已在GitHub上開源,獲得了超過4400顆星標。

從其技術價值和實際獲得的榮譽來看,這篇論文和田柯宇的科研含金量都極高。然而,正是因此,他讓前公司字節陷入了兩難之境。

03 兩難的字節

對字節跳動而言,田柯宇大模型“投毒”事件帶來的打擊遠比表面看起來要嚴重。

更具戲劇性的是,當VAR論文在NeurIPS載譽而歸時,字節跳動卻陷入了進退維谷的尷尬境地。

作為一家渴望在AI領域與谷歌、OpenAI等全球巨頭競爭的中國科技公司,字節跳動在人工智能基礎研究上投入了數以億計的資金。這項突破性研究確實誕生于字節實驗室,但公司卻無法在學術社區大張旗鼓地宣傳這一成就——因為論文的第一作者正被公司起訴。

這種矛盾直指當前公司管理的某種困境:如何對有才干的科學家分配有效的資源,給予個體更有效的表彰?在愈發龐大的字節,這一命題也變得越來越難解。尤其在OpenAI、Anthropic等競爭對手普遍采取更開放研究政策的背景下,大公司很可能因為組織結構的問題在吸引和保留頂尖AI人才的戰爭中落敗。

更令人深思的是,田柯宇能夠如此輕易地破壞訓練系統,暴露出字節在核心技術安全管控上的致命漏洞。這對于一家掌握著數億用戶數據、運營著多個AI大模型的科技巨頭而言,無疑是一記響亮的警鐘。


您暫未設置收款碼

請在主題配置——文章設置里上傳

掃描二維碼手機訪問

文章目錄