馬斯克的 xAI 也入局世界模型了!
想必聽到這個消息的 Meta、Google DeepMind 一定會緩緩打出一個問號:沖我們來的?
據(jù)《金融時報》(FT)報道,為了增加這場 " 世界模型大混戰(zhàn) " 的贏面,今年夏天,xAI已經(jīng)從英偉達挖來了多名資深研究員來助陣。
另一邊,在悄然下場世界模型后,馬斯克幾天前又在上再次重申了去年定下的那個 " 小目標(biāo) " ——
2026 年年底前,xAI 會發(fā)布一款偉大的 AI 生成游戲。
OpenAI 今年收入約 100 億美元,視頻游戲行業(yè)今年收入約 2000 億美元。
馬斯克呀馬斯克,Attention is all you need(狗頭)。
世界模型是近兩年全球 AI 巨頭 & 實驗室們的新戰(zhàn)場,Google DeepMind、Meta、NVIDIA、李飛飛等都在做。
如今,xAI 也來了。
而它的第一步,就選擇了去英偉達挖老黃墻腳——
今年夏天,xAI 至少雇傭了兩位來自英偉達的研究人員:Zeeshan Patel和Ethan He。
其中,Zeeshan Patel 今年 5 月碩士畢業(yè)于 UC 伯克利,研究主要面向深度學(xué)習(xí)、生成模型和物理人工智能。
加入 xAI 前,他先在蘋果 AI/ML 部門從事基礎(chǔ)模型研究,后又加入英偉達研究院從事生成式世界模型研究。
在英偉達工作期間,Zeeshan Patel 專注于大規(guī)模多模態(tài)模型與訓(xùn)練框架的研發(fā)
目前,他的 Google Scholar 被引數(shù)為 8495。
2019 年到 2021 年期間,Ethan He 在 FaceBook AI 從事研究工程師,工作內(nèi)容主要包括大規(guī)模視頻自監(jiān)督學(xué)習(xí)、視頻基礎(chǔ)模型等。
2023 年,他加入英偉達,工作內(nèi)容均與 MoE 模型、多模態(tài)模型和世界模型有關(guān)。
今年 7 月,他正式加入 xAI。
這個平臺是全球最成熟的仿真平臺之一,被稱作 " 通往物理世界的數(shù)字平行宇宙 "。
簡單來說,Omniverse 是英偉達打造的物理一致性仿真系統(tǒng),廣泛應(yīng)用于機器人訓(xùn)練、3D 建模、數(shù)字孿生、自動駕駛等領(lǐng)域。
它能在虛擬世界中精確地模擬現(xiàn)實物理規(guī)律,讓 AI 在不觸碰現(xiàn)實的情況下,就能學(xué)會如何與世界互動。
——而世界模型需要的就是這樣的能力。
Omniverse 與世界模型訓(xùn)練 / 評測天然契合,難怪 xAI 內(nèi)部人士透露,馬斯克計劃在 xAI 將英偉達在圖形與物理模擬領(lǐng)域的積累,應(yīng)用到自家的世界模型體系中。
入局世界模型要干啥?
" 世界模型 " 這個概念,其實最早可以追溯到強化學(xué)習(xí),意思是讓 AI 先在腦海中模擬出一個世界,再去規(guī)劃行動、預(yù)測結(jié)果。
而時至今日,它被不少業(yè)內(nèi)人士視為 AGI 的核心底座。
AI 教母李飛飛對世界模型的定義則是源自于人類自然形成的世界心智模型。
指的是一種 AI 系統(tǒng)能夠真正理解和推理物理 3D 世界的模型,而不僅僅局限于文本處理。
世界模型能讓 AI 理解 3D 結(jié)構(gòu)、形狀和組合性,從而推動機器人技術(shù)、創(chuàng)意產(chǎn)業(yè)和計算的未來發(fā)展。
在李飛飛看來,世界模型不僅能生成和重建持久存在、可導(dǎo)航的 3D 環(huán)境,還能支持多種應(yīng)用,實現(xiàn)更大規(guī)模的虛擬世界和多元宇宙的構(gòu)建。
DeepMind 推出 Genie 3,能從一張圖片或一段文字,直接生成可交互的 2D 游戲世界;
Meta 發(fā)布 V-JEPA-2,讓模型在視頻中預(yù)測未來幀、理解物理因果;
英偉達自家也在強化世界模型,用于機器人訓(xùn)練與數(shù)字孿生;
……
那么,馬斯克攜 xAI 下場,到底想干啥?
知情人士消息,xAI 入局世界模型后的的首批落點可能是電子游戲。
目前,團隊正在嘗試讓 AI 自動生成自適應(yīng)、逼真的 3D 場景,可以根據(jù)玩家行為實時變化的那種。
這與馬斯克自己設(shè)下的目標(biāo)完美呼應(yīng)——到 2026 年底,推出一款由世界模型驅(qū)動的 AI 生成游戲。
一位用戶在上留言稱:"AI 在游戲開發(fā)中的效率很高,能讓創(chuàng)造力自由流動,這很有道理。"
他們近期公開的招聘信息顯示,這支團隊包括多個方向:
Member of Technical Staff – Multimodal(Audio),職責(zé)涵蓋音頻理解、生成與評測;
Member of Technical Staff – Multimodal Understanding,薪資區(qū)間 18 萬– 44 萬美元 / 年,側(cè)重于多模態(tài)建模與數(shù)據(jù)系統(tǒng)。
除此之外,還有一個職位在業(yè)內(nèi)引發(fā)熱議,Video Games Tutor,即電子游戲?qū)煛?/p>
相關(guān)招聘頁面寫得很直接:
時薪 45 – 100 美元,向模型講解電子游戲機制、敘事邏輯、任務(wù)設(shè)計。
看來,馬斯克似乎打算讓人類專家教模型怎么玩游戲、怎么設(shè)計任務(wù)、如何構(gòu)建可交互世界。
馬斯克本人在多次公開發(fā)言中提到,xAI 的使命是 " 讓 AI 理解宇宙的本質(zhì) "。而世界模型正是通向理解宇宙的必經(jīng)之路。
有了世界模型,AI 不再只用來生成內(nèi)容,而能在內(nèi)部模擬出一個真實世界的副本。
這意味著它既可以驅(qū)動 AI 游戲,也可以驅(qū)動智能體、自動駕駛乃至具身智能機器人。
從這一點上來看,xAI、特斯拉、Neuralink、之間的關(guān)系也變得微妙——
xAI 研發(fā)模型,特斯拉擁有機器人和自動駕駛數(shù)據(jù),Neuralink 提供腦機接口則是社交與實時反饋的平臺。
如果這些板塊能通過世界模型互通,馬斯克的 AI 帝國,將真正形成閉環(huán)。
參考鏈接:
[ 1 ] https://www.ft.com/content/ac566346-53dd-4490-8d4c-5269906c64ee
[ 2 ] https://x.com/EMostaque/status/1977352468087320714
[ 3 ] https://www.zeeshanp.me/research/
[ 4 ] https://www.linkedin.com/in/ethanhe42/
一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評論區(qū)留下你的想法!
— 完 —
年度科技風(fēng)向標(biāo)「2025 人工智能年度榜單」評選報名開啟啦!我們正在尋找 AI+ 時代領(lǐng)航者 點擊了解詳情
企業(yè)、產(chǎn)品、人物 3 大維度,共設(shè)立了 5 類獎項,歡迎企業(yè)報名參與
一鍵關(guān)注 點亮星標(biāo)
科技前沿進展每日見