国产精品一区二区av片,亚洲午夜综合网,91亚洲欧洲日产国码精品,国产午夜福利精品一区二区三区,91精品啪在线观看国产色,精品国产美女福到在线直播,久久露脸国产精品,国产另类ts人妖一区二区,国产性一交一乱一伦一色一情 ,国产对白国语对白

<fieldset id="ya4a2"></fieldset>

<cite id="ya4a2"></cite>

愛范兒剛剛

李飛飛世界模型大更新！實時生成 3D 世界，只要一塊 GPU

當 OpenAI 的奧特曼還在到處買顯卡、買算力，來支撐他的 Sora 2 視頻生成模型。

李飛飛的實驗室 The World Labs，用一張顯卡就能運行一個世界。他們今天發(fā)布了一項名為 RTFM ( Real-Time Frame Model ) 的新技術(shù)，一個全新的實時世界生成模型。

和九月中旬發(fā)布的圖生世界 Marble 不同，RTFM 不僅是用一張照片，生成一個我們可以自由漫步、探索的 3D 世界。最重要的是，它被設(shè)計為可以在單塊 H100 GPU 上高效運行，并且實時生成。

目前，RTFM 已經(jīng)作為研究預覽版正式發(fā)布，并提供了 Demo 可以親自去試試。

▲ RTFM Demo 鏈接：https://rtfm.worldlabs.ai/

意外地發(fā)現(xiàn)，這個 Demo 的名字叫做 FRAMEBOY，結(jié)合這個網(wǎng)頁布局，我很快想到了年代久遠的 Game Boy 游戲機。

這樣一個擁有逼真的光影、反射和陰影的世界，并且這一切還在我們眼前實時發(fā)生，在某種程度上，何嘗不是另一種玩游戲。

不止于生成，更在于實時互動

RTFM 的核心能力，就是能實時生成可供用戶交互的視頻。它可以從一張靜態(tài)圖片開始，渲染出一個可以自由探索的 3D 場景。

與許多世界模型不同，RTFM 能夠?qū)W習并渲染出，極其復雜和真實的視覺效果。無論是光滑大理石地面的倒影、物體在陽光下的陰影，還是透過玻璃看到的景象，RTFM 都能準確地模擬。

RTFM 依靠的不是傳統(tǒng)的圖形學編程，而是讓模型通過對海量視頻數(shù)據(jù)的端到端學習，不斷進化出來的。

支撐這項能力的，是設(shè)計 RTFM 背后圍繞的三項核心原則。

效率 ( Efficiency ) ，要想把未來拉到眼前，世界模型的計算需求是最大的阻礙。

無論是像 Sora 這樣的 AI 生成視頻，還是 Google 尚未正式公開上線的 Genie 3，都意味著巨大的計算挑戰(zhàn)。有相關(guān)的研究提到，要實時生成 4K 60fps 的交互視頻流，AI 模型每秒需要處理的 tokens 數(shù)量約等于一本《哈利 · 波特》的文字量。

而如果要在超過一小時的交互中，保持這些生成內(nèi)容的持續(xù)性，需要處理的上下文，將超過 100M 個 token。這對于當下的計算基礎(chǔ)設(shè)施而言，既不現(xiàn)實，也難以負擔。

李飛飛團隊的目標是「在今天硬件上，運行的明天模型，并提供最高保真度的預覽?！?/p>

他們通過對架構(gòu)、模型蒸餾和推理過程的極致優(yōu)化，以及整個系統(tǒng)的重新設(shè)計。RTFM 成功地實現(xiàn)了，僅使用單個 H100 GPU，就可以交互式幀率進行推理，實時生成。

可擴展性 ( Scalability ) ，從視頻模型，能直接到世界模型。

傳統(tǒng)的 3D 引擎，用的是三角網(wǎng)格、高斯點云、體素渲染等顯式結(jié)構(gòu)，完全依賴于一些復雜的計算機圖形學知識。每個物體都要建模、上材質(zhì)、打光、烘焙陰影。這和我們之前介紹的混元 3D 世界，所采用的方法類似，它們主打的是實現(xiàn) 3D 全管道的生成。

傳統(tǒng) 3D 方式（左）和 RTFM 方式（右）

World Lab 選擇的路和混元不同， RTFM 不會構(gòu)建任何顯式的 3D 模型。它使用了類似 Sora 的「自回歸擴散 Transformer」，直接從視頻幀序列中學習世界規(guī)律。

舉個例子，模型不再需要知道「這是一堵墻」或「那是一盞燈」，它只通過成千上萬段視頻的學習，學會了什么是「空間感」，學會從輸入的 2D 圖像序列中，預測出下一個新的視角畫面。

和生成 3D 資產(chǎn)的路線不同，RTFM 能夠更好地利用不斷增長的數(shù)據(jù)和算力，從而實現(xiàn)無限擴展。

持久性 ( Persistence ) ，讓世界模型像 nano banana 一樣保持一致。

大部分的視頻生成模型有一個天生缺陷，就是它們沒有記憶。即便現(xiàn)在 Sora 一次性，能生成 25 秒的震撼畫面，但視頻生成結(jié)束后，世界就結(jié)束了，并不能提供持續(xù)的交互。

而如果要記住所有場景，計算負擔勢必又會隨著探索的深入而無限累積。

RTFM 試圖解決的，就是讓生成的世界具備持續(xù)存在的能力。它引入了一個叫「spatial memory（空間記憶）」的機制。它為生成的每一幀畫面，都賦予了在 3D 空間中的精確「姿態(tài)」（位置和方向）。

在生成新畫面時，模型會采用一種「上下文雜耍」 ( context juggling ) 的技術(shù)，只調(diào)用新畫面附近位置的幀作為參考，而不是全局內(nèi)容。

這使得 RTFM 能夠做到，讓我們反復進入這個世界，離開再回來，而不會增加計算負擔。

目前，RTFM 的 Demo 體驗時間只有 3 分鐘，3 分鐘后，它還是會不記得這個世界。我在那個 Demo 里面拖動左右兩個搖桿，玩了很久，想到了李飛飛之前說，空間智能才應該是 AGI 的下一個方向。

未來是否真的有機會，像頭號玩家一樣，讓現(xiàn)實世界和虛擬世界之間，產(chǎn)生明確的聯(lián)系，光看現(xiàn)在的世界模型，要加載的內(nèi)容還有太多。

畢竟，即便單個 H100 GPU，售價也大約在 25000 美元以上。但是當算力的價格下降，當算法再快一點；我們或許能看到，真正意義上的世界模型「大更新」，是現(xiàn)實，被完整生成的那一天。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關(guān)標簽

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻

AI視頻剪輯

視頻定制服務

AI智能客服

我的訂閱

李飛飛世界模型大更新！ 實時生成 3D 世界，只要一塊 GPU

宙世代

一起剪

相關(guān)閱讀

李想：全自動駕駛的智能汽車3~5年將會實現(xiàn)

華為HarmonyOS 6來了！10月22日正式發(fā)布

球館流浪貓成專業(yè)技術(shù)陪練 網(wǎng)友：打羽毛球沒要錢 和貓打了倆鐘頭

從「掃腿」到「上車」，團播火了幾支舞

黃仁勛：英偉達AI芯片在華份額由95%暴跌至0%！

“AI教母”李飛飛的全新世界模型問世！一張英偉達AI芯片就能生成無限3D世界

華為最便宜小折疊！nova Flip S開啟預售：3488元起

49999元ROG×初音未來聯(lián)名主機被37008元拍下 2.6萬人圍觀

同大疆開打價格戰(zhàn)，農(nóng)業(yè)無人機行業(yè)“老二”沖擊港股

雷軍時隔多天重回健身房打卡：一場秋雨一場寒

新型監(jiān)控威脅來了：Wi-Fi信號可“隔墻識人” 無需任何特殊硬件

歷史首次觸屏+屏下攝像頭！蘋果重磅新款MacBook Pro明年發(fā)布

半固態(tài)電池“沉默的遠征”：無感滲透消費電子產(chǎn)業(yè)

新車上牌在家就能辦 順豐送牌上門：快遞長這模樣

小米上線短劇App，何小鵬稱明年計劃量產(chǎn)飛行汽車，京東試點取消騎手超時罰款，曹德旺辭去福耀玻璃董事長職務，這是今天的其他大新聞！

最新評論

愛范兒

熱門推薦

李飛飛世界模型大更新！實時生成 3D 世界，只要一塊 GPU

球館流浪貓成專業(yè)技術(shù)陪練網(wǎng)友：打羽毛球沒要錢和貓打了倆鐘頭

從「掃腿」到「上車」，團播火了幾支舞

“AI教母”李飛飛的全新世界模型問世！一張英偉達AI芯片就能生成無限3D世界

華為最便宜小折疊！nova Flip S開啟預售：3488元起

同大疆開打價格戰(zhàn)，農(nóng)業(yè)無人機行業(yè)“老二”沖擊港股

新車上牌在家就能辦順豐送牌上門：快遞長這模樣

小米上線短劇App，何小鵬稱明年計劃量產(chǎn)飛行汽車，京東試點取消騎手超時罰款，曹德旺辭去福耀玻璃董事長職務，這是今天的其他大新聞！