国产精品一区二区av片,亚洲午夜综合网,91亚洲欧洲日产国码精品,国产午夜福利精品一区二区三区,91精品啪在线观看国产色,精品国产美女福到在线直播,久久露脸国产精品,国产另类ts人妖一区二区,国产性一交一乱一伦一色一情 ,国产对白国语对白

關(guān)于ZAKER 合作
愛范兒 剛剛

李飛飛世界模型大更新! 實時生成 3D 世界,只要一塊 GPU

當 OpenAI 的奧特曼還在到處買顯卡、買算力,來支撐他的 Sora 2 視頻生成模型。

李飛飛的實驗室 The World Labs,用一張顯卡就能運行一個世界。他們今天發(fā)布了一項名為 RTFM ( Real-Time Frame Model ) 的新技術(shù),一個全新的實時世界生成模型。

和九月中旬發(fā)布的圖生世界 Marble 不同,RTFM 不僅是用一張照片,生成一個我們可以自由漫步、探索的 3D 世界。最重要的是,它被設(shè)計為可以在單塊 H100 GPU 上高效運行,并且實時生成。

目前,RTFM 已經(jīng)作為研究預覽版正式發(fā)布,并提供了 Demo 可以親自去試試。

▲ RTFM Demo 鏈接:https://rtfm.worldlabs.ai/

意外地發(fā)現(xiàn),這個 Demo 的名字叫做 FRAMEBOY,結(jié)合這個網(wǎng)頁布局,我很快想到了年代久遠的 Game Boy 游戲機。

這樣一個擁有逼真的光影、反射和陰影的世界,并且這一切還在我們眼前實時發(fā)生,在某種程度上,何嘗不是另一種玩游戲。

不止于生成,更在于實時互動

RTFM 的核心能力,就是能實時生成可供用戶交互的視頻。它可以從一張靜態(tài)圖片開始,渲染出一個可以自由探索的 3D 場景。

與許多世界模型不同,RTFM 能夠?qū)W習并渲染出,極其復雜和真實的視覺效果。無論是光滑大理石地面的倒影、物體在陽光下的陰影,還是透過玻璃看到的景象,RTFM 都能準確地模擬。

RTFM 依靠的不是傳統(tǒng)的圖形學編程,而是讓模型通過對海量視頻數(shù)據(jù)的端到端學習,不斷進化出來的。

支撐這項能力的,是設(shè)計 RTFM 背后圍繞的三項核心原則。

效率 ( Efficiency ) ,要想把未來拉到眼前,世界模型的計算需求是最大的阻礙。

無論是像 Sora 這樣的 AI 生成視頻,還是 Google 尚未正式公開上線的 Genie 3, 都意味著巨大的計算挑戰(zhàn)。有相關(guān)的研究提到,要實時生成 4K 60fps 的交互視頻流,AI 模型每秒需要處理的 tokens 數(shù)量約等于一本《哈利 · 波特》的文字量。

而如果要在超過一小時的交互中,保持這些生成內(nèi)容的持續(xù)性,需要處理的上下文,將超過 100M 個 token。這對于當下的計算基礎(chǔ)設(shè)施而言,既不現(xiàn)實,也難以負擔。

李飛飛團隊的目標是「在今天硬件上,運行的明天模型,并提供最高保真度的預覽?!?/p>

他們通過對架構(gòu)、模型蒸餾和推理過程的極致優(yōu)化,以及整個系統(tǒng)的重新設(shè)計。RTFM 成功地實現(xiàn)了,僅使用單個 H100 GPU,就可以交互式幀率進行推理,實時生成。

可擴展性 ( Scalability ) ,從視頻模型,能直接到世界模型。

傳統(tǒng)的 3D 引擎,用的是三角網(wǎng)格、高斯點云、體素渲染等顯式結(jié)構(gòu),完全依賴于一些復雜的計算機圖形學知識。每個物體都要建模、上材質(zhì)、打光、烘焙陰影。這和我們之前介紹的混元 3D 世界,所采用的方法類似,它們主打的是實現(xiàn) 3D 全管道的生成。

傳統(tǒng) 3D 方式(左)和 RTFM 方式(右)

World Lab 選擇的路和混元不同, RTFM 不會構(gòu)建任何顯式的 3D 模型。它使用了類似 Sora 的「自回歸擴散 Transformer」,直接從視頻幀序列中學習世界規(guī)律。

舉個例子,模型不再需要知道「這是一堵墻」或「那是一盞燈」,它只通過成千上萬段視頻的學習,學會了什么是「空間感」,學會從輸入的 2D 圖像序列中,預測出下一個新的視角畫面。

和生成 3D 資產(chǎn)的路線不同,RTFM 能夠更好地利用不斷增長的數(shù)據(jù)和算力,從而實現(xiàn)無限擴展。

持久性 ( Persistence ) ,讓世界模型像 nano banana 一樣保持一致。

大部分的視頻生成模型有一個天生缺陷,就是它們沒有記憶。即便現(xiàn)在 Sora 一次性,能生成 25 秒的震撼畫面,但視頻生成結(jié)束后,世界就結(jié)束了,并不能提供持續(xù)的交互。

而如果要記住所有場景,計算負擔勢必又會隨著探索的深入而無限累積。

RTFM 試圖解決的,就是讓生成的世界具備持續(xù)存在的能力。它引入了一個叫「spatial memory(空間記憶)」的機制。它為生成的每一幀畫面,都賦予了在 3D 空間中的精確「姿態(tài)」(位置和方向)。

在生成新畫面時,模型會采用一種「上下文雜耍」 ( context juggling ) 的技術(shù),只調(diào)用新畫面附近位置的幀作為參考,而不是全局內(nèi)容。

這使得 RTFM 能夠做到,讓我們反復進入這個世界,離開再回來,而不會增加計算負擔。

目前,RTFM 的 Demo 體驗時間只有 3 分鐘,3 分鐘后,它還是會不記得這個世界。我在那個 Demo 里面拖動左右兩個搖桿,玩了很久,想到了李飛飛之前說,空間智能才應該是 AGI 的下一個方向。

未來是否真的有機會,像頭號玩家一樣,讓現(xiàn)實世界和虛擬世界之間,產(chǎn)生明確的聯(lián)系,光看現(xiàn)在的世界模型,要加載的內(nèi)容還有太多。

畢竟,即便單個 H100 GPU,售價也大約在 25000 美元以上。但是當算力的價格下降,當算法再快一點;我們或許能看到,真正意義上的世界模型「大更新」,是現(xiàn)實,被完整生成的那一天。

相關(guān)標簽
ai

相關(guān)閱讀

最新評論

沒有更多評論了
熟妇人妻久久精品一区二区| 精品久久精品午夜精品久久| 综合色久七七综合尤物| 一区二区三区放荡人妻| 国产成人精品一区二区三| 特级毛片A片全免费播放心| 久青草免费在线视频| 日本少妇视频一区二区三区| 日本深夜福利在线观看| av色蜜桃一区二区三区| 777国产精品永久免费观看| 国产69精品久久久久乱码| 日本中文字幕一区二区视频| 电影蜜桃熟了| 午夜福利精品国产二区| 久久黄色免费电影 | 欧美成人看片一区二区| 四虎成人永久在线精品免费| 熟睡人妻被讨厌的公侵犯| 国产精品成人免费视频网站京东| 国产男女猛烈无遮挡免费视频网址| 日本二区三区四区在线观看| 男女18禁啪啪无遮挡网站| A级毛片高清免费视频播放出要看| 亚洲 制服 丝袜 无码| 国产精品高清国产三级囯产AV| 日韩极品视频在线观看免费| 久久亚洲综合伊人| 68日本xxxxxxxxx视频| 综合亚洲网| 无码日日模日日碰夜夜爽| 激情四射激情五月综合网| 黄瓜一区二区三区自拍视频| 精品无码一区二区三区爱欲| 亚洲精中文字幕二区三区| 狠狠热精品免费视频| 午夜福利免费院| 国产尤物在线视精品在亚洲| 高清无码在线视频| 成熟丰满熟妇xxxxx| 国产精品中文字幕日韩|