現(xiàn)在,更強(qiáng)大的 Gemini 3.0,已經(jīng)在 Google AI Studio 的測(cè)試?yán)铩柑崆吧暇€」。
網(wǎng)友們發(fā)現(xiàn),它的能力提升不止一星半點(diǎn),能直接用一套簡(jiǎn)單的提示詞生成一個(gè)網(wǎng)頁(yè)版 Windows、macOS 等。
這有可能是 Gemini 繼續(xù)在圖像編輯領(lǐng)域之外,再次超越 Claude 和 GPT-5 的時(shí)刻。
不過(guò),是不是跟當(dāng)時(shí) GPT-5 一樣的營(yíng)銷,還是真的能改變我們的使用體驗(yàn),先跟我們一起來(lái)看看這些網(wǎng)友分享的 Gemini 3 案例吧。
起手就是寫一個(gè) Windows?
就像 nano banana 在判斷生圖能力時(shí),采用的指標(biāo),是看這個(gè)模型在生成文字時(shí)的表現(xiàn)。
而如何判斷一個(gè)基礎(chǔ)模型的交付能力,編程,這種一旦代碼里有個(gè)輕微的錯(cuò)誤,就無(wú)法運(yùn)行的項(xiàng)目,成了大部分基礎(chǔ)模型廠商專攻的方向,而一開(kāi)始在這方面表現(xiàn)不錯(cuò)的 Claude,也因此賺得了一定的聲量。
近期多個(gè)博主在 X 上爆料,即將推出的 Gemini 3,在多個(gè)編程任務(wù)上的真實(shí)表現(xiàn),不用說(shuō)打敗 GPT-5,甚至有直接超越 Claude 的趨勢(shì)。Google AI Studio 負(fù)責(zé)人 Logan 在 X 上回復(fù)網(wǎng)友,確認(rèn)了 Gemini 3 擁有工具調(diào)用的能力,即我們常說(shuō)的智能體。
這次放出來(lái)的部分 Gemini 3 測(cè)試,完全可以說(shuō)是一次測(cè)試樣例的大升級(jí)。
X 博主 chetaslua 分享了多個(gè)由 Gemini 3 完成的編程任務(wù)。像是,它能直接給我們生成一個(gè) macOS 的網(wǎng)頁(yè)電腦,在這個(gè)網(wǎng)頁(yè)里,就像是在操作一臺(tái)云電腦。所有的應(yīng)用程序都可以打開(kāi),點(diǎn)擊 Safari 的圖標(biāo),可以進(jìn)入瀏覽器,并在網(wǎng)頁(yè)里繼續(xù)訪問(wèn)。
提示詞: - 設(shè)計(jì)并創(chuàng)建一個(gè)類似 macOS 操作系統(tǒng)的全功能網(wǎng)絡(luò)操作系統(tǒng),從文本編輯器、帶 Python 的終端和代碼編輯器開(kāi)始,并包含一個(gè)可玩的游戲,用于文件管理器、繪圖、視頻編輯器以及所有重要的 Windows 操作系統(tǒng)預(yù)裝軟件。使用任何庫(kù)來(lái)完成這個(gè)任務(wù),但確保我能夠?qū)⑺袃?nèi)容粘貼到一個(gè)單一的 HTML 文件中,并在 Chrome 中打開(kāi)它。使其有趣且高度詳細(xì),展示沒(méi)有人預(yù)期的細(xì)節(jié),在一個(gè)代碼塊中實(shí)現(xiàn)完全的創(chuàng)意和美感
源代碼 - https://codepen.io/ChetasLua/pen/yyezLjN
https://x.com/chetaslua/status/1977866953705316571
不僅 macOS 云電腦能生成,博主還用同樣的提示詞,修改成 Windows、Linux、以及云手機(jī)等操作系統(tǒng),開(kāi)機(jī)動(dòng)畫、系統(tǒng)內(nèi)操作,同樣能完美還原。
當(dāng)把同樣的提示詞交給 Claude Sonnet 4.5 處理,網(wǎng)友分享的結(jié)果是,Claude 只是生成了一個(gè)頁(yè)面,所有的應(yīng)用程序都不能點(diǎn)開(kāi)。我也測(cè)試了一下 GPT-5 的能力,雖然它可以點(diǎn)開(kāi)某些應(yīng)用,但是打開(kāi)之后,就沒(méi)有下一步的處理邏輯了。
還有一個(gè)小彩蛋,在網(wǎng)頁(yè)打開(kāi)的云電腦里面,點(diǎn)擊終端,輸入 matrix,我們會(huì)看到類似黑客帝國(guó)電影海報(bào)的 01 流動(dòng)代碼,可以說(shuō)是真矩陣革命(黑客帝國(guó)電影港版譯名)了。
除了這幾個(gè)熱門的系統(tǒng)還原測(cè)試,Gemini 3 的編程能力,還體現(xiàn)在它的前端,也有了其他 AI 模型做不到的進(jìn)步。最明顯的就是 AI 編程容易出現(xiàn)的漸變紫,Gemini 3 終于擺脫了。
就像這個(gè)關(guān)于大語(yǔ)言模型的網(wǎng)站,輸入的提示詞僅僅是「為關(guān)于 LLMs 的網(wǎng)站編寫完整的 HTML、CSS 和 JavaScript,以創(chuàng)建一個(gè)令人驚嘆、大膽、富有創(chuàng)意和獨(dú)特的著陸頁(yè)。它應(yīng)該看起來(lái)像是世界頂尖的網(wǎng)頁(yè)設(shè)計(jì)公司從頭開(kāi)始構(gòu)建的。」
網(wǎng)友們紛紛在評(píng)論區(qū)說(shuō),Gemini 3 一定有專門和設(shè)計(jì)師在合作,還有人預(yù)測(cè) Gemini 3 將在前端領(lǐng)域,像 nano banana 一樣占據(jù)主導(dǎo)地位。
不過(guò)也有人認(rèn)為 Gemini 3 的前端,還是有一些問(wèn)題。盡管它解決了那些討厭的漸變,改變了大多數(shù) AI 模型,長(zhǎng)期以來(lái)一直在做的同樣事情,但 3.0 的前端總是黑色,除非明確提示。在我看來(lái),黑色比漸變好太多,網(wǎng)站的設(shè)計(jì)就是應(yīng)該簡(jiǎn)潔大方。
基于能一句話搓出一個(gè)操作系統(tǒng),還有優(yōu)秀的前端能力,Gemini 3 還可以生成一個(gè)在線的視頻編輯器,當(dāng)然也是真的能夠剪輯視頻。
來(lái)源:https://x.com/sbalhatlani/status/1977501190322549017
CodePen 可運(yùn)行的體驗(yàn)鏈接:https://codepen.io/DiNaSoR/pen/WbrEELE
一個(gè)能無(wú)限流刷視頻的抖音 App 網(wǎng)頁(yè)版。
體驗(yàn)地址:https://jsbin.com/yisixokuwi/1
那些做 vibe coding、一鍵生成網(wǎng)頁(yè)應(yīng)用工具的 Lovable、Cursor 等,可能要考慮默認(rèn)模型換成 Gemini 3 了。
在經(jīng)典的代碼能力測(cè)試上,還有一個(gè)生成騎自行車的鵜鶘任務(wù),比較模型對(duì)于 SVG 代碼的生成效果。
Gemini 3 能生成普通的版本的鵜鶘。
甚至還有游戲《我的世界》同款風(fēng)格的 3D 版本。
騎自行車的鵜鶘,現(xiàn)在屬于是大語(yǔ)言模型代碼能力的基準(zhǔn)測(cè)試了。我們還看到有網(wǎng)友用 Gemini 3.0 Pro,生成了一個(gè)宇航員在月球打高爾夫的 SVG 動(dòng)畫。
生圖、視覺(jué)理解,nano banana 全面版
除了編程能力,作為 Google 最強(qiáng)基礎(chǔ)模型,視覺(jué)理解能力同樣出色。
通過(guò)了六指測(cè)試。
能夠把一個(gè)潦草的手寫文檔,準(zhǔn)確提取里面的所有內(nèi)容。
以及生成各種各樣的城堡測(cè)試。
無(wú)聊玩玩 Gemini 3 做的小游戲
最后,讓它來(lái)生成一些小游戲,小工具,部分釋放出的 Gemini 3 測(cè)試案例表現(xiàn)都很不錯(cuò)。
例如可以讓 Gemini 3 為我們創(chuàng)作原創(chuàng)音樂(lè)。
制作一個(gè)帶有 Gemini 創(chuàng)作的真實(shí)配樂(lè)的游戲。
由 Gemini 3.0 Pro 制作的吸血鬼游戲。
目前這些爆料出來(lái)的 Gemini 3 測(cè)試,都是在 Google AI Studio 網(wǎng)頁(yè)上 A/B 測(cè)試完成的。
這些網(wǎng)友也是不斷地在 AI Studio 里面瘋狂輸入提示詞,直到 AI Studio 給出了兩個(gè)不同的回答,然后默認(rèn)更好的那個(gè)就是 Gemini 3,甚至 Gemini 3.0 Pro、Ultra 等版本。
有網(wǎng)友說(shuō),這只是一個(gè) A/B 測(cè)試,并不能得出結(jié)論說(shuō)這個(gè)結(jié)果是由 Gemini 3.0 生成,因?yàn)橐灿锌赡苤皇?,同一個(gè)模型,不同參數(shù)的 A/B 測(cè)試。
甚至有人發(fā) X 說(shuō) Gemini 3 的智能體能力獲得大提升,但是在帖子被廣泛傳播之后,他又緊急辟謠,Google 周六不上班。
不過(guò),就在今天,Google AI Studio 首頁(yè)倒是真的有了一次更新,添加了 API 數(shù)據(jù)統(tǒng)計(jì)等功能,很讓人懷疑是不是在為 Gemini 3.0 上線做準(zhǔn)備。
總而言之,Gemini 3 肯定是馬上要來(lái)了。
OpenAI 憑借著自身?yè)碛械凝嫶笥脩?,?ChatGPT 收集的海量數(shù)據(jù),在最近持續(xù)性地推出了多項(xiàng)應(yīng)用,主動(dòng)推送、購(gòu)物、接入 App 等等,似乎是進(jìn)一步鞏固用戶群體,不讓他們離開(kāi)。
Claude 繼續(xù)著他們?cè)诰幊填I(lǐng)域的老大地位,按照計(jì)劃、不過(guò)分營(yíng)銷的推進(jìn)基礎(chǔ)模型的更新,也在他們最看重的安全方面,發(fā)布了多項(xiàng)研究。
作為后來(lái)居上的 Google,靠著 nano banana 屬實(shí)讓 Gemini 大火了一把,現(xiàn)在我們說(shuō)到圖像編輯,一定會(huì)有 nano banana,這就就跟說(shuō)到編程,離不開(kāi) Claude 一樣。
我甚至?xí)X(jué)得,Google 終于追上來(lái)了。
文章內(nèi)部分視頻,可訪問(wèn)原文鏈接。