編輯|杜偉
(資料圖片僅供參考)
谷歌世界模型,再一次驚艷了所有人!
今天一早,谷歌 DeepMind 開放了世界模型 Genie 3 的實驗性研究原型「Project Genie」,允許用戶創(chuàng)建、編輯并探索虛擬世界
在世界模型 Genie 3 之外,Project Genie 同樣由圖像生成與編輯模型 Nano Banana Pro 和語言模型 Gemini 提供技術(shù)支撐。
去年 8 月,谷歌預發(fā)布了通用世界模型 Genie 3,它能夠生成多樣化的交互式環(huán)境。在這一早期階段,受邀測試者們已經(jīng)創(chuàng)造出了令人印象深刻且極具吸引力的虛擬世界與沉浸式體驗,并挖掘出了全新的使用方式。
接下來的目標是構(gòu)建一個專注于「沉浸式世界創(chuàng)建」的交互式原型,進一步擴大受眾范圍。
因此自即日起,谷歌面向美國 18 歲及以上的 Google AI Ultra 用戶開放了 Project Genie 的訪問權(quán)限。
Project Genie 的多樣性玩法
世界模型能夠模擬環(huán)境的動態(tài)變化,并預測環(huán)境的演變方式以及動作對環(huán)境的影響。
與靜態(tài) 3D 快照中的可探索體驗不同,谷歌通用世界模型 Genie 3 會在用戶移動并與世界交互時,實時生成前方的路徑。
它能夠為動態(tài)世界模擬出物理效果和交互,并且其突破性的一致性使得模擬任何現(xiàn)實場景成為可能,從機器人技術(shù)、動畫建模和小說創(chuàng)作,到地點探索和歷史場景還原。
如今,在 Genie 3、Nano Banana Pro 和 Gemini 等三大模型的支持下,Project Genie 具備了以下三大核心能力:
首先是,世界草繪(World sketching)
通過文本提示詞以及生成或上傳的圖片,用戶即可創(chuàng)建一個生動且不斷擴張的環(huán)境。用戶可以創(chuàng)建自己的角色和世界,并定義自己想要的探索方式,比如行走、騎行、飛行或者駕駛,等等。
為了實現(xiàn)更精準的控制,谷歌將「世界草繪」與 Nano Banana Pro 進行了整合。這樣一來,用戶在正式進入世界之前,可以預覽世界的樣貌并修改圖像以進行微調(diào)。
用戶還可以定義角色的視角(第一人稱或第三人稱),在進入場景前掌控自己的視覺體驗。
其次是,世界探索(World exploration)
用戶創(chuàng)建的世界是一個等待探索的可導航環(huán)境。在移動時,Project Genie 會根據(jù)用戶采取的行動實時生成前方路徑。在穿行過程中,用戶還可以調(diào)整相機視角。
最后是,世界重混(World remixing)
通過在原有提示詞的基礎(chǔ)上進行創(chuàng)作,將現(xiàn)有世界重混成新的演繹版本。用戶也可以在畫廊或「隨機生成」圖標中探索精選世界以獲取靈感,并在此基礎(chǔ)上繼續(xù)構(gòu)建。
完成后,用戶可以下載關(guān)于自己的世界和探索過程的視頻。
不過目前,谷歌也承認,Genie 3 仍處于早期研究階段, 以下幾個方面需要進一步改進:
- 生成的世界可能看起來并不完全逼真,或者并不總是能嚴格遵循提示詞、圖像或現(xiàn)實世界的物理規(guī)律;
- 角色有時可能不太受控,或者在控制上存在較高的延遲;
- 生成內(nèi)容的時長限制在 60 秒以內(nèi);
- 此前宣布的部分 Genie 3 功能(例如在探索時改變世界的提示事件「promptable events」)尚未包含在此原型中。
第一手體驗出爐
谷歌開放 Project Genie,終于讓更多用戶親身體驗到了世界模型 Genie 3 的「AI 生萬物」。
已經(jīng)上手的 Ultra 用戶紛紛曬出了自己的作品,給予了不錯的評價。
「剛剛用 Genie 3 做出了我的第一款 AI 游戲。提示詞:一位法國女子必須攀越一個違背邏輯的世界,到處都是飛行物體。這會是游戲行業(yè)的終結(jié)嗎?」
「Genie 3 能運行《毀滅戰(zhàn)士》(Doom)嗎?看它生成的《毀滅戰(zhàn)士》,墻壁全是由同樣在運行《毀滅戰(zhàn)士》的屏幕組成;主角是《毀滅戰(zhàn)士》里的陸戰(zhàn)隊員,但他的頭也是一個正在運行《毀滅戰(zhàn)士》的屏幕。」
「Genie 3 在建模和物理模擬方面是一個巨大的飛躍,但仍存在一些待解決的問題,比如一只頭頂著鴨子的水獺飛行員正走在一家羅斯科(Rothko)風格的機場里;以及一只穿著翼裝的水獺正飛越一座充滿哥特式塔樓的城市。」
「看 Genie 3 生成的人物是怎么打開車門的,這簡直太令人震撼了。」
「畫面提示詞為:一個男人正沿著好萊塢大道漫步。不僅能控制這個男人的動作,還能實時操控相機的視角。」
https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/
https://x.com/TrueSlazac/status/2016959063699906740?s=20
https://x.com/emollick/status/2016982218506199531
https://x.com/emollick/status/2016919989865840906?s=20
https://x.com/EHuanglu/status/2016926887151354255?s=20
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 37度2是什么意思?37度2是什么梗?
- 抬腳掃橘子皮是什么意思?抬腳掃橘子皮是什么梗? 熱推薦
- 被哈佛認證了是什么梗?被哈佛認證了是什么意思?
- 新華網(wǎng)-今熱點
- 即時看!中國銀聯(lián)參與建設跨境二維碼統(tǒng)一網(wǎng)關(guān) 助力構(gòu)建支付互聯(lián)互通新生態(tài)
- 《萊博雷生臨床應用中國專家共識》發(fā)布 熱文
- 《新疆維吾爾自治區(qū)成立七十周年》紀念郵票在烏魯木齊首發(fā)
- 意甲綜合:AC米蘭完勝烏迪內(nèi)斯 維羅納逼平尤文 熱點聚焦
- 我科學家探索大質(zhì)量恒星形成之謎獲重要進展_今日快看
- 東博會“AI熱”構(gòu)建中國—東盟區(qū)域合作新范式
資訊
- 谷歌開放世界模型一夜刷屏,AI游戲門檻歸零時刻來了?|焦點速遞
- 2026年醫(yī)藥進口概念股,相關(guān)上市公司名單收好啦!(1月29日)
- 滬主板新股林平發(fā)展1月30日開啟申購 發(fā)行價格為37.88元/股|消息
- 短訊!泰恩康2025年凈利同比預降逾六成
- 美的集團(00300.HK)1月27日耗資9999.35萬元回購130.98萬股A股
- 騎手舉報“臟”外賣刷屏全網(wǎng),網(wǎng)友:建議各地推廣|通訊
- 赤峰一女子掉進廢水井情況緊急…… 每日時訊
- 聊天恐擾癥是什么意思?什么是聊天恐擾癥? 視焦點訊
- 2026年1月25日黃淮農(nóng)產(chǎn)品股份有限公司價格行情|當前信息
- 焦點觀察:重藥控股7家子公司補繳稅款及滯納金3221萬元
焦點
- 藍箭電子:公司持續(xù)加大研發(fā)投入、推進技術(shù)創(chuàng)新 速看料
- 每日視點!大華繼顯:降招商銀行(03968)目標價至49港元 續(xù)予“持有”評級
- 每日熱點:萬泰生物股票分紅是怎么樣的?每年分紅多少?(2026年1月24日)
- 光大期貨0122追蹤:三天增倉30萬,PTA現(xiàn)在還能追嗎?_快報
- 寧德時代發(fā)布輕型商用車全場景解決方案 低溫版本采用行業(yè)首款量產(chǎn)鈉電池
- 北交所上市公司科馬材料登龍虎榜:當日收盤價跌幅達到-26.75%
- PriceSeek提醒:萬華化學丙烯酸報價上調(diào)50元 速遞
- 焦點快播:【票務公告】北控男籃對陣吉林男籃主場門票將于1月19日中午12:18開售
- 焦點訊息:*ST天擇主力資金持續(xù)凈流入,3日共凈流入1094.96萬元
- 焦煤期權(quán)在大商所掛牌上市