鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
幫我生成一個中秋節(jié)插畫視頻。
過去這樣一個復(fù)雜指令,需要被拆分成找素材→AI生圖→AI生視頻多個步驟。
但現(xiàn)在從生圖到生視頻,再復(fù)雜的指令也只需一次輸入就全搞定!
這就是即夢AI最新上線的Agent模式,只需要說出你的需求,它就能自動幫你寫提示詞,新上手的小白也能輕松玩轉(zhuǎn)。
比Nano banana更懂中文場景,文生圖和圖像編輯還比Nano banana強!
官方做出來的效果是醬紫的:
估計這時就有朋友問了,這個視頻肯定制作過程很復(fù)雜吧?
NoNoNo!全程只用了一句話指令:創(chuàng)建12張像素風(fēng)格圖像并組合成視頻。
又比如說可以直接批量生成一系列圖像,構(gòu)成完整故事。
批量生成視頻也不在話下,還能直接串到一起,比如說這個人的一生:
甚至還可以直接遷移使用其他圖片的風(fēng)格、獲取對方的提示詞……
所以下面一起來康康我們的實測過程~
一手實測Agent模式
首先進(jìn)入官網(wǎng),點擊輸入框左下角的模式切換按鈕,就能一鍵get到新上線的Agent模式。
橋豆麻袋,寫提示詞前,先告訴大家一個小tips!
Agent現(xiàn)在還兼職AI小助手功能,用戶可以直接詢問它怎么寫提示詞,be like:
Prompt:請教教我如何寫提示詞?
好了,學(xué)會寫提示詞后,我們正式開始測評~
先來試試最新上線的智能多幀功能,據(jù)官方透露,Agent可以直接一口氣生成多張連續(xù)圖像,再自動連接首尾兩幀,組成完整視頻。
國慶假期將至,坐在我工位旁的小悅同學(xué)卻天天在愁去哪里度假……那即夢醬先給她做份景點大全吧。
Prompt:做6張中國標(biāo)志性景點的插畫風(fēng)圖片,用智能多幀組成一份循環(huán)海報。
全程用了不到3分鐘,標(biāo)志性景點的插畫視頻就搞定了,外灘、泰山、九寨溝、張家界……應(yīng)有盡有。
再看看畫面美術(shù)風(fēng)格呢,整體統(tǒng)一采用幾何化風(fēng)格和高飽和色彩,轉(zhuǎn)場過渡也很自然。
最妙的是,它是真的很懂用戶需求,原來的Prompt里并沒有主動告知它要豎屏,只有關(guān)于海報的提示,結(jié)果它主動適配海報排版和移動端展示,自動生成了3:4比例的豎圖,確實很貼心了。
另外悄悄告訴你,Prompt里點明用“智能多幀”,效果會更好嗷~
喜歡搞二創(chuàng)的勞斯們有福了,創(chuàng)意提升也是這次Agent模式的重點技術(shù)升級。看到喜歡的圖片風(fēng)格想用怎么辦?Agent直接能幫忙生成類似的創(chuàng)意。
比如說,我想為蜜雪冰城的檸檬水打call,感覺這張化妝品廣告的風(fēng)格還挺適合,交給Agent模式試試。
Prompt:請幫我基于圖一的風(fēng)格,把圖二做成廣告,對應(yīng)的文案也要修改。
wow!這波雪王高級感拉滿。
仔細(xì)看,Agent模式生圖全是細(xì)節(jié):為了讓視覺效果更純凈,也是把原圖的塑料杯換成了玻璃材質(zhì);保留了可愛的Logo,但是去掉了冰淇淋權(quán)杖提升品牌檔次。
一張不夠,還可以生成一系列的同風(fēng)格圖片。
舉個栗子,下面讓它根據(jù)這張中秋節(jié)的海報,再多做幾張讓甲方挑選。
Prompt:幫我按照這張圖的風(fēng)格再生成四張帶有“中秋佳節(jié)”字樣的海報。
第一張圖整體基調(diào)不變,只將字體樣式改得更有陰影棱角;第二張圖將樓閣改成暗色調(diào),增加一些飄灑的花瓣特效,月餅也成了禮盒裝;第三張圖換成了墨綠色漸變背景,小兔子身上也加了點紋樣點綴,讓畫面更豐富;第四張圖的背景則改成了深藍(lán)色的夜晚,月餅上還鍍上了一層金屬光澤,貴氣!
另外,還能點擊查看其中任何一張圖的細(xì)節(jié),包括對應(yīng)的提示詞、比例和分辨率,還能對它進(jìn)行單獨編輯或轉(zhuǎn)成視頻。
好好好,這下老板再也不用擔(dān)心我的出圖速度了(doge)
兩張不同風(fēng)格的圖片,也能直接融合,比如水彩+水墨=?
Prompt:幫我混合一下這兩張圖。
秒哇!直接成名家畫作了,既保留了第一張參考圖里的瀑布、巖石等元素,也巧妙融入了第二張圖的水墨意境。
色調(diào)達(dá)成了統(tǒng)一,以青綠色調(diào)為主,輔以黃色點綴,既有近景的寫實瀑布也有遠(yuǎn)景的寫意山巒,構(gòu)成相當(dāng)完整和諧的畫面。
另外,其實Agent模式還有個隱藏大招:可以根據(jù)圖片反推提示詞。
比如說,我在即夢官方主頁的推薦作品中找到了這張圖,媲美Nano Banana的手辦生成效果,讓我好奇用了什么提示詞。
Prompt:反推這張圖的提示詞。
鋼鐵俠精致手辦模型,紅色金色裝甲配色,站立在現(xiàn)代木質(zhì)辦公桌上,背景電腦顯示器展示3D建模軟件界面,屏幕顯示鋼鐵俠角色設(shè)計,左側(cè)放置手辦包裝盒,溫暖室內(nèi)燈光,現(xiàn)實主義攝影風(fēng)格,產(chǎn)品展示效果,3:4豎版構(gòu)圖,專業(yè)工作環(huán)境氛圍。
學(xué)會了!修修改改,我也能用即夢AI生成新手辦。(即夢內(nèi)心os:這一次我勢必要讓所有人會寫提示詞)
Agent模式還能直接讓效率Plus,一次指令同時能生成40張圖片或8個視頻。
還是咱們的小悅同學(xué),直接給她安排一套全國深度游旅行照,朋友圈即夢包了。
Prompt:幫我生成吉卜力風(fēng)格的全國旅游照,每張圖片的主角都是一個叫小悅的女生,要和每個景點有深度互動,尤其是在上海東方明珠前要喝蜜雪冰城奶茶。
上海東方明珠、西安兵馬俑、桂林漓江、成都熊貓基地、杭州西湖、青島海濱……小悅的國慶七天樂實在太充實了!
而且在每張圖中都有很好地遵循有關(guān)互動感的指令,色彩也很溫暖明亮,符合吉卜力風(fēng)格要求,尤其是第三張,小悅完全是千與千尋(桂林特輯)。
但是生圖過程中也出現(xiàn)了一個小bug,在北京旅游時有生成失敗的情況出現(xiàn)。
將小悅旅行照組成一整個vlog視頻,也是輕輕松松~
Prompt:幫我把圖片全部串成一個視頻。
整個視頻都很流暢自然,鏡頭拍攝手法相當(dāng)豐富,包括推進(jìn)、俯視轉(zhuǎn)平視、拉近等,每張圖也都會均勻停留4秒,圖和圖之間過渡巧妙。
另外還有更多玩法期待大家的解鎖吼~
接入Seedream 4.0模型
Agent模式和同步推出的即夢4.0版本,都是基于字節(jié)最新自研的Seedream 4.0模型。
模型一經(jīng)推出就強勢拿下Artificial Analysis的文生圖和圖像編輯雙榜第一,超越了谷歌的Nano Banana。
相比上一代,4.0模型在邏輯理解能力和推理速度方面上顯著提升,將文生圖、圖編輯、組圖生成功能組合于一體,不同元素彼此之間可以融合成一張完整的圖片,還能生成連貫的圖像序列。
另外它還支持4K分辨率,這一點Nano Banana都做不到。
所以Agent模式有了它的支持,基本上可以說將AI生圖降至0門檻,不會寫指令,它來教;指令太復(fù)雜,它只需要一句話。
妥妥的技術(shù)福音!
現(xiàn)在官網(wǎng)還推出了為期一周的免費生圖活動,趕緊體驗起來吧。
官網(wǎng)鏈接:https://jimeng.jianying.com/ai-tool/home?type=agentic
參考鏈接:
[1]https://bytedance.larkoffice.com/docx/Qriwdcz4Sob4arxcAX6cxUMznYb
[2]https://x.com/imxiaohu/status/1967551530032345096
一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評論區(qū)留下你的想法!
—?完?—
明晚20點,得到APP聯(lián)創(chuàng)和Get筆記負(fù)責(zé)人快刀青衣將做客AI 100訪談間,從Get筆記的經(jīng)驗與思考出發(fā),聊聊知識領(lǐng)域的AI新時代。歡迎掃碼預(yù)約直播!Have Fun~
一鍵關(guān)注 點亮星標(biāo)
科技前沿進(jìn)展每日見