凯丰策略

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

杠杆炒股 你的位置:凯丰策略 > 杠杆炒股 > 悦来网配资梵高《星月夜》画作;3.作风图片

悦来网配资梵高《星月夜》画作;3.作风图片

发布日期:2025-03-06 08:36    点击次数:110

AI 生图器用,还是多得泛滥了,但 Google 最新推出的 Whisk,如故找到了一种很新的玩法,让见过世面的网友也直呼好玩。

只需输入三张图片,subject(主题)、scene(场景)、style(作风),Whisk 就可以生成一张共同努力的图片。

▲ 图片来自:Google

举个例子,主题是老东谈主,场景是藤蔓,作风是 90 年代相沿动漫,写上「变装骑着遨游自行车」的教唆词,恭候斯须,一张访佛吉卜力画风的新图片出身了。

▲ 图片来自:Google

老东谈主如故阿谁老东谈主,戴帽子,穿西装,拿着书,但他骑上了教唆词里的车,场景和作风也齐酿成了参考图片的模式。

Whisk 的所长便在这里——让咱们少写、不写教唆词的同期,猖厥玩转各式作风,姆妈再也不惦记我不会写教唆词了。

别写复杂的教唆词了,奏凯把图片端上来就行

别看只需要几张图片,Whisk 的玩法浅薄,却又用之贬抑。

刷刷刷上传三张图片——主题图片,麦当劳薯条;场景图片,莫奈画作《睡莲》;作风图片,像素风游戏《星露谷物语》。

不写教唆词,奏凯生成,Whisk 给出的截止,一张更比三张强。

除了上传我方的图片,咱们也可以掷骰子,让 Whisk 当场生成主题、场景、作风。

其实,Whisk 为咱们提供的预设作风还是很够用,徽章、贴纸、刺绣、黏土、好意思漫、马赛克拼贴等等,特色领会,后果立竿见影。

唯一有脑洞和思象力,无需一个字,只是通过不同图片的枚举组合,咱们可以持续地作念完形填空的游戏——主题+场景+作风,而且不是每个空齐必须填。

▲ 1.主题图片,熏鸡;2.场景图片,梵高《星月夜》画作;3.作风图片,日本木版画

▲ 1.主题图片,《戴珍珠耳饰的青娥》;2.场景图片,电影《千与千寻》剧照;3.作风图片,蒙德里安抽象画

▲ 1.主题图片,微信「死亡笑貌」情态包;2.场景图片,电影《星际穿越》剧照;3.作风图片,史努比漫画截图

▲ 1.主题图片,冲浪默许头像粉色恐龙 momo;2.作风图片,Jellycat 玩偶

另外,Whisk 的每一次生成,场景和作风只可选拔一个参考图片,但主题可以选拔多个。这意味着什么?咱们可以让多个变装同框了!

比如,让马斯克、奥特曼、扎克伯格通通酿成搪瓷徽章。

三位的服装、逃避、神情齐规复得挺好,扎克伯格的发话器和项链齐没漏掉,但东谈主脸没法保持一致性,全部酿成了巨匠脸。

虽然 Whisk 减少了写教唆词的需求,但你需要写的话,Whisk 也饱读吹。

在对话框加上一句「变装们齐举着一块晓谕牌,上头写着 AGI」,徽章小人们轻猖厥松地奉命了教唆词。

若是咱们需要某个场景或者某种作风,但一时找不到参考图,Whisk 的预设也莫得提供呢?

贬责方式很浅薄,莫得图片,那就写教唆词,让 Whisk 临场阐扬一个。

就像我需要一个让变装站上去的、像素作风的底座当作场景,就让 Whisk 帮我生成了。

然后,再把猫猫情态包当作主题图片,把像素小鸡当作作风图片,就可以得到一个有底座的像素猫猫。

总之,Whisk 就长短常目田,像橡皮泥相似,若何握齐可以。

既生图又识图,把复杂的职责流包装成意思意思的「打蛋器」

Whisk,其实是 Google 多模态模子秀肌肉的一种方式。

为了让咱们少写教唆词,Whisk 整合了视觉相识和图片生成才智。

Gemini 模子识别图片,自动生成详细的面孔,然后这些面孔会被输入到 Google 的图片生成模子 Imagen 3,由 Imagen 3 生图。

Whisk 是这么的,配资开户用户唯一上传和生成图片就可以了,但它我方要琢磨的事情就许多了。

Whisk 的每张图片,无论是上传的如故生成的,齐写了很长的底层教唆词,况兼不藏着掩着,咱们点开图片就能看,也可以上手修改。

若是把一个东谈主当作主题图片,Whisk 会详细地面孔他的外貌特征,场景图片亦然访佛的。

▲ Whisk 对奥特曼的面孔:「一个肤色较浅的须眉,有着短而深棕色的鬈发,从胸部以上展示。他有着淡色的眼睛。他穿戴一件浅米色的诚实圆领毛衣。布景是一面斑驳的灰色混凝土墙。须眉的情态严肃而中性。光泽有些阴森,他的右脸有轻微的暗影。」

作风图片略有些不同,若是把一张动画截图当作作风参考,Whisk 不会说,画面里有三个东谈主,而是面孔这幅画的颜色、光泽、线条……

▲ Whisk 对史努比画风的面孔:「这张图片以卡通作风呈现,具有强横的综合和平面着色。颜色调色板有限,主要使用原色和轻柔的次要情态。光泽均匀,虚浮猛烈的暗影或高光,给东谈主一种浅薄、实在孩童般的质感。线条明晰且一致,带有轻微不均匀的质感,示意手绘的后果。举座好意思学让东谈主联思到经典的连环漫画或儿童动画。」

是以,Whisk 不是精确地复制图片,而是索要图片的特质和精髓,将主题、场景、作风天然地交融在沿途,各司其职,互不过问。

配备乐可节技术的德国高仪产品(从左到右):德国高仪欧瑞斯玛一体双控龙头;德国高仪欧式面盆龙头

同期,Whisk 也叠了甲——只从图片索要极少关节特征,截止可能和预期不同。这也阐发了,为什么 Whisk 作念不到东谈主脸的精确规复。

是以,哪怕选拔不那么抽象的相沿胶片作风,三位大佬的脸亦然和本尊齐不挨着,但其他细节齐很准确。

物体亦然相似,特斯拉的赛博皮卡,经过特征索要再生成之后,变得尽头平日。

但若是是麦当劳薯条这种素材丰富的超等 IP,后果倒还可以,可以拿来当告白图了。试过一些迪士尼的变装,Whisk 复刻得也原模原样,但图就不放上来了。

爱配配资

另外,Whisk 还存在一个问题——没法作念很精致的作风参考,师法不了某种特定的画风。

当我让 Whisk 生成蒙娜丽莎的乐高小人,出来的截止让我两眼一黑,但多加一句教唆词,「让变装更像乐妙手物」,Whisk 又能师法个七大致。

某个漫画家的画风就更难师法了,上传漫画截图让 Whisk 参考,它最终给出的是一个尽头平日的漫画作风图片,就算通过教唆词强调作品、变装、漫画家,也不起什么作用。

其实,Whisk 好玩就够了,它更合适作念一些不追求精确的创意探索,俗称整活。

Whisk 可以翻译为「搅动」或者「打蛋器」,Google 的这个名字获取即视感很强,可不等于把食材齐混搭在沿途吗?

Whisk 的不精确,也让它的定位和传统的图片剪辑器不同,更像是一种创意器用。有了什么脑洞,由它终了和约略的视觉后果。

▲ Whisk 生成,1.主题图片,《火影忍者》截图;2.作风图片,毛绒玩物

夙昔终了 Whisk 这种作风化的后果,跑通一总共这个词图像生成的经由,咱们可能需要在 ComfyUI 搭建职责流。

但当今有了 Whisk,好像就在玩抽卡游戏或者开盲盒,而且唯一能登录(限好意思国地区),当前还免费。

体验指路

https://labs.google/fx/zh/tools/whisk

Google 跨越的模子才智天然是前提和基础,但策动出被环球需要的家具,仍然需要创造力和审好意思。

很可爱 Whisk 的 slogan:「prompt less, play more.」(少写教唆词,多玩耍。)

Whisk 出自 Google labs,之前爆火的 AI 播客 NotebookLM,亦然出自这里,其后逐渐发展为熟悉的样式。这个本质室,自己等于这句 slogan 的最佳注解。

浩瀚的模子才智悦来网配资,有新意的家具,绽放的心态,也曾似乎被 OpenAI 要挟的 Google,风轻云淡地展现出了王者回来的姿态。



Powered by 凯丰策略 @2013-2022 RSS地图 HTML地图

建站@kebiseo; 2013-2024 北京万生私募基金管理有限公司 版权所有