试了试 Nano Banana 生成手办图片,好惊艳

nano banana AI
这篇文章大约需要5分钟阅读。

谷歌前些天正式发布了 Nano Banana (Gemini 2.5 Flash Image),最令人印象深刻的就是它的角色一致性。之前用过 Midjourney,gpt-4o,想用它们来制作一些简单的帧动画。但是角色一致性的问题作罢。但是看到小红书上很多用Nano Banana 生成手办模型、动漫转真人的帖子,真是惊艳到我了。

据说现在拓竹科技已经在跟进咯,说不定就真可以实现手办自由了。

Sponsored links

Nano-banana 核心功能

  • 角色和风格的一致性。这个真的是解决了 AI 生成图像的痛点之一了。Gemini 2.5 Flash Image 可以在多幅图像中保持人物、物体或视觉风格的外观。
  • 迭代优化。通过对话逐步优化图片,进行细微调整,直到达到理想效果。试过 MJ 和 GPT,都不太能让人满意。尤其是 MJ,每次生成出来的都不一样,哪怕你设定了参考图像和图像权重。
  • 多图融合。使用多张输入图片合成新场景,或将一张图片的风格迁移到另一张图片上。这个估计在电商里的应用会很好啊。
  • 文本渲染。准确生成包含清晰易读且位置合理的文本的图片。之前gpt-4o做四格漫画也是火了一把。Gemini 的表现比它还好。但目前只对英文支持较好。这个功能停适合生成图标、海报。

三步上手 Nano Banana

目前可以在 Google AI Studio 和 Gemini APP  免费使用 Nano Banana,每天有免费额度,大概能出10张图的样子。

1. 首先,你得有个 Google 账号。当然,能翻墙是必须的,这个就不必说了。

2. 直接搜索 “Google AI Studio” 进入官网。登录你的谷歌账号后,你就能看到一个简洁的工作台。在左侧菜单找到“Chat” 选项,点进去,就能看到 "Try Nano Banana" 了。

3. 在输入框里输入提示词,点击“Run”就行了。如果你想在某张图的基础上生成,就点击加号,选择“Upload File”就好了。

nano-banana-希尔瓦娜斯手办

Nano Banana 的“魔法咒语”

基础知识

先说说谷歌官方教的关于prompt 的基础样式。

一个好的提示词,应该表述清晰,并使用有意义的关键词和修饰语。起码要有三要素:

  • 主题。就是你想要生成的图像的主体,可以是人、物体、动物或者风景等等。
  • 背景。放置你主体的位置或背景。其实我觉得说场景可能更好理解一点。
  • 风格。你想要的图像风格。风格可以是通用的(例如油画、素描、摄影),也可以是非常具体的(例如等距3D,蜡笔画,吉卜力,迪士尼等等)。也可以组合多种风格。

看一下官方的例子:

style subject
A sketch (style) of a modern apartment building (subject) surrounded by skyscrapers (context and background).
翻译:一张被摩天大楼包围(背景)的现代公寓(主体)草图(风格)

写完提示的第一个版本后,可以通过追加更多细节来迭代,直到获得你想要的图像。

手办咒语

手办系列很出圈了,还有 3D 打印系列的。我觉得后面电脑屏幕上的建模过程挺对的啊。据说拓竹科技已经在跟进了,说不定以后真的能实现手办自由了。

Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is the Blender modeling process of this figurine.

Next to the computer screen is a packaging box with rounded corner design and a transparent front window, the figure inside is clearly visible.

再看看别人的

邱小姐的。来源:知乎@哈哈儿

v2 4b4d93327ba4d26fa44d8ee864a068cd 1440w

刘亦菲。知乎@木原金

v2 46ebdda0d896782d1dbe59a891c049a7 1440w

漫画转手办的。这个效果真的很棒。来源,知乎@英雄王爆破

v2 5b18a39ab00901fc6bf51a3c06b0a89b r
v2 90a985113e2615e834f470c972f29f97 1440w

知乎@饮啄

创建一个高度写实的、1/7比例的商业化手办,需确保立体感和手办材质质感,尤其是上半身。角色基于该插画(若插画中角色非全身像,请将其补完),整体风格和环境需细致且栩栩如生。将手办放置在一个无任何文字的圆形透明亚克力底座上。确保纹理、材质和涂装拥有精细的细节以增强真实感。

光源应来自右上角,向左下方投射光线,照在手办身上(脸上)。手办表面应在光照下呈现出一种漫反射的柔和光泽,以模拟真实的次表面散射和材质反光效果。

手办被放在温馨的家中的电脑桌上,显示屏前。
v2 d74f3c6c2b2e88cb2efd01a0b5a7bd57 1440w
v2 0cf042fb0a179a5131e6fb035bfab718 1440w
v2 69c68b75445d2197e24a6aba37631cd3 1440w

摆各种姿势

这个就跟之前的SD很像了,但是要简单不少。制作思路:

  • 找主体,先找一张需要摆造型的主体图,可以不是全身照;
  • 找 POSE 图,网上找 POSE 姿势图;
  • 将主体图和 POSE 图发送给 Gemini,让主体摆出 POSE 姿势。

找pose网站:pinterest.com ,posemy.art

示例图:知乎@夏尾的口袋

v2 32fcf24d070c8a3db4c89c6151c5f8c9 1440w
v2 1ef32a89f54f2adefdb02bdcbfbeecf9 1440w

电商

Nano Banana 的多图融合功能对做电商来说真的是效率神器。来源 :知乎@挽安

模特,再上传一个眼镜的图,就得到了一个戴眼镜的模特。仔细看商品的细节,是不是跟原图一致!连上面的花纹都一样。

v2 e4c9f1bbf7933af41f6b52a82d44b9ff 1440w
v2 418126cec896445d70a33b488c2a8e2b 1440w

最后

还有很多很好玩很有用的提示词,大家可以自行搜索,或者直接把你的想法跟 Gemini Pro 说说,让它帮你写。

引用:

Rate this post
订阅评论
提醒
0 评论
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x