谷歌前些天正式发布了 Nano Banana (Gemini 2.5 Flash Image),最令人印象深刻的就是它的角色一致性。之前用过 Midjourney,gpt-4o,想用它们来制作一些简单的帧动画。但是角色一致性的问题作罢。但是看到小红书上很多用Nano Banana 生成手办模型、动漫转真人的帖子,真是惊艳到我了。
据说现在拓竹科技已经在跟进咯,说不定就真可以实现手办自由了。
Nano-banana 核心功能
- 角色和风格的一致性。这个真的是解决了 AI 生成图像的痛点之一了。Gemini 2.5 Flash Image 可以在多幅图像中保持人物、物体或视觉风格的外观。
- 迭代优化。通过对话逐步优化图片,进行细微调整,直到达到理想效果。试过 MJ 和 GPT,都不太能让人满意。尤其是 MJ,每次生成出来的都不一样,哪怕你设定了参考图像和图像权重。
- 多图融合。使用多张输入图片合成新场景,或将一张图片的风格迁移到另一张图片上。这个估计在电商里的应用会很好啊。
- 文本渲染。准确生成包含清晰易读且位置合理的文本的图片。之前gpt-4o做四格漫画也是火了一把。Gemini 的表现比它还好。但目前只对英文支持较好。这个功能停适合生成图标、海报。
三步上手 Nano Banana
目前可以在 Google AI Studio 和 Gemini APP 免费使用 Nano Banana,每天有免费额度,大概能出10张图的样子。
1. 首先,你得有个 Google 账号。当然,能翻墙是必须的,这个就不必说了。
2. 直接搜索 “Google AI Studio” 进入官网。登录你的谷歌账号后,你就能看到一个简洁的工作台。在左侧菜单找到“Chat” 选项,点进去,就能看到 "Try Nano Banana" 了。
3. 在输入框里输入提示词,点击“Run”就行了。如果你想在某张图的基础上生成,就点击加号,选择“Upload File”就好了。

Nano Banana 的“魔法咒语”
基础知识
先说说谷歌官方教的关于prompt 的基础样式。
一个好的提示词,应该表述清晰,并使用有意义的关键词和修饰语。起码要有三要素:
- 主题。就是你想要生成的图像的主体,可以是人、物体、动物或者风景等等。
- 背景。放置你主体的位置或背景。其实我觉得说场景可能更好理解一点。
- 风格。你想要的图像风格。风格可以是通用的(例如油画、素描、摄影),也可以是非常具体的(例如等距3D,蜡笔画,吉卜力,迪士尼等等)。也可以组合多种风格。
看一下官方的例子:

A sketch (style) of a modern apartment building (subject) surrounded by skyscrapers (context and background).
翻译:一张被摩天大楼包围(背景)的现代公寓(主体)草图(风格)
写完提示的第一个版本后,可以通过追加更多细节来迭代,直到获得你想要的图像。
手办咒语
手办系列很出圈了,还有 3D 打印系列的。我觉得后面电脑屏幕上的建模过程挺对的啊。据说拓竹科技已经在跟进了,说不定以后真的能实现手办自由了。
Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is the Blender modeling process of this figurine.
Next to the computer screen is a packaging box with rounded corner design and a transparent front window, the figure inside is clearly visible.
再看看别人的
邱小姐的。来源:知乎@哈哈儿

刘亦菲。知乎@木原金

漫画转手办的。这个效果真的很棒。来源,知乎@英雄王爆破


知乎@饮啄
创建一个高度写实的、1/7比例的商业化手办,需确保立体感和手办材质质感,尤其是上半身。角色基于该插画(若插画中角色非全身像,请将其补完),整体风格和环境需细致且栩栩如生。将手办放置在一个无任何文字的圆形透明亚克力底座上。确保纹理、材质和涂装拥有精细的细节以增强真实感。
光源应来自右上角,向左下方投射光线,照在手办身上(脸上)。手办表面应在光照下呈现出一种漫反射的柔和光泽,以模拟真实的次表面散射和材质反光效果。
手办被放在温馨的家中的电脑桌上,显示屏前。



摆各种姿势
这个就跟之前的SD很像了,但是要简单不少。制作思路:
- 找主体,先找一张需要摆造型的主体图,可以不是全身照;
- 找 POSE 图,网上找 POSE 姿势图;
- 将主体图和 POSE 图发送给 Gemini,让主体摆出 POSE 姿势。
找pose网站:pinterest.com ,posemy.art
示例图:知乎@夏尾的口袋


电商
Nano Banana 的多图融合功能对做电商来说真的是效率神器。来源 :知乎@挽安
模特,再上传一个眼镜的图,就得到了一个戴眼镜的模特。仔细看商品的细节,是不是跟原图一致!连上面的花纹都一样。


最后
还有很多很好玩很有用的提示词,大家可以自行搜索,或者直接把你的想法跟 Gemini Pro 说说,让它帮你写。
引用: