快速了解一下火爆全球的最强图像模型:nano-banana!并附 20+ 种玩法和教程
Google 大概几周之前就在 LMArena 上测试了 nano-banana,并很快受到社区的热捧,核心原因图像一致性保持的能力过于强大,一会会给大家一些例子来展示一下。Google 于 2025 年 8 月 26 日正式发布该模型,学名叫 Gemini 2.5 Flash Image。这个模型强大的有以下几点: 非常强大的角色一致性的保持 它可以将同一个角色放置在不同的环境中,在新场景中从多个角度展示单个产品,同时保留主体。 基于自然语言描述的图像编辑。 例如,该模型可以模糊图像背景、去除 T 恤上的污渍、从照片中移除整个人、改变主体的姿势、为黑白照片添加色彩,或实现任何通过简单提示能想到的效果。 强大的世界知识。 一般的图像生成模型在美学图像方面表现出色,但缺乏对现实世界的深度语义理解。Gemini 2.5 Flash Image 受益于 Gemini 的世界知识,解锁了新的应用场景。比如理解手绘图表、帮助解答现实世界问题以及单步执行复杂编辑指令的能力。 您的浏览器不支持视频播放。请点击这里下载视频。 多图像融合 它能理解和融合多个输入图像。你可以将物体放入场景中,用配色方案或纹理重新设计房间,并通过单个提示融合图像。 您的浏览器不支持视频播放。请点击这里下载视频。 指标表现 目前 Gemini 2.5 Flash Image 基本霸榜图像编辑和生成模型的榜单了,特别是图像编辑领域更是大幅领先。 价格 文本价格(百万 token):输入 $0.3,输出 $2.5 图像生成价格(百万 token):输入 $0.3,输出 $30 输出图片的最大尺寸为 1024x1024 像素。 如果换算成一张图的话,大概一张图 3 毛钱左右。 体验地址 Google AI Studio,右上角选择模型为:Gemini 2.5 Flash Image Preview Gemini,选择图片模式 OpenRouter,选择 Google: Gemini 2.5 Flash Image Preview 或者 Google: Gemini 2....