Nano Banana Pro

本文翻译自 Google 官方发布在 X 上的 nano banana pro 完整开发者教程。与注重速度和性价比的 Flash 版本不同，Pro 版本引入了“思考”能力、搜索（Search Grounding）以及高保真 4K 输出等高级功能。该模型的三大核心优势在于：具备思考能力：能够理解和推理复杂的提示词。搜索溯源（Search Grounding）：利用 Google Search 获取实时数据以生成准确的图像。高质量输出：支持高达 4K 分辨率的图像生成。关键细节独特的高级功能思考过程（The “Thinking” Process）：不仅仅是绘画，模型会先进行推理。开发者可以通过设置 include_thoughts=True 来查看模型的“思考”过程，了解其如何解读提示词。搜索溯源（Search Grounding）：模型可以访问实时数据（如天气预报、特定人物信息），生成基于事实的图像。 4K 高分辨率生成：支持 1K、2K 和 4K 分辨率。多语言能力：能够生成和翻译图像中的文本，支持超过十种语言。高级图像混合：相比 Flash 版本仅支持 3 张图像，Pro 版本最多可处理 14 张图像的混合，适合制作复杂的拼贴画。成本与计费信息定价：生成 1K 或 2K 图像的成本为 $0.134，而 4K 图像的成本为 $0.24（外加 Token 费用）。节省成本：使用 Batch API 可以节省 50% 的生成成本，但可能需要等待长达 24 小时。必要设置：必须在 Google Cloud 项目中设置计费，并获取 API 密钥。技术实现指南 SDK 支持：支持 Python (google-genai) 和 JavaScript SDK。模型 ID：使用 Pro 模型时需指定 ID 为 gemini-3-pro-image-preview。基本代码结构：教程提供了初始化客户端、设置 response_modalities（文本/图像）和 aspect_ratio（宽高比）的代码示例。最佳实践与提示词技巧为了获得最佳效果，建议遵循以下原则：...