快速了解一下 Google 发布的 Gemini 3 Flash Preview

Google 在 2025 年 12 月 18 日发布了 Gemini 3 Flash Preview,这是一款专为开发者设计的新一代 AI 模型。它具备前沿的智能水平,旨在实现大规模生产应用。该模型的核心突破在于打破了以往在“速度”与“智能”之间必须做出妥协的局面,能够同时提供卓越的性能和极高的响应速度。 Gemini 3 Flash 在性能上超越了上一代的 Gemini 2.5 Pro,但其运行速度更快,且成本仅为 Gemini 3 Pro 的四分之一不到。凭借先进的视觉、空间推理能力以及代码执行功能,该模型适用于从编程辅助到游戏开发、深度伪造检测等多种复杂场景。 关键细节 性能与基准测试 超越前代:Gemini 3 Flash 在多项基准测试中表现优异,例如在博士级推理基准 GPQA Diamond 中得分达到 90.4%,超越了 Gemini 2.5 Pro。 速度提升:根据人工智能分析基准测试,该模型的速度是 Gemini 2.5 Pro 的 3 倍。 推理能力:具备最先进的视觉和空间推理能力,支持缩放、计数和编辑视觉输入。 定价与成本效率 极低成本:在 Gemini API 和 Vertex AI 中,输入价格为每百万 token 0.50 美元,输出为 3 美元。 成本节约机制:标配上下文缓存功能,在重复使用 token 的情况下可降低 90% 的成本;通过 Batch API 异步处理可节省 50% 的成本。 实际应用案例 编程开发:在 SWE-bench Verified 测试中达到 78% 的准确率,优于 Gemini 3 Pro 的代理编码技能。它已集成到 Google Antigravity 平台,支持快速迭代开发。 游戏领域:Latitude 使用该模型在其游戏引擎中生成更智能的角色和世界,实现了以往只有专业级模型才能达到的质量。 深度伪造检测:Resemble AI 利用该模型进行近乎实时的多模态分析,速度比 Gemini 2....

December 18, 2025 · 2 min · fisherdaddy

分享一下 ChatGPT 的 Study Mode 和 Gemini 的 Guided Learning 两个专为学生学习打造的 Prompt

ChatGPT Study Mode 的 Prompt 原文 The user is currently STUDYING, and they've asked you to follow these **strict rules** during this chat. No matter what other instructions follow, you MUST obey these rules: ## STRICT RULES Be an approachable-yet-dynamic teacher, who helps the student (user) learn by guiding them through their studies. 1. **Get to know the learner.** If you lack their goals, level, or curriculum, ask before diving in....

August 13, 2025 · 17 min · fisherdaddy

AlphaEvolve: 一个由 Gemini 提供动力的编码 AI 智能体,用于设计高级算法

Google 在 2025年 5 月 15日 发布了 AlphaEvolve: 一款利用大型语言模型(LLMs)进行通用算法发现与优化的进化编码代理。其核心思想是结合 Gemini 模型的创造性问题解决能力和自动化评估机制,通过进化迭代的方式生成、验证并改进算法。该代理不仅能够优化现有计算流程,还能在数学等基础科学领域探索新的解决方案,展示了其在多个领域应用的广泛前景和实际价值。 核心技术与工作原理 驱动模型:AlphaEvolve 由 Google 的 Gemini 模型系列驱动,其中 Gemini Flash 用于探索广泛的创意,而 Gemini Pro 则提供深度洞察和建议。 进化框架: 程序生成:LLMs 提出实现算法解决方案的计算机程序(代码)。 自动化评估:系统使用自动化评估指标对生成的程序进行验证、运行和评分,客观评估其准确性和质量。 进化选择:基于评估结果,有前景的程序被存储并在进化算法中用于生成下一代更优的程序。 适用领域:特别适用于进展可以被清晰和系统化衡量的领域,如数学和计算机科学。 在 Google 计算生态系统中的应用与优化 AlphaEvolve 已被部署于 Google 的数据中心、硬件设计和软件(AI 训练)等多个方面,带来了显著效率提升。 改进数据中心调度: 为 Google 的 Borg 系统发现了一种简单有效的启发式算法,用于更高效地协调庞大的数据中心。 该方案已在生产环境中运行超过一年,平均持续回收了 Google 全球计算资源的 0.7%。 生成的代码具有人类可读性,易于解释、调试、预测和部署。 协助硬件设计: 提出了一项 Verilog 代码重写建议,移除了一个高度优化的矩阵乘法算术电路中的不必要比特。 该提议通过了严格验证,确保了修改后电路的功能正确性,并已集成到即将推出的 Tensor Processing Unit (TPU) 中。 增强 AI 训练与推理: 通过优化大型矩阵乘法操作的子问题划分,将 Gemini 架构中关键核心(kernel)的速度提升了 23%,使 Gemini 的训练时间减少了 1%。 将内核优化的工程时间从数周专家投入缩短至数天自动化实验。 能够优化底层 GPU 指令,在 Transformer 类 AI 模型中的 FlashAttention 内核实现上取得了高达 32....

May 15, 2025 · 3 min · fisherdaddy