AlphaEvolve: 一个由 Gemini 提供动力的编码 AI 智能体,用于设计高级算法
Google 在 2025年 5 月 15日 发布了 AlphaEvolve: 一款利用大型语言模型(LLMs)进行通用算法发现与优化的进化编码代理。其核心思想是结合 Gemini 模型的创造性问题解决能力和自动化评估机制,通过进化迭代的方式生成、验证并改进算法。该代理不仅能够优化现有计算流程,还能在数学等基础科学领域探索新的解决方案,展示了其在多个领域应用的广泛前景和实际价值。 核心技术与工作原理 驱动模型:AlphaEvolve 由 Google 的 Gemini 模型系列驱动,其中 Gemini Flash 用于探索广泛的创意,而 Gemini Pro 则提供深度洞察和建议。 进化框架: 程序生成:LLMs 提出实现算法解决方案的计算机程序(代码)。 自动化评估:系统使用自动化评估指标对生成的程序进行验证、运行和评分,客观评估其准确性和质量。 进化选择:基于评估结果,有前景的程序被存储并在进化算法中用于生成下一代更优的程序。 适用领域:特别适用于进展可以被清晰和系统化衡量的领域,如数学和计算机科学。 在 Google 计算生态系统中的应用与优化 AlphaEvolve 已被部署于 Google 的数据中心、硬件设计和软件(AI 训练)等多个方面,带来了显著效率提升。 改进数据中心调度: 为 Google 的 Borg 系统发现了一种简单有效的启发式算法,用于更高效地协调庞大的数据中心。 该方案已在生产环境中运行超过一年,平均持续回收了 Google 全球计算资源的 0.7%。 生成的代码具有人类可读性,易于解释、调试、预测和部署。 协助硬件设计: 提出了一项 Verilog 代码重写建议,移除了一个高度优化的矩阵乘法算术电路中的不必要比特。 该提议通过了严格验证,确保了修改后电路的功能正确性,并已集成到即将推出的 Tensor Processing Unit (TPU) 中。 增强 AI 训练与推理: 通过优化大型矩阵乘法操作的子问题划分,将 Gemini 架构中关键核心(kernel)的速度提升了 23%,使 Gemini 的训练时间减少了 1%。 将内核优化的工程时间从数周专家投入缩短至数天自动化实验。 能够优化底层 GPU 指令,在 Transformer 类 AI 模型中的 FlashAttention 内核实现上取得了高达 32....