Artificial Analysis

Artificial Analysis 发布了《2025 年第三季度 AI 状况报告》，以下是该报告的核心内容： 2025 年第三季度，人工智能行业呈现出空前激烈的竞争和加速创新的态势。各大 AI 实验室不仅在模型的智能、效率和速度上持续突破，竞争者的数量也在各个领域迅速增长。本季度的核心趋势表现为：竞争全面加剧：领先的 AI 实验室在模型性能上的差距逐渐缩小，同时，新的参与者不断涌现，尤其是在中国。智能体（Agent）成为焦点：AI 实验室的研发重点正转向提升模型的“智能体”能力，使其能够自主使用工具、执行更复杂的多步骤任务。图像与视频生成技术普及：随着 Gemini 2.5 Flash 等模型的发布，图像编辑功能在质量和普及度上显著提升，视频生成技术也日益成熟。开源模型加速发布：以 OpenAI 发布的 gpt-oss-20B 为代表，高质量的开源模型发布速度达到历史新高，与众多来自中国实验室的模型展开竞争。语音技术成熟并投入应用：语音转录、语音生成以及原生的语音对语音（Speech to Speech）技术日趋成熟，为实现更自然的生产级语音智能体铺平了道路。关键细节行业概览垂直整合：在 AI 价值链中，Google 凭借其从 TPU 芯片到 Gemini 应用的全面布局，成为垂直整合程度最高的公司。资本支出：大型科技公司持续增加对 AI 基础设施的投资，预计这一趋势将持续到 2026 年。例如，xAI 计划为其数据中心采购 300,000 个 Nvidia GPU。市场格局：中美的大型科技公司在语言、图像、视频等多个 AI 领域展开竞争，而规模较小的挑战者则倾向于专注于特定领域。语言模型 (LLM) 智能水平：OpenAI 凭借 GPT-5 模型重新夺回智能指数榜首，但与 xAI 的 Grok 4、Anthropic 的 Claude 4.5 和 Google 的 Gemini 2.5 Pro 差距极小，竞争异常激烈。成本与效率：尽管 GPT-4 级别的智能成本已降低了 100 倍，但智能体、长文本推理等新应用对计算资源的需求仍在急剧增加。同时，模型推理的价格在各个智能等级上持续下降。开源模型：虽然性能最强的模型仍是闭源的，但 OpenAI 发布的 gpt-oss-120B 等模型正在推动开源模型接近性能前沿。智能体（Agents）：智能体被定义为由大语言模型驱动、能自主使用工具完成端到端任务的系统。Q3 2025 发布的新模型普遍针对工具使用和智能体任务进行了优化。图像与视频模型视频技术：视频模型的质量进步神速，中国实验室在视频生成领域处于领先地位，例如快手的 Kling 2....