FisherAI

快速了解一下 xAI 刚刚发布的 Grok 4 模型

2025 年 7 月 10 号马斯克旗下的 AI 公司 xAI 发布了史上最强模型 Grok 4，在所有评测集上碾压所有已发布模型，甚至在 AIME25 评测集上拿下了满分。关于 Grok 4 的基本信息 Grok 4 是一个推理模型，支持文本和图像输入，支持函数调用和结构化输出。 256K token 的上下文窗口。低于 Gemini 2.5 Pro 的 1M token 上下文窗口，但领先于 Claude 4 Sonnet 和 Claude 4 Opus（200K token）、o3（200K token）以及 R1 0528（128K token）。定价与 Grok 3 相当，为每百万输入/输出 token 3/15 美元（每百万缓存输入 token 0.75 美元）。其每 token 定价与 Claude 4 Sonnet 相同，但比 Gemini 2.5 Pro（输入 token 少于 20 万时，为 1.25/10 美元）和 o3（近期降价后，为 2/8 美元）更贵。每秒输出 75 个 token，慢于 o3（188 token/s）、Gemini 2....

如何将 AI 应用于你的初创企业 • YC

本文来自 YC 的一个分享：How To Use AI In Your Startup。大语言模型的进步持续呈指数级增长。那么，作为创业者，您应该如何抓住这一机遇呢？YC 的合伙人讨论了如果您考虑转型为 AI 或将其整合到您的业务中，应该考虑哪些因素。 AI创业浪潮已至，你的公司应该“随波逐流”吗？我们正经历一场新技术的冲击。人工智能，尤其是大语言模型，像当年的云计算和智能手机一样，正在悄悄改变很多行业。对创业者来说，这是机会，也是疑问：要不要把项目转向 AI？如果业务本身不是干这行的，是不是已经慢半拍？ Y Combinator 的合伙人 Brad、Pete、Gustav 和 Nicola 和上千位创始人聊过，他们发现：技术日新月异，可创业的底层逻辑没变。下面是他们在 AI 时代依旧管用的几条心得。 “转型 AI”是个伪命题？AI 早成了默认配置先说最常见的问题：我的公司要不要改做 AI？答案听上去矛盾：别因为 AI 很火就仓促改行，但几乎所有业务都值得用上大语言模型。关键在视角。别再问“要不要做一家 AI 公司”，这问题已经过时。今天的 AI 就像 2014 年的云。那会儿，没人会纠结“要不要用云”，用就对了。同理，现在不把 AI 用进产品或流程里，反而显得奇怪。拿一家 YC 投资的企业举例：他们的主营业务是管理业主协会（HOA）。听起来一点也不高科技，可他们在后台用大语言模型自动化了大批流程，效率飙升，却从不自称“AI 公司”。真正让他们拉开差距的，是那些悄悄运转的模型，而不是标签。所以，别只想着改名字、加两个 API，就想摆脱初创公司的生死线。重点是：AI 能不能帮你给客户创造看得见的价值。历史不会重复，但总押韵：AI 的“iPhone 时刻” 没赶上过上一波技术浪潮的人，很难体会当下的节奏。 2007 年，史蒂夫·乔布斯发布初代 iPhone。那时没人想得到几年后会发生什么。App Store 一年后才上线，重要权限又等了一年。可接下来的五年，足以催生一代移动互联网巨头。云计算也类似。Workday 的创始人曾在 PeopleSoft 工作，2000 年前后他断定：迟早有人用云把企业软件重做一遍，而且会做得更好，于是就有了 Workday。现在轮到 AI。用 AI 原生思路把现有软件重写一次，本身就是巨大机会。...

我不认为通用人工智能 (AGI) 即将到来 • Dwarkesh Patel

本文是 Dwarkesh Patel 在自己博客发表的一篇文章。Dwarkesh Patel 是一位印度裔美籍播客主持人、作家和知识传播者。他以深度访谈著称，特别聚焦于人工智能、历史、经济和科技等领域。通过自己的播客平台，他连接学术界与公众，促使复杂思想更易理解本文详细阐述了他对通用人工智能（AGI）发展时间表的看法。他认为，尽管当前的大语言模型（LLMs）能力令人印象深刻，但由于其存在根本性的能力缺陷，AGI 并不会在未来几年内迅速到来。然而，一旦这些关键瓶颈被突破，AI 的发展将迎来爆炸性增长。主要观点 AGI 不会很快到来：作者的核心论点是，AGI 不会在短期内（未来 2-5 年）实现，主要原因是当前模型缺乏**持续学习（continual learning）**的能力。持续学习是关键瓶颈：与人类可以通过反馈和实践不断改进不同，目前的 LLMs 无法在工作中积累经验和上下文。这使得它们难以真正替代人类员工执行复杂的、需要适应性的白领工作。短期谨慎，长期乐观：基于上述瓶颈，作者对 AI 在未来几年的经济变革潜力持谨慎态度。但他预测，一旦持续学习问题在未来十年内被解决，AI 的能力将发生“不连续的”巨大飞跃，引发一场“智能爆炸”，因为届时所有 AI 副本的学习成果可以被整合。 AGI 时间线呈对数正态分布：作者认为 AGI 很可能在本十年（2030 年前）实现，因为当前由计算资源驱动的指数级增长无法持续到 2030 年之后。如果错过了这个窗口期，后续进展将大幅放缓。关键细节当前 LLMs 的局限性：作者以个人使用 LLMs 协助播客后期制作的经验为例，指出即使在语言处理这类核心任务上，模型的表现也仅为 5/10。最大的问题是无法通过高级反馈让模型改进。用户只能不断调整提示词（prompt），但这远不及人类的学习和适应过程。作者用“教萨克斯风”作比喻：无法通过不断给新生写指示来教会他，而必须让他亲自练习和调整。因此，作者预测，如果 AI 发展从今天停滞，可能只有不到 25% 的白领工作会被取代。对“计算机使用代理”的怀疑：作者对“到 2026 年底将出现可靠的计算机使用代理（能自动完成报税等复杂任务）”的预测表示怀疑。理由包括：1) 此类任务的训练反馈周期长；2) 缺乏大规模的、用于计算机使用的多模态预训练数据；3) 即使是看似简单的算法创新（如 o1 模型的推理能力）也需要数年时间才能完善。作者的 50/50 时间线预测： 2028 年：AI 能够像一个能干的人类经理一样，端到端地处理一家小公司的报税工作。作者认为，目前 AI 在计算机使用领域的能力，相当于语言模型领域的 GPT-2 阶段。 2032 年：AI 能够像人类一样在工作中无缝、快速地学习。作者认为 7 年的时间足以在持续学习方面取得突破性进展。承认当前模型的强大之处：...

RAG 代理在生产环境中的应用：我们学到的 10 个经验教训 • Douwe Kiela

本文来自于 RAG 技术的开创者 Douwe Kiela 在 2025 AI 工程师峰会上的演讲：RAG 代理在生产环境中的应用：我们学到的 10 个经验教训。Douwe Kiela 是 Contextual AI 的首席执行官兼联合创始人。他还在斯坦福大学担任副教授。之前，他曾担任 Hugging Face 的研究主管以及 Meta 的基础 AI 研究 (FAIR) 团队的研究负责人，在那里他率先推出了检索增强生成 (RAG) 等其他关键的 AI 突破。他在多模态、对齐和评估方面的研究为 AI 领域树立了新的标准，并使系统更安全、更可靠和更准确。生成式AI的浪潮正以前所未有的力量席卷全球，麦肯锡预测它将为全球经济带来高达4.4万亿美元的增值。这是一个巨大的机遇，但现实却有些骨感：只有四分之一的企业真正从AI投资中获得了价值。为什么会这样？一边是无限的潜能，另一边却是普遍的挫败感。Contextual AI的CEO、同时也是RAG（Retrieval-Augmented Generation）技术的开创者Douwe Kiela认为，我们正面临一个**“上下文悖论” (Context Paradox)**。上下文悖论：AI时代的新挑战你可能听说过机器人领域的“莫拉维克悖论”（Moravec’s Paradox）：对人类来说困难的事情（如下棋），对计算机来说轻而易举；而对人类来说简单的事情（如打扫房间），对机器人来说却难如登天。如今，在企业AI领域，类似的悖论正在上演。大型语言模型（LLM）能写出比多数人类更优秀的代码，能解决复杂的数学问题，但在一个对人类来说几乎是本能的领域——理解和运用上下文——却步履维艰。人类专家可以轻而易举地利用多年的经验和直觉，将信息置于正确的场景中进行判断。而这，正是当前AI的短板，也是决定AI能否创造真正商业价值的关键。企业AI的价值路径，是从提供“便利性”的通用助手，走向创造“差异化价值”的业务转型。你走得越远，对上下文处理能力的要求就越高。那么，如何跨越这道鸿沟？Douwe Kiela结合他创办Contextual AI两年来，将RAG智能体 (RAG Agents) 推向生产环境的经验，分享了10条宝贵的实战教训。 1. 破除模型迷思：系统 > 模型当一个新的、更强大的语言模型发布时，整个行业都会为之沸腾。人们的注意力往往只集中在模型本身，却忽略了一个事实：在企业应用中，LLM通常只占整个系统的20%。真正解决问题的是一个完整的系统，而RAG是这个系统的核心组件。一个性能平平的模型，搭配一套卓越的RAG系统，其效果远胜于一个顶尖模型配上一套糟糕的RAG系统。核心教训：不要只盯着模型，要建立系统性思维。解决商业问题的，是系统，而非孤立的模型。 2. 别做万金油：专业化胜过通用人工智能 (AGI) 通用人工智能（AGI）的愿景固然激动人心，但在解决具体的企业问题时，专业化才是王道。企业的核心竞争力在于其日积月累的专业知识和行业洞见。通用模型很难企及内部专家的水平。与其追求一个“什么都懂一点”的通用模型，不如针对特定领域和用例进行深度优化和专业化训练。这样才能真正把企业的“专家知识”这个燃料库点燃。核心教训：聚焦专业化，让AI成为你所在领域的专家，而不是一个泛泛的通才。 3. 数据就是护城河：拥抱规模与噪音一家公司的本质是什么？是员工吗？不完全是，员工会流动。从长远看，公司的本质是其独有的数据。这些数据，构成了企业最坚实的护城河。...

马斯克 YC AI 创业学校演讲精华：超级智能与人来文明的未来

埃隆·马斯克在 YC 创业学校的这个分享特别值得一看，内容涵盖了他从早期互联网创业到领导 SpaceX、Tesla 和 xAI 的历程，以及他对AI 和第一性原理思维的深刻见解。看完整个视频你会 get 到他做事情的出发点——“做对人类真正有用的事”。另外，视频中他也提到 Grok 3.5 的进展，以及 XAI 拥有的 GPU 的情况。最后，他对人类文明未来的深思特别的有意思，其实他自己也没太想明白，但先干了再说。早年创业看过马斯克自传的人对他早期的创业故事应该都非常熟悉了，他在这里分享这段经历主要的目的是说他当时做事的核心动机：“尽可能地对人类有用”。无论是早期创办 Zip2，还是后来投身于 SpaceX 和 Tesla，他的目标都是解决实际问题、创造有价值的产品，而非追求名利。 1995 年，他放弃博士学位，拉着弟弟做了 Zip2。没钱就睡工位、去基督教青年会冲凉。 Zip2 以 3 亿美元卖给康柏，马斯克分到约 2000 万美元。很快，这笔钱几乎又全部押在 X.com（后并入 PayPal）——“我要面向终端用户，再也不想看传统媒体脸色”。随后是 SpaceX。他一开始并不是看中了商业火箭潜力，而是 NASA 居然没有登陆火星时间表。他认为自己干商业火箭公司的成功率估计不到一成，他甚至跑去俄罗斯问能否买两枚退役 ICBM。SpaceX 前三次发射全败了，第四次发射如果失败，公司就破产了，但幸运女神眷顾，第四次发射成功了。2008 年应该是对老马极其艰难的一年，SpaceX 第三次发射失败，Tesla 的融资也失败了。最终，在 2008 年圣诞节前夕，NASA 的一份合同和 Tesla 在最后一刻完成的融资拯救了公司。第一性原理马斯克最爱挂在嘴边的“第一性原理”，其实就是把一件事拆到物理与成本底座，再倒推出真正可行方案。火箭：把整枚火箭剖成钢材、铝材、燃料等原料，发现账面只占成品价 1%～2%，剩下都是传统供应链“惯例”。算力集群：xAI 需要十万片 H100，他没等 18–24 个月的常规交付，而是 6 个月内盘下一座废厂，租用了发电机和美国约四分之一的移动冷却设备，并结合 Tesla Megapacks 解决了电力波动问题，成功部署了 10 万个 H100 GPU。截至目前，xAI 共握约 30 万张 GPU：15 万 H100、5 万 H200、3 万 GB200，再加一座数据中心准备上线 11 万张 GB200。至于 Grok 3....

生成式引擎优化（GEO）如何重写搜索规则 • A16Z

本文是 A16Z（美国一家顶级风险投资公司）官方发布的一篇文章，主要探讨了随着大型语言模型 (LLM) 成为新的信息入口，传统搜索引擎优化 (SEO) 如何演变为生成式引擎优化 (GEO) 这一新范式。文章分析了这一转变的根本原因、对品牌营销策略的影响，以及其中蕴含的巨大商业机遇。搜索范式正在转变：随着 Apple 等公司将 Perplexity 和 Claude 等 AI 原生搜索引擎整合到其产品中，传统的、以 Google 为主导的基于链接和排名的搜索时代正走向终结。一个以语言模型为核心的新时代——生成式引擎优化 (GEO) 正在兴起。优化的核心目标改变：SEO 的目标是在搜索结果页面上获得高排名。而 GEO 的核心目标是让品牌或内容被 AI 模型直接引用，出现在生成的答案中。衡量标准从“点击率”转变为“引用率”。品牌策略的重塑：品牌不仅要关注在公众心目中的形象，更要关注在 AI 模型中的“形象”。如何被 AI 模型理解、记忆和引用，已成为新的核心竞争力。 GEO 蕴含巨大商业潜力：与分散的 SEO 工具市场不同，GEO 有可能诞生平台级的、更集中的商业模式。成功的 GEO 公司不仅能提供监测分析，更能通过自有模型和技术，主动影响和塑造 AI 的输出，最终成为品牌与 AI 交互的核心渠道和自动化营销平台。关键细节从 SEO 到 GEO 的具体变化基础不同：传统 SEO 建立在“链接”之上，而 GEO 建立在“语言”之上。用户行为改变：AI 搜索的查询更长（平均 23 个词 vs 传统 4 个词），交互更深入（平均 6 分钟）。内容优化方式：GEO 要求内容结构清晰、意义密集，而非简单的关键词堆砌。使用项目符号或“总结”等明确的格式有助于 AI 模型提取信息。商业模式与激励机制的差异传统搜索引擎主要通过广告变现。而许多 LLM 服务采用订阅制，这使得它们在引用第三方内容时，更看重内容能否提升用户体验和产品价值，而非仅仅为了流量。新兴的 GEO 工具与实践 Profound、Goodie 等新平台已出现，帮助品牌分析其在 AI 回复中的形象和声量。 Ahrefs 和 Semrush 等传统 SEO 巨头也已推出新工具，以适应 GEO 时代，追踪品牌在 AI 生成内容中的提及情况。案例：Canada Goose 利用 GEO 工具分析 LLM 是否会自发提及该品牌，以此衡量其在 AI 时代的“无提示品牌知名度”。 GEO 的未来机遇 GEO 目前仍处于早期实验阶段，规则尚在不断变化中。文章预测，成功的 GEO 平台将超越分析工具的范畴，它们会拥有自己的微调模型，整合点击流等数据，不仅观察 AI 的行为，更能主动塑造其行为，最终演变为一个自动化、跨渠道的性能营销系统。作者将 GEO 视为继 Google Adwords 和 Facebook 广告之后，下一个重要的营销风口和竞争高地。原文我们所熟知的搜索时代行将结束，而营销人员们对此感觉还不错。嗯，差不多吧。...

Andrej Karpathy：软件正在经历第三次根本性变革

前 OpenAI 创始人 & 特斯拉 AI 总监 Andrej Karpathy 在 YC 创业学校的这个演讲特别好，如果大家经常关注他的推特和 blog 会很熟悉里面的内容，这篇演讲整个篇幅的内容之前他都有提到过，比如他对大语言模型一以贯之的类比 “LLM 操作系统”，比如他认为当前的 GUI 是为人类设计的，后面要为 AI 而设计，再比如软件的开发范式正在进入 3.0 阶段，也就是 Vibe Coding，Vibe Coding 这个名词就是他首次提出的。软件正在经历第三次根本性变革继 Software 1.0 (传统代码) 和 Software 2.0 (神经网络权重) 之后，我们进入了 Software 3.0 时代。在这个新范式中，自然语言（如英语）本身成为了编程语言，用以驱动大型语言模型 (LLM)，极大地降低了软件开发的门槛。软件版本定义特点示例 Software 1.0 由人类编写的传统、明确的指令代码直接编写逻辑，传统编程范式 Python、C++ Software 2.0 神经网络的权重通过数据集训练"生成"程序，而非直接编写 Tesla Autopilot 神经网络取代 C++ 代码库 Software 3.0 通过自然语言提示（Prompts）编程 LLMs 自然语言成为编程语言，降低开发门槛任何会说自然语言的人都能成为程序员 LLMs 是新一代的操作系统 Karpathy 认为，将 LLMs 视为一种新的操作系统是最贴切的比喻。它们如同 1960 年代的早期计算机，计算资源昂贵且集中在云端，通过分时共享的方式提供服务。这个新“操作系统”拥有自己的生态，为重写现有软件和创造新应用带来了巨大机遇。...

单条视频获赞 230 万，从一条切“玻璃水果”的短视频在 TikTok 爆火谈谈如何获得 AI 视频的 Prompt

Google Veo3 一经发布就引起了广泛关注，它最大的特点是可生成带有音频的视频片段（例如街头的汽车噪音、鸟鸣、人物对话等），大幅超越当前所有的视频生成模型。正如 Google DeepMind 首席执行官 Demis Hassabis 所说：我们正在“走出视频生成的无声时代”。最近一个 TikTok 用户用 Google Veo3 生成了一段“用刀切玻璃水果”的 ASMR（治愈系）视频而爆红，目前播放量已破2300万，获赞230万。有网友把这个博主上述所有的视频拼接成了一个视频，大家可以感受下治愈的声音和画质： Your browser does not support the video tag. 如何复刻看完上面的你视频，你有可能非常好奇这个视频到底是如何制作的，有什么办法可以复刻出来。下面我来教大家一个方法：第一步：把你想要复刻的视频下载到本地。（如果你不知道怎么下载，问下豆包之类的 AI 助手，实在不行用手机或电脑录屏也是个办法）第二步：把该视频上传到 Google AI Studio，模型使用 Gemini 2.5 Pro。如果该视频是个完整的一个场景的片段，输入 Prompt：“这个视频是由 AI 生成的，请帮我写出你认为最合适的能生成这个视频的的 Prompt”。如果该视频是由多个切片视频组合而成，例如上述视频，可以输入这样的 Prompt：“这个视频是由 AI 生成的，请帮我写出你认为最合适的能生成这个视频的的 Prompt。注意，这个视频由多个视频拼接而成，AI 生成的视频最大 8s，请帮我给出每个视频切片对应的最佳 Prompt。” 第三步：从AI 给的一个或多个 Prompt 中选择你喜欢的，或者逐个尝试一下效果，如果不满意你可以继续追问来优化。我们看看对于上述视频，AI 给出的 Prompt 是什么： A video showing a sequence of actions in a cinematic close-up: First, a chef’s knife makes one perfect slice through a glass strawberry, and the slice falls onto a wooden board....

介绍一下当前主流的云端 Vibe Coding 产品

随着 AI 在编程能力上的突破，“Vibe Coding”成为软件开发领域的新趋势。“Vibe Coding” 这个词由前 OpenAI 创始人 & 前特斯拉研发总监 Andrej Karpathy 提出，指的是只需用自然语言描述自己的想法，让 AI 自动生成代码，实现“跟着感觉走”的编程体验。Vibe Coding 降低了编程门槛，显著加快了产品从创意到原型的过程。除了 Cursor、Windsuf、GitHub Copilot 这些面向开发者的 AI原生 IDE 或插件，也出现了很多云端全栈代码生成平台，也就是说一句话即可产出可部署网站或应用，像 Lovable、v0、Bolt、Replit 等。下面我讲给大家讲一讲目前主流的云端 Vibe Coding 产品，并从用户体验、功能性与开发效率、适用人群等方面进行对比分析。另外，最近 labubu 很火，我就试着让 Vibe Coding 产品生成一个 labubu 相关的网站并进行了发布。Prompt为：“最近 labubu 非常火，帮我做一个 labubu 相关的网站，让我能赚到钱。要求：1. 不是卖实物，而是卖手机壁纸之类的主题，下载付费这种模式；2. 不要购物车，而是直接下载之后弹出微信付款码，付完钱即可正常下载这种模式” Lovable Lovable.dev 是一款强调“对话式”开发体验的 AI 辅助无代码工具。用户只需通过聊天界面用自然语言描述需求，即可快速生成交互式前端原型并一键部署 Web 应用。该平台号称将开发速度提升至传统方式的 20 倍，并借助 LangSmith 提供代码调试优化功能。其核心理念正体现了 Vibe Coding —— 完全信任 AI，根据“感觉”构建应用。维度简要说明用户体验聊天式界面，操作直观，界面美观，反馈快，适合初学者沉浸体验功能与效率擅长前端和简单全栈原型，自动生成界面和基础后端，产出速度快，代码结构清晰适合人群设计师、产品经理、编程小白，追求低门槛和高颜值原型，开发者可用作起步工具社区与资源官方文档齐全，Discord 社区活跃，教程丰富，氛围友好，内容持续增长我用开头的 Prompt 生成的 labubu 手机壁纸主题下载网站：https://labubu-kawaii-market-place....

温和的奇点 • Sam Altman

本文是 OpenAI 创始人 Sam Altman 在 2025 年 6 月 11 日发表的博客。文章指出，人类已进入数字超级智能的“奇点”阶段，人工智能的飞速发展将深刻改变世界。目前，人工智能系统已在多方面超越人类智能，并极大地提升了人类的产出。未来，随着智能和能源变得“极其丰富”，科学进步和生产力将大幅提升，带来远超现在的优质生活。尽管面临就业结构变化等挑战，但人类的适应能力和对彼此的关怀将帮助我们应对。关键在于解决人工智能的“对齐问题”并确保超级智能的广泛、公平分布，以实现最大化的积极影响。当前进展与未来展望：系统如 GPT-4 和 o3 已在多方面超越人类智能，并能显著放大用户产出。 ChatGPT 每天被数亿人用于日益重要的任务。 2025 年：能进行真实认知工作的“代理”出现，如编写计算机代码。 2026 年：有望出现能发现新颖见解的系统。 2027 年：可能出现能在现实世界执行任务的机器人。生产力与科学进步：科学家在使用 AI 后生产力提升 2 到 3 倍。 AI 可加速 AI 研究本身，实现“递归式自我改进”。经济价值创造推动了运行强大 AI 系统的基础设施建设。机器人制造机器人、数据中心自动化生产等即将实现，将使智能成本趋近于电力成本。一个 ChatGPT 查询平均消耗约 0.34 瓦时电量和 0.000085 加仑水。社会变革： 2030 年代，智能和能源将“极其丰富”，消除人类进步的根本限制。 “奇点”过程是渐进的，奇迹将变得司空见惯（如从生成段落到小说，从诊断到治愈，从小程序到新公司）。部分职业将消失，但世界将迅速变得更富裕，从而能考虑前所未有的新政策。人类具有适应能力，专家若能拥抱新工具仍将保持优势。到 2035 年，新奇迹的实现速度将非常快，可能在短时间内实现高能物理突破到太空殖民，或材料科学突破到高带宽脑机接口。挑战与解决方案：安全问题：必须在技术和社会层面解决。广泛分发：鉴于经济影响，确保超级智能的广泛可及性至关重要。对齐问题：确保 AI 系统能稳健地学习并按照人类集体的长期意愿行事（如社交媒体算法的短期偏好与长期意愿的错位）。前进路径：解决对齐问题，然后使超级智能廉价、广泛可用且不过度集中于任何个人、公司或国家。社会需要尽快就“广泛边界”和“集体对齐”的定义展开对话。 OpenAI 的角色： OpenAI 是一家“超级智能研究公司”，致力于为世界构建一个“大脑”，它将高度个性化且易于使用。 “智能廉价到无需计量”的目标触手可及。原文我们已经越过了事件视界；腾飞已经开始。人类距离构建数字超级智能已近在咫尺，而至少到目前为止，这远没有人们想象中那么离奇。...