别只盯着 Manus “跑路”,它超前的产品认知更值得关注

最近 Manus 团队国内裁员,总部搬至新加坡,国内也无法访问了。Manus 的爆火应该是今年 3 月份, 国内很多媒体称之为 DeepSeek R1 之后的另一国运级别的创新,但它的创新不是底层模型创新,而是产品创新。如果你仔细研究过 manus 这个产品,会发现其实它本质其实就是 OpenAI 的 DeepResearch,只是表现形式不同,做个不一定恰当的类似就是DeepSeek R1 之于 OpenAI o1。 一开始我也像很多人一样认为 manus 只是个套壳产品,但我深入使用这个产品之后,彻底否定了我的认知错误,它不是简简单单的套壳,而是一个超前的产品。 在 manus 出来之前,我一直没想清楚自动操作电脑或者手机这种技术有什么大规模的应用场景,除了黑灰产或者炫技,直到 manus 的出现让我 get 到这种技术的正确用法。不应该是 AI 控制你的电脑或手机,而是应该 AI 用自己的电脑或手机(虚拟机)帮我完成一些事情。这一点其实是 manus 团队的一个非常超前的认知: ➡️ AI 浏览器不是在浏览器里加 AI,而是做给 AI 用的浏览器; ➡️ 操作 GUI 不是抢夺用户设备的控制权,而是让 AI 有自己的虚拟机; ➡️ 编写代码不是最终目的,而是解决各种问题的通用媒介; ➡️ Attention 不是 “all you need”,解放用户的 attention 才能 User’s Need;产品设计的核心不是争夺用户注意力,而是通过解放用户注意力来真正满足需求。 还有一个认知,我觉得特别棒:“当无法确保最终结果的绝对正确性时,必须尽可能透明地展示执行过程,并为用户提供干预的机会。” 还记得 DeepSeek R1 出来的时候大家非常喜欢,不是仅仅是因为结果非常惊艳,核心的原因是思考过程太像人类了。 我认为 manus 的成功是团队认知超前的结果(我一直信奉一句话:人只能挣到认知之内的钱)。AI 时代,只要你能提前预判几个月、半年或 1 年的趋势,并提前布局做出超预期的产品,你大概率会成功,manus 就是一个典型的例子,它提前预判和落地了 OpenAI DeepResearch 类似的产品,当然也有他们在浏览器研发上的积累有关。这里有点值得一提,manus 团队本来要做 AI 浏览器,类似于 Arc浏览器,但这个事由一个核心的问题不通:传统浏览器本质上是为单用户设计的交互工具。当 AI 开始执行任务时,用户只能被动等待,或者与 AI 争夺浏览器的控制权。...

July 13, 2025 · 1 min · fisherdaddy

Sam Altman YC AI 创业学校演讲:为什么说现在是创业“最好的时机

本文来自于OpenAI CEO & 创始人 Sam Altman 在 YC 举办的 AI 创业学校的演讲。 “我们决定,我们的目标是AGI(通用人工智能)。” 当Sam Altman和他的团队在近十年前做出这个决定时,“全世界99%的人都觉得我们疯了。”但正是这股疯狂的劲头,吸引了那相信未来的1%的顶尖人才,最终孕育出了改变世界的OpenAI。 在最近的一次对话中,这位OpenAI的CEO分享了他一路走来的思考、对未来的大胆预测,以及给所有创业者的肺腑之言。他说,现在是“科技史上,最好的他妈的时机,句号,去创办一家公司。” 回顾起点:那个曾被99%的人认为是“疯了”的AGI梦 今天回头看,OpenAI的成功似乎是板上钉钉的事。但Sam坦言,当初要不要做,其实是个“抛硬币”的决定。 那是在2015年,整整一年,他们都在讨论这个想法。那时候的AI领域,氛围和现在天差地别。别提什么能流畅对话的语言模型了,当时最前沿的研究,不过是让AI玩玩电子游戏,或者让一个笨拙的机械手勉强还原魔方。AGI这个词听起来就像个不切实际的“白日梦”。 摆在他们面前的,有无数个“不该做”的理由: 想法太疯狂:AGI听起来完全是科幻小说的范畴。 看起来不可能:当时行业巨头DeepMind遥遥领先,追赶似乎毫无希望。 有更稳妥的选择:作为当时YC的总裁,Sam面前有大把看起来“会成功”的创业项目可以投入。 “要做成一件雄心勃勃的事,总会遇到这种情况,”Sam说,“它们看起来太难了,有太多好理由让你放弃。”最终,靠的是一小群核心成员,他们关在房间里,看着彼此的眼睛,下定决心:“好吧,就这么干了。” 这个看似微不足道的决定,成了后来一切的支点。 特立独行:打造“独一无二”公司的秘密武器 决定要做AGI后,一个意想不到的好处出现了:招人反而变容易了。 “如果你说,我们要干一件疯狂、刺激、一旦成功就意义重大的事,而且别人都没在干,你反而能把很多人聚拢起来。”Sam解释道。 当他们喊出“进军AGI”的口号时,尽管99%的人觉得他们是傻子,但那1%真正被打动的人,恰恰是这个领域最聪明、最有激情的一群人。对他们来说,市面上几乎没有第二个地方可以去实现这样的梦想。于是,OpenAI成了顶尖人才的聚集地。 这给了Sam一个深刻的启示: 如果你做的事情和别人都一样,就很难汇聚顶尖人才,也很难让大家对使命产生真正的信仰。但如果你做的是一件“独一无二”的事,你就拥有了一股强大的顺风。 当然,所有伟大的公司都不是一口吃成胖子的。OpenAI也是从一个只有8个人的小房间开始,后来变成20个人,大家围着白板,苦思冥想下一篇研究论文该写什么,前路一片迷茫。 他引用了投资人Vinod Khosla的一句话,这句话完美诠-释了早期创业的精髓:“一个‘零百万美元’的创业公司和一个‘零十亿美元’的创业公司之间,有天壤之别。”虽然它们收入都是零,都是几个人挤在房间里想办法让第一个产品跑起来,但它们的潜力截然不同。 给创业者的建议很简单:选择一个市场,在某个版本的未来里,它一旦成功,就能变得巨大无比。 除此之外,剩下的就是“一步一个脚印,傻傻地坚持很长一段时间”。 AI创业的黄金时代:为什么说“现在就是最好的时机” 聊到当下,Sam的兴奋溢于言表。他认为,我们正处在一个非常有趣的时间点——模型能力和产品创新之间存在巨大的“断层”。 “模型的潜力已经在这里了(手举得很高),而人们想出来能做的产品还在这里(手放得很低)。” 这意味着,即便模型不再进步(当然,它们会进步),仅仅利用现有技术,就有海量的创新产品等待被创造。更何况: 成本在暴跌:像GPT-4o这样的模型,成本在急剧下降,而且这个趋势会持续下去。 开源模型将惊艳世人:Sam卖了个关子,但他透露OpenAI即将发布一款开源模型,其表现“会比你期望的好得多”,让人们在本地设备上运行强大模型成为可能。 模型推理能力的飞跃、API成本的下降、强大的开源模型……这些因素组合在一起,就像是在元素周期表上发现了一个全新的、没人用过的元素。这是创业公司的巨大机会。 “这绝对是一个绝佳的时期,去创办一家公司,利用这个全新的‘物种’。” 从ChatGPT到“Her”:AI的未来是你的终极伙伴 AI将走向何方?Sam的构想让人想起了电影《Her》。 他认为,今年推出的记忆(Memory)功能是他最喜欢的新功能,因为它指明了AI产品的未来方向: 你会拥有一个真正了解你的实体,它连接你所有的数据,并且会主动帮助你。它不再是你问一句、它答一句的被动工具,而是会7x24小时在后台运行,观察你的生活,知道什么时候该给你发条信息,什么时候该替你办件事。 这个“AI伙伴”将存在于你所有的设备、浏览器和你使用的每一项服务中,成为你生命中无处不在的助手。而这一切,将从记忆功能开始,逐步实现。 为了实现这个愿景,未来的AI必须是: 完全多模态的:它既能进行深度推理,也能实时生成视频,甚至在你需要时,即时为你编写一个全新的App。 与物理世界结合的:当AI拥有了视觉、语音和推理能力后,下一步自然就是进入机器人体内。Sam甚至开玩笑说,他非常期待有一天,当你订阅最高档的ChatGPT套餐时,会免费送你一个家用机器人。 发生在云端和本地的混合体:为了效率和成本,一部分计算会在本地设备上完成(OpenAI巴不得如此,因为他们的云端基础设施快要成为世界上最昂贵的了),而更强大的模型则会运行在云端。 而要打造这种“融化掉”的、无缝的交互体验,需要顶尖的设计。这也是为什么他们会与苹果公司的传奇设计师Jony Ive合作。“如果你要赌一个人能搞定下一代人机交互,他就是那个最显而易见的人选。” 给开拓者的忠告:如何在这场变革中胜出 面对如此迅猛的变革,许多创业者最大的疑问是:“我怎么才能不被OpenAI碾压?” Sam的回答很坦诚: 1. 关于“护城河”:别造我们的船,去发现你的新大陆 “我们不希望碾压你们。”Sam说,OpenAI会专注于把ChatGPT打造成最好的超级助理,但这只是冰山一角。他感到难过的是,太多人想做的只是“另一个版本的ChatGPT”。 “我们在这方面已经有很大的领先优势了。”他建议,创业者应该去寻找那些真正独特、没人做过的领域。 历史证明,最持久的公司,往往不是在做和别人一样的事情。这会给你时间去打磨产品,建立真正的壁垒。 OpenAI自己也曾长期没有“护城河”,唯一的优势就是“市场上只有我们这一个能用的产品”。直到后来,品牌、记忆功能、生态连接等才构成了真正的防御。 2. 关于招聘:雇佣“斜率”,而不是“截距” 如何招到最优秀的人?Sam的标准非常清晰,而且和他早年在YC时一脉相承: 关注核心特质:聪明、有驱动力、好奇、能自我激励、勤奋、能团队合作、方向一致。 看重实际成果,而非履历:他从不看重求职者来自谷歌还是上了哪所名校,而是直接去看“你做过最牛逼的事情是什么?” 雇佣“斜率”,而不是“截距”:他引用了YC联合创始人Paul Buchheit的名言,意思是要看一个人的成长潜力(斜率),而不是他当下的成就(Y轴截距)。一个年轻、斗志昂扬、能搞定事情的人,远比一个履历光鲜但已僵化的大公司高管更有价值。 3....

July 11, 2025 · 1 min · fisherdaddy

吴恩达 YC AI 创业学校演讲:在 AI 时代,速度就是一切

本文来自于吴恩达(Andrew Ng)在 YC 举办的 AI 创业学校的演讲。 如果你想在今天这个AI浪潮里做点什么,那你来对地方了。 我叫吴恩达(Andrew Ng),在我的风险工作室AI Fund,我们就像一个高产的“创业工厂”,平均每个月就会孵化一家新的创业公司。我们不只是旁观者,而是亲自下场,和创业者一起写代码、聊客户、定价格、设计功能。在无数次的实战中,我们摸爬滚打,积累了一套关于如何在这个瞬息万变的AI时代快速打造成功企业的经验。 今天,我想把这些滚烫的经验分享给你。核心就一个词:速度。 对于创业公司来说,执行速度几乎是成功的头号预测指标。而好消息是,新的人工智能技术,正在让创业的速度快到超乎想象。 最大的金矿在哪?别只盯着技术层 在讨论如何“快”之前,我们先得看清地图。很多人问我,AI时代的机会到底在哪里? 我们可以把AI想象成一个技术栈: 底层是英伟达这样的半导体公司。 往上是云计算平台。 再往上是OpenAI这样的基础模型公司。 最顶层,也是最重要的,是应用层。 尽管媒体和公众的目光大多聚焦在下面几层技术上,但从逻辑上讲,最大的机会必然在应用层。说白了,应用层得赚够钱,才能养活下面一整条产业链。所以,如果你想创业,别被那些光鲜的技术名词迷惑,真正的金矿在应用里。 最重要的技术趋势:Agentic AI正在改写规则 过去一年,AI领域最激动人心的变化是什么?在我看来,是**智能体(Agentic AI)**的崛起。 一年前,当我到处宣讲“AI Agent会是未来”时,很多人还觉得这概念很新鲜。没想到后来市场营销人员把“Agent”这个词当成了万能贴纸,到处乱用,反而让它有点失去了本来的意义。 但从技术角度看,Agentic AI的价值是实实在在的。 我们过去用大模型(LLM),就像让它写一篇文章,但有个苛刻的要求:不能打草稿,不能用退格键,必须从第一个字到最后一个字一气呵成。这太为难人了,对吧?AI也一样。尽管如此,LLM的表现已经很惊人了。 而Agentic工作流则完全不同。它允许AI像人一样思考和工作: 先列个大纲。 如果需要,可以上网搜索资料。 写出第一稿。 自己阅读、批判、修改第一稿。 循环往复,直到满意为止。 这个过程虽然慢一些,但最终产出的质量天差地别。在AI Fund的很多项目里,无论是处理复杂的合规文件、进行医疗诊断,还是分析法律文书,Agentic工作流都是从“不可行”到“可行”的关键。 这也为AI技术栈增加了一个新的层次:Agentic编排层(Agentic Orchestration Layer)。它帮助应用开发者协调对底层技术的多次调用,让构建强大的应用变得更加容易。 创业第一课:抛弃“宏大愿景”,拥抱“具体想法” 在AI Fund,我们只做一件事:执行具体的想法(Concrete Ideas)。 什么叫“具体”?就是你的想法足够清晰,清晰到工程师可以直接动手去实现。 模糊的想法:“用AI优化医疗资源。”——这太空泛了,十个工程师会做出十个完全不同的东西,根本快不起来。 具体的想法:“开发一个软件,让医院病人能在线预约核磁共振(MRI)的空闲时段,以提高设备使用率。”——不管这是不是个好主意,但它足够具体,工程师今天下午就能开工。 模糊的想法特别有欺骗性。你跟朋友说“我要用AI改变医疗”,大家都会夸你“想法真棒!”。但实际上,这种无法执行的想法一文不值。模糊几乎总是对的,但具体才有可能创造价值,也可能让你犯错。 犯错没关系,重要的是快速发现它。 要找到好的具体想法,通常需要你或者某个领域的专家“在想法的迷宫里徜徉”很长时间。当你对一个领域思考得足够久、和足够多的用户聊过天之后,你的**直觉(Gut Feeling)**会变得异常敏锐。这时候,做决策(比如该做哪个功能)靠直觉,往往比费力地收集数据要快得多,也准得多。 创业公司资源有限,不可能同时尝试十件事。最佳策略是: 选定一个具体的假设,全力以赴去验证它。 如果数据证明你错了,没关系,像U盘一样瞬间掉头(Pivot on the dime)。 以同样的决心,去追逐下一个具体的想法。 如果你发现每次和客户聊完天,都想彻底改变方向,那可能说明你对这个领域的了解还太少,需要找个更懂行的人来帮你找到那个更靠谱的“具体想法”。 创业第二课:把代码当成草稿,大胆地写,大胆地扔 打造产品的核心是一个循环:构建(Build)➡️ 获取反馈(Feedback)➡️ 迭代。 过去,这个循环的瓶颈在“构建”环节,因为写代码很慢。但现在,AI编程助手彻底改变了游戏规则。 我们写软件可以分为两种: 快速原型(Quick and Dirty Prototypes):为了测试一个想法。 生产级软件(Production Software):需要维护、稳定、安全的大型代码库。 在维护生产级代码时,AI能让我们提速30%-50%。但在构建快速原型时,我们不是快了50%,而是快了至少10倍!...

July 11, 2025 · 1 min · fisherdaddy

如何将 AI 应用于你的初创企业 • YC

本文来自 YC 的一个分享:How To Use AI In Your Startup。大语言模型的进步持续呈指数级增长。那么,作为创业者,您应该如何抓住这一机遇呢?YC 的合伙人讨论了如果您考虑转型为 AI 或将其整合到您的业务中,应该考虑哪些因素。 AI创业浪潮已至,你的公司应该“随波逐流”吗? 我们正经历一场新技术的冲击。人工智能,尤其是大语言模型,像当年的云计算和智能手机一样,正在悄悄改变很多行业。对创业者来说,这是机会,也是疑问:要不要把项目转向 AI?如果业务本身不是干这行的,是不是已经慢半拍? Y Combinator 的合伙人 Brad、Pete、Gustav 和 Nicola 和上千位创始人聊过,他们发现:技术日新月异,可创业的底层逻辑没变。下面是他们在 AI 时代依旧管用的几条心得。 “转型 AI”是个伪命题?AI 早成了默认配置 先说最常见的问题:我的公司要不要改做 AI? 答案听上去矛盾:别因为 AI 很火就仓促改行,但 几乎所有业务都值得用上大语言模型。 关键在视角。别再问“要不要做一家 AI 公司”,这问题已经过时。 今天的 AI 就像 2014 年的云。 那会儿,没人会纠结“要不要用云”,用就对了。同理,现在不把 AI 用进产品或流程里,反而显得奇怪。 拿一家 YC 投资的企业举例:他们的主营业务是管理业主协会(HOA)。听起来一点也不高科技,可他们在后台用大语言模型自动化了大批流程,效率飙升,却从不自称“AI 公司”。真正让他们拉开差距的,是那些悄悄运转的模型,而不是标签。 所以,别只想着改名字、加两个 API,就想摆脱初创公司的生死线。重点是:AI 能不能帮你给客户创造看得见的价值。 历史不会重复,但总押韵:AI 的“iPhone 时刻” 没赶上过上一波技术浪潮的人,很难体会当下的节奏。 2007 年,史蒂夫·乔布斯发布初代 iPhone。那时没人想得到几年后会发生什么。App Store 一年后才上线,重要权限又等了一年。可接下来的五年,足以催生一代移动互联网巨头。 云计算也类似。Workday 的创始人曾在 PeopleSoft 工作,2000 年前后他断定:迟早有人用云把企业软件重做一遍,而且会做得更好,于是就有了 Workday。 现在轮到 AI。用 AI 原生思路把现有软件重写一次,本身就是巨大机会。...

July 9, 2025 · 1 min · fisherdaddy

马斯克 YC AI 创业学校演讲精华:超级智能与人来文明的未来

埃隆·马斯克在 YC 创业学校的这个分享特别值得一看,内容涵盖了他从早期互联网创业到领导 SpaceX、Tesla 和 xAI 的历程,以及他对AI 和第一性原理思维的深刻见解。看完整个视频你会 get 到他做事情的出发点——“做对人类真正有用的事”。另外,视频中他也提到 Grok 3.5 的进展,以及 XAI 拥有的 GPU 的情况。最后,他对人类文明未来的深思特别的有意思,其实他自己也没太想明白,但先干了再说。 早年创业 看过马斯克自传的人对他早期的创业故事应该都非常熟悉了,他在这里分享这段经历主要的目的是说他当时做事的核心动机:“尽可能地对人类有用”。无论是早期创办 Zip2,还是后来投身于 SpaceX 和 Tesla,他的目标都是解决实际问题、创造有价值的产品,而非追求名利。 1995 年,他放弃博士学位,拉着弟弟做了 Zip2。没钱就睡工位、去基督教青年会冲凉。 Zip2 以 3 亿美元卖给康柏,马斯克分到约 2000 万美元。很快,这笔钱几乎又全部押在 X.com(后并入 PayPal)——“我要面向终端用户,再也不想看传统媒体脸色”。 随后是 SpaceX。他一开始并不是看中了商业火箭潜力,而是 NASA 居然没有登陆火星时间表。他认为自己干商业火箭公司的成功率估计不到一成,他甚至跑去俄罗斯问能否买两枚退役 ICBM。SpaceX 前三次发射全败了,第四次发射如果失败,公司就破产了,但幸运女神眷顾,第四次发射成功了。2008 年应该是对老马极其艰难的一年,SpaceX 第三次发射失败,Tesla 的融资也失败了。最终,在 2008 年圣诞节前夕,NASA 的一份合同和 Tesla 在最后一刻完成的融资拯救了公司。 第一性原理 马斯克最爱挂在嘴边的“第一性原理”,其实就是把一件事拆到物理与成本底座,再倒推出真正可行方案。 火箭:把整枚火箭剖成钢材、铝材、燃料等原料,发现账面只占成品价 1%~2%,剩下都是传统供应链“惯例”。 算力集群:xAI 需要十万片 H100,他没等 18–24 个月的常规交付,而是 6 个月内盘下一座废厂,租用了发电机和美国约四分之一的移动冷却设备,并结合 Tesla Megapacks 解决了电力波动问题,成功部署了 10 万个 H100 GPU。 截至目前,xAI 共握约 30 万张 GPU:15 万 H100、5 万 H200、3 万 GB200,再加一座数据中心准备上线 11 万张 GB200。至于 Grok 3....

June 22, 2025 · 1 min · fisherdaddy

生成式引擎优化(GEO)如何重写搜索规则 • A16Z

本文是 A16Z(美国一家顶级风险投资公司)官方发布的一篇文章,主要探讨了随着大型语言模型 (LLM) 成为新的信息入口,传统搜索引擎优化 (SEO) 如何演变为生成式引擎优化 (GEO) 这一新范式。文章分析了这一转变的根本原因、对品牌营销策略的影响,以及其中蕴含的巨大商业机遇。 搜索范式正在转变:随着 Apple 等公司将 Perplexity 和 Claude 等 AI 原生搜索引擎整合到其产品中,传统的、以 Google 为主导的基于链接和排名的搜索时代正走向终结。一个以语言模型为核心的新时代——生成式引擎优化 (GEO) 正在兴起。 优化的核心目标改变:SEO 的目标是在搜索结果页面上获得高排名。而 GEO 的核心目标是让品牌或内容被 AI 模型直接引用,出现在生成的答案中。衡量标准从“点击率”转变为“引用率”。 品牌策略的重塑:品牌不仅要关注在公众心目中的形象,更要关注在 AI 模型中的“形象”。如何被 AI 模型理解、记忆和引用,已成为新的核心竞争力。 GEO 蕴含巨大商业潜力:与分散的 SEO 工具市场不同,GEO 有可能诞生平台级的、更集中的商业模式。成功的 GEO 公司不仅能提供监测分析,更能通过自有模型和技术,主动影响和塑造 AI 的输出,最终成为品牌与 AI 交互的核心渠道和自动化营销平台。 关键细节 从 SEO 到 GEO 的具体变化 基础不同:传统 SEO 建立在“链接”之上,而 GEO 建立在“语言”之上。 用户行为改变:AI 搜索的查询更长(平均 23 个词 vs 传统 4 个词),交互更深入(平均 6 分钟)。 内容优化方式:GEO 要求内容结构清晰、意义密集,而非简单的关键词堆砌。使用项目符号或“总结”等明确的格式有助于 AI 模型提取信息。 商业模式与激励机制的差异 传统搜索引擎主要通过广告变现。而许多 LLM 服务采用订阅制,这使得它们在引用第三方内容时,更看重内容能否提升用户体验和产品价值,而非仅仅为了流量。 新兴的 GEO 工具与实践 Profound、Goodie 等新平台已出现,帮助品牌分析其在 AI 回复中的形象和声量。 Ahrefs 和 Semrush 等传统 SEO 巨头也已推出新工具,以适应 GEO 时代,追踪品牌在 AI 生成内容中的提及情况。 案例:Canada Goose 利用 GEO 工具分析 LLM 是否会自发提及该品牌,以此衡量其在 AI 时代的“无提示品牌知名度”。 GEO 的未来机遇 GEO 目前仍处于早期实验阶段,规则尚在不断变化中。 文章预测,成功的 GEO 平台将超越分析工具的范畴,它们会拥有自己的微调模型,整合点击流等数据,不仅观察 AI 的行为,更能主动塑造其行为,最终演变为一个自动化、跨渠道的性能营销系统。 作者将 GEO 视为继 Google Adwords 和 Facebook 广告之后,下一个重要的营销风口和竞争高地。 原文 我们所熟知的搜索时代行将结束,而营销人员们对此感觉还不错。嗯,差不多吧。...

June 20, 2025 · 2 min · fisherdaddy

DeepSeek-R1-0528 发布:推理与理解能力显著增强,性能逼近顶尖模型

昨天(2025.5.28)DeepSeek 在官方交流群中直接发布消息,宣布 R1 模型已完成小版本试升级,并将模型权重开源到 HugggingFace,直到今晚才正式发布新闻稿,并更新模型卡相关内容。 本次模型更新内容 当前版本是 DeepSeek-R1-0528。在最新的更新中,相比上个版本主要更新有: 1️⃣ 通过利用增加的计算资源并在后训练阶段引入算法优化机制,显著提升了模型的推理和理解能力。这款模型在数学、编程和通用逻辑等多种基准测试中展现了卓越的性能。它的整体表现已经接近顶尖模型,例如 O3 和 Gemini 2.5 Pro。 2️⃣ 与之前的版本相比,升级后的模型在处理复杂推理任务时有了显著进步。比如在 AIME 2025 测试中,模型的准确率从之前版本的 70% 提升到了当前版本的 87.5%。这一提升得益于模型在推理过程中“思考”得更深入了:在 AIME 测试集上,之前的模型平均每个问题花费 12K tokens 进行思考,而新版本平均每个问题会花费 23K tokens。 2️⃣ 降低了生成“幻觉”(即不真实信息)的概率 3️⃣ 增强了对函数调用的支持 4️⃣ 优化了“写代码”(vibe coding)的体验。 5️⃣ 它的整体性能现在接近 O3 和 Gemini 2.5 Pro 等领先模型。 6️⃣ 再次基于 Qwen 模型蒸馏出了更强模型,将 DeepSeek-R1-0528 生成的思维链(chain-of-thought)提取出来,用于进一步训练 Qwen3 8B Base 模型,从而得到了 DeepSeek-R1-0528-Qwen3-8B。这款模型在 AIME 2024 上取得了开源模型的最佳性能(SOTA),比 Qwen3 8B 高出 10.0%,并达到了 Qwen3-235B-thinking 的水平。DeepSeek-R1-0528-Qwen3-8B 的模型架构与 Qwen3-8B 相同,但它使用了与 DeepSeek-R1-0528 相同的分词器配置。这款模型可以按照运行 Qwen3-8B 的方法在本地运行。...

May 29, 2025 · 4 min · fisherdaddy

Google Veo3 Prompt 优秀示例

Google Veo3 一经发布就引起了广泛关注,其强大的视频生成能力让人惊叹。Veo 3 是谷歌最新的视频生成模型,它最大的特点是可生成带有音频的视频片段(例如街头的汽车噪音、鸟鸣、人物对话等),大幅超越当前所有的视频生成模型。正如 Google DeepMind 首席执行官 Demis Hassabis 所说:我们正在“走出视频生成的无声时代”。 Veo 3 在 Google I/O 2025 上首次亮相,一开始本来仅仅 Ultra 会员(每月 249 刀)才能在 Flow(Google 的 AI 视频制作平台)上使用,但后来 Google 宣布向所有 Pro会员(每月 19 刀)也开放了,终于可以体验到这个强大的模型了。 试用了一段时间发现但受限于个人水平有限,并不能很好的发挥出这个模型的能力,所以这里整理了一些 X 上一些优秀的视频生成的 Prompt 示例,供大家学习。 20岁金发女孩 Prompt 原文:20 year old blonde girl filming a tiktok video, saying"Oh my god this is the most insane app i’ve ever seen". She is in her room in a hoodie. 译文:20岁金发女孩,正在拍摄一条TikTok视频,说着“我的天啊,这是我见过最疯狂的应用程序了”。她在自己的房间里,穿着一件连帽衫。 原文:20 year old blonde girl filming a tiktok video, saying"Oh my god this is the most insane app i’ve ever seen"....

May 28, 2025 · 12 min · fisherdaddy

Fiverr CEO Micha Kaufman 谈 AI 对未来工作的冲击

本文是 Fiverr CEO Micha Kaufman 在4 月份发给员工的内部信。信中以极致坦诚的态度发出警示,指出人工智能(AI)将对各行各业的职位构成普遍威胁,并敦促员工必须迅速觉醒,通过学习和掌握 AI 工具、提升工作效率和主动性,成为领域内的卓越人才,以应对即将到来的职业变革并确保个人与公司的未来发展。 立场与动机: Micha 信奉“极致坦诚”,认为这是出于对同事的关怀,旨在帮助他们理解、成长并取得成功。 核心信息是一个“令人不悦的真相”:人工智能(AI)正在冲击所有人的工作,包括作者本人,这是一个“警钟”。 AI 影响的普遍性与深刻性: 影响范围广: 无论职业是程序员、设计师、产品经理、数据科学家、律师、客户支持代表、销售人员还是财务人员,AI 都将带来冲击。 工作性质变革: 曾经的“简单任务”将不复存在。 曾经的“困难任务”将成为新的简单任务。 曾经的“不可能完成的任务”将成为新的难题。 紧迫性: 如果不能在数月内成为所在领域的卓越人才或大师,将面临职业转变的需求。这关乎在行业内保住职业的能力,而非 Fiverr 上的零工。 后果: 不能迅速觉醒并理解新现实的人将“注定要完蛋”。 应对策略与行动方案: 学习、研究并掌握 AI 解决方案: 熟悉并精通所在领域的最新 AI 工具,找到能赋予“超能力”(单位时间内以更高交付质量产出更多成果)的方案。 示例: 程序员:代码工具如 Cursor。 客户支持:工单处理工具如 Intercom Fin, SentiSum。 律师:合同处理工具如 Lexis+ AI, Legora。 向团队内专家学习: 找到团队中最了解 AI 进展的人,向他们学习。 提升时间利用效率: 摒弃 2024 年的常规工作方式,必须做得更多、更快、更高效。 成为一名“提示工程师” (Prompt Engineer): Google 已过时,大型语言模型(LLM)和生成式人工智能(GenAI)是新基础,必须像专家一样使用它们。 推动组织效率提升: 主动参与利用 AI 工具和技术提高组织效率,在学会利用现有资源做得更多之前,不应盲目招聘。 理解并贡献公司战略: 深刻理解公司战略,主动提出想法帮助公司实现目标,不要等待被动邀请。 主动创造学习与成长机会: 不要等待外部提供机会,要自己创造。作者承诺帮助那些愿意自我提升的人。 呼吁与展望: 坦诚沟通: 如果员工不认同或认为作者在危言耸听,可以选择忽略信息。 共同应对: 作者希望那些认同其观点的人能加入讨论,共同规划公司和个人的未来。 未来展望: 公司本身“卓越”,拥有“光明的前途”,但这需要大家共同努力,过程将是艰难和高要求的,但最终值得。 后续行动: 已请 Shelly 在接下来几周内空出日程,以便与希望讨论未来的员工进行面谈。 核心信息: “这条信息值得深思”,需要“醒悟过来”。 原文 嘿,团队,...

May 7, 2025 · 1 min · fisherdaddy

Anthropic 经济指数: 人工智能对软件开发的影响

本文由 Anthropic 发布,聚焦于 Claude 在编码相关任务中的应用情况。通过对 Claude.ai 和专用编码工具 Claude Code 上 500,000 次交互的分析,揭示了 AI 在编码实践中的新兴模式、应用领域及采纳趋势。 主要观点 AI 驱动编码自动化趋势显著:特别是在专用的 AI 编码工具(如 Claude Code)中,AI 更倾向于直接执行任务(自动化),而非仅仅辅助人类(增强)。 用户界面开发是 AI 编码的热点:开发者普遍使用 AI 构建面向用户的应用程序,如网页和移动应用的界面,这可能导致相关工作岗位面临更早的 AI 冲击。 初创企业在 AI 编码工具采纳上领先:与大型传统企业相比,初创企业更积极地采用尖端的 AI 编码工具,显示出更强的敏捷性。 软件开发领域的 AI 应用或为其他行业的先导指标:编码作为 AI 应用相对成熟的领域,其发展模式可能为预测 AI 在其他职业领域的影响提供参考。 关键细节 AI 使用模式:自动化与增强 在 Claude Code 上,79% 的对话被识别为“自动化”(AI 直接执行任务),而“增强”(AI 协作并提升人类能力)占 21%。相比之下,Claude.ai 的自动化比例为 49%。 “反馈循环”(Feedback Loop)模式(AI 自主完成任务,但需人类验证和纠错)在 Claude Code 上更为普遍(占交互的 35.8%),远高于 Claude.ai(21.3%)。 “指令式”(Directive)对话(AI 以最少用户交互完成任务)在 Claude Code 上也更高(43.8% vs 27.5%)。 所有增强模式(包括“学习”)在 Claude Code 上的比例均低于 Claude....

May 6, 2025 · 3 min · fisherdaddy