Stay hungry, Stay foolish

👋 Welcome to fisherdaddy’s blog!

    1. 精心翻译的优质博客内容
    1. 有趣的技术分享
    1. 博主的个人认知分享

📚 博客内容:

    1. 翻译: 精选国外优质博客文章,涵盖编程、人工智能、产品、运营等多个领域。
    1. 分享: 探索各种有趣技术,从编程语言到软件开发,从云计算到人工智能。
    1. 认知: 结合自身经验和思考,分享对科技、生活、学习等方面的见解。

我是如何借助 AI 翻译英文文章的

自从今年二月份开始搭建自己的博客以来,我在 AI 的帮助下翻译了 100 多篇英文文章,这里给大家分享一下我的主要翻译 pipeline。在分享之前,我想先感谢一下大家都熟悉的博主——宝玉,他在推特上分享了大量 AI 相关的资讯,特别是他的三步翻译法,对我帮助很大。下面我来讲一讲我的翻译 pipeline。 第一步:获取文章正文 html 刚开始翻译英文文章的时候,我获取原文的方式很简单粗暴,就是直接复制原网页上的内容,但缺点也很明显,复制过来的文章丢失了排版和格式,如果遇到包含图片的文章就更麻烦了,还需要把图片一个一个存下来,并插入到复制内容的原位置,工作量比较大也复杂。后来,我解决这个问题的方案也很简单,在 chrome web store 上找一个能支持自动提取网页正文 html 的插件,因为html 里包含了各种标签,所以可以把版式和图片保留。这种插件很多大家可以自行搜索,也可以使用 FisherAI 插件。 这里我也简单介绍一下 FisherAI 插件,说明一下我这不是做广告啊,因为没什么收费内容,当初写它的目的也是为了方便我自己使用而已,且它的源代码也开源了。当时写这个插件,主要源于我对文章有自动总结和摘要的需求,看了市面上一推的类似插件,没有太满足需求的,我想要的是不仅可以自动摘要,也可以聊天,也要支持工具调用,最重要的是要支持自定义使用的模型和 api key。至少提取网页正文 html 的功能是正好需求,就顺手加到了这个插件的功能里。 第二步:使用三步翻译法进行翻译 宝玉老师的三步翻译也是后来迭代出来的,一开始是两步翻译,也就是直译和意译,后面中间又多了一步:反思,所谓的三步就是:直译–>反思–>意译。我基于这三步翻译法创建了一个 ChatGPT 插件: TransLingo,它可以方便我调试 prompt 以及验证翻译结果。对于短的文章,用这个插件翻译很方便,但遇到长文章就比较麻烦了,需要在插件的聊天窗口里点很多次继续,才能翻译完成,有的时候还由于文章太长被截断或失败的情况。对于长文章,有一个比较方便的解决方案,就是使用 Google AI Studio,因为 gemini 从一开始就支持 100 万 + token 上下文,特别适合长文翻译,且价格也很便宜,我最常用的模型就是 gemini-1.5-flash,这不今天 google 又放出来了 gemini-2-flash-exp,主打多模态。以下也分享以下我在用的三步翻译 prompt,大家可以自行取用。 你是一位精通简体中文的专业翻译,尤其擅长将专业学术论文翻译成浅显易懂的科普文章。请你帮我将以下英文段落翻译成中文,风格与中文科普读物相似。 规则: - 翻译时要准确传达原文的事实和背景。 - 即使意译也要保留原始段落格式,以及保留术语,例如 FLAC,JPEG 等。保留公司缩写,例如 Microsoft, Amazon, OpenAI 等。 - 人名不翻译 - 同时要保留引用的论文,例如 [20] 这样的引用。 - 对于 Figure 和 Table,翻译的同时保留原有格式,例如:“Figure 1: ”翻译为“图 1: ”,“Table 1: ”翻译为:“表 1: ”。 - 全角括号换成半角括号,并在左括号前面加半角空格,右括号后面加半角空格。 - 输出格式为 Markdown 格式 - 在翻译专业术语时,第一次出现时要在括号里面写上英文原文,例如:“生成式 AI (Generative AI)”,之后就可以只写中文了。 - 遇到用figure包裹的img标签,只需保留img的src属性,其他属性如alt/loading/width/height/srcset等需要忽略掉。 - 以下是常见的 AI 相关术语词汇对应表(English -> 中文): * Transformer -> Transformer * Token -> Token * LLM/Large Language Model -> 大语言模型 * Zero-shot -> 零样本 * Few-shot -> 少样本 * AI Agent -> AI 智能体 * AGI -> 通用人工智能 - 如果完成了原文的意译,当用户输入“继续”时,请回答“本篇已翻译完成”。 策略: 分三步进行翻译工作,并打印每步的结果: 1....

December 12, 2024 · 1 min · fisherdaddy

史蒂夫·乔布斯:一位改变世界的创业者 • Marc Andreessen

Marc Andreessen 是 Netscape 和 Andreessen Horowitz 的联合创始人。本文节选自他为 Brent Schlender 2016 年创作的《成为史蒂夫·乔布斯》(Becoming Steve Jobs)一书所写的序言。 无数创业者来到我们 Andreessen Horowitz 风险投资公司的会议室寻求融资,而这间会议室是以史蒂夫·乔布斯 (Steve Jobs) 命名的。 每年都有数千名创业者来到这里,但其中绝大多数人都从未见过乔布斯本人,甚至很多都是在他去世后才进入科技行业的。 然而,令人惊奇的是,如果问他们谁是心中的偶像,谁是他们学习如何创办公司、如何改变世界的榜样,乔布斯总是高居榜首,远远领先于其他人。 我看到乔布斯的影响渗透到他们所做的一切之中:他们的行为举止,他们推销时的技巧和魅力,他们演示文稿的设计,甚至连他们使用的词汇都受到影响。“美丽”(beautiful)一词,在乔布斯时代之前,很少出现在创业公司的语境中,而现在,几乎所有产品都必须做到“精美绝伦”。每个产品都必须从一开始就惊艳四座,完美地履行其承诺,给用户带来惊喜和愉悦。 简而言之,这就是乔布斯留下的遗产。他在苹果公司取得的成就,以及苹果公司本身的存在,都为整个科技界,乃至其他行业树立了新的标杆,并将影响深远,绵延数十年。 乔布斯之前的时代 在 1997 年乔布斯回归苹果,苹果最终称霸之前,微软在科技行业的地位与苹果今日的地位相似。当时,人们普遍认为微软产品的第一个版本总是粗糙不堪的,但大家也知道他们会不断改进。第二个版本也不会好多少,只有到第三个版本,产品才会真正成熟,即使不完美,至少也能让人接受。 当时,商业战略往往被认为比产品战略更重要。只要有足够的营销宣传,或者使用足够的“FUD”(Fear, Uncertainty, and Doubt,恐惧、不确定和怀疑)策略——微软和之前的 IBM 一样,常以预先发布尚未成型的产品来扰乱市场——即使产品本身存在缺陷,也能通过虚张声势取得市场成功。 20 世纪 90 年代硅谷的许多问题,以及 2000 年互联网泡沫破裂的原因之一,就是许多公司盲目跟风,过早进入市场,推出质量低劣的产品。互联网泡沫时期,许多商业软件之所以被人们使用,更多是因为害怕落后于竞争对手。到了 2000 年和 2001 年,人们终于发现,“这些产品简直是垃圾!” 许多公司因此一夜之间倒闭。 而乔布斯从来不相信商业战略能凌驾于产品之上。他坚信产品必须出色,否则就绝不发布。 iPhone 时代的到来 对于 21 世纪初成长于科技行业的年轻人来说,iPhone无疑是那个时代的代表性产品。它重新定义了优秀科技产品应有的标准,并在乔布斯的推动下,将这一标准提升到了前所未有的高度。 iPhone 于 2007 年发布,但在此之前苹果公司付出了多年的努力。1999 年,苹果注册了域名 iphone.org;2003 年,苹果开始研发触摸屏的硬件和软件;2004 年,秘密研发团队将研发重点从平板电脑转向了 iPhone。 苹果完全可以在研发过程中更早地推出手机或平板电脑,但乔布斯坚持等待,直到产品达到完美的标准。 在 iPhone 出现之前,我尝试过各种各样的手机,比如 Treo,三星和 LG 的各种型号。我的抽屉里塞满了这些手机,它们运行着 Java BREW (Binary Runtime Environment for Wireless),拥有数不清的按键,以及厚厚的使用说明书,翻译成七种语言。它们颜色各异,图形也粗糙,触摸屏反应迟钝,键盘也经常出故障。即使是最好的产品,也运行缓慢,反应迟钝。一年之中会有几十款新机型上市,却没有任何实质性的进步。...

December 11, 2024 · 1 min · fisherdaddy

如何成为埃隆·马斯克 • Justine Musk

本篇文章是埃隆·马斯克的前妻贾斯廷·马斯克(Justine Musk)对于2015年Quora讨论“我如何才能像比尔·盖茨、史蒂夫·乔布斯、埃隆·马斯克、理查德·布兰森一样伟大?”的回答。 极端的成功源自于极端的个性,而这通常需要为许多其他东西付出代价。极端的成功与我们通常所理解的“成功”有所不同。你不必像理查德或埃隆那样,也能拥有富裕和成功的生活,享有美好的生活方式。这样,你的幸福感可能会更强。可是,如果你追求极端的成功,你必须忠于自己,这就意味着幸福有时不是最重要的。这样的成功者往往是怪胎、与众不同的人,他们以不同寻常的方式感知世界。通过与世界抗争,他们发展出了一套生存的策略,随着年龄的增长,他们将这些策略运用到更多的领域,最终为自己创造了独特的优势。他们的思维方式与常人不同,从不同的角度看问题,解锁新的思路和创意。别人常常认为他们有些疯狂。 保持痴迷。 保持痴迷。 保持痴迷。 如果你没有什么特别痴迷的事,那么请停下你正在做的事情,去找到那个能让你痴迷的目标。拥有一定的自尊心会有所帮助,但你必须为更大的目标而服务,才能激励那些帮助你的人(而且,别误会,你一定需要他们)。那个“更大的目标”可以防止你在别人围绕你转时迷失方向,特别是当人们对你和你的事物赞不绝口,而你知道这并不完全真实时。不要因为“想要伟大”而去追求某件事,而是因为它深深吸引你,追求本身让你感到兴奋和驱动。极端的人往往结合了聪明才智和疯狂的工作热情,所以如果工作本身不能激励你,你可能会在途中精疲力尽,或者被竞争者打败。 跟随你的痴迷,直到找到一个真正具有挑战性的问题——一个影响尽可能多人的问题,这个问题让你誓言一定要解决,哪怕为此付出一切。这可能需要几年时间,因为你需要去探索不同的领域,收集知识,最终将它们串联成完整的解决方案。 如果你能拥有超人的精力和耐力,那将更有利。如果你没有天生的强大体质,那么请务必锻炼身体,保持最佳状态。你会经历时差、精神疲劳、孤独、无聊的会议、家庭矛盾、生活的低谷、与伴侣关系的疏远、无休止的压力等挑战。保持身体健康,才能保持头脑的敏锐。 学会应对常人无法承受的压力。 不要盲目跟随别人走过的路,不要试图模仿你的偶像。没有所谓的“下一步”。极端成功的道路与常规成功不同;别人走过的路,不一定适合你。成功的人有自己独特的视角,他们利用自己的优势开辟道路。他们非常不拘一格,其中一个原因是,他们无法适应传统企业文化。他们可能有阅读障碍、自闭症或多动症(ADHD),他们像方钉子被塞进了圆形的孔里,激怒了许多人,挑战现状,却从不畏惧失败。 他们不害怕失败,或许害怕,但仍然勇敢前行。当他们经历失败时,他们能将其转化为成长的动力,哪怕是公众面前的巨大失败。 他们更可能去读关于历史伟人传记的书籍,例如亚历山大大帝或凯瑟琳大帝等人的故事,而不是浪费时间在互联网上浏览无关的信息。 我本可以继续讲下去,但我相信你已经明白了我想说的。祝你好运,也希望你在必要时能找到力量。

December 10, 2024 · 1 min · fisherdaddy

彼得·蒂尔的九大经验教训 • Joe Lonsdale

Joe Lonsdale 是 Palantir、Addepar、奥斯汀大学 (University of Austin) 和 8VC 的联合创始人。本文最初发表于 2010 年 8vc.com 网站。published at 8vc.com in 2010. 本文总结了 Joe Lonsdale 多年来与 Palantir 董事长兼创始人 Peter Thiel 合作的经验教训。这些经验非常值得学习,它们将改变你的思考方式。 九大经验教训: 1. 将推理分解成多个部分,明确找出最重要的因素。 如果没有一个单一的原因能让你去做某事,你就要仔细考虑这件事是否重要。我们常常想做某事,并给出多个理由,却很少认真思考这些理由是否成立。如果你找不到一个足以单独支撑你行动的理由,就要警惕自己是否缺乏足够的理性思考。 2. 专注于一件事:专注能带来递增的回报。 从微观角度来看,额外花一小时专注于当前项目,比花一小时做新的事情,或者更糟糕的是,在 12 件新事情上每件花 5 分钟,回报要高得多。在开始新的事情之前,你必须权衡机会成本和现有工作的收益。不要用“互补”来为你想做的事情找借口! 从宏观角度来看,理解投入的努力会产生递增的回报,这对考虑新的市场领域非常有用。这种递增的回报意味着将资源从现有项目转移到新项目的机会成本很高。除非新领域极其有价值,否则任何能提升现有项目效益的事情都更有价值。 3. 招聘时,要高度重视智力。如同专注一样,智力也能带来递增的回报。 和专注一样,智力也具有递增的回报——最聪明的人的生产力可能是其他人(即使那些只是略逊一筹的人)的十倍甚至更多。招聘的关键在于重视潜在能力而非现有技能,而潜在能力主要取决于智力而非培训。 4. 追求完美。 如果你正在设计客户会使用的东西,或者代表公司面向公众的东西,除非它完美无瑕、卓越非凡,否则它就不够好。 特别是在软件领域,由于网络效应和转换成本,很多情况下都是赢家通吃。成为赢家意味着你必须达到 99.99 百分位。顶尖的赢家几乎拿走了一切,其他人只分到很少一部分——所以达到 99.99 百分位比达到 98 百分位要好上一个到两个数量级。如果已经是凌晨一点,你已经做出了一个非常好的产品,那么花几个小时把它打磨到完美也是值得的。 5. 利用细微的细节作为指标,去洞察更大的真相——并且当你发现这些指标指向你不喜欢的结论时也要保持警惕。 虽然这种方法存在风险——指标并非总是正确的——但你往往能从细微的指标中获得很多有益的见解。一个人的能力,一个人的工作努力程度,或者几个聪明人的看法,都可能在决定是否与某个团队合作之前,告诉你很多信息。无论这些指标是否与你的偏见相符,都要保持开放的心态去接纳它们。事实上,当它们与你的偏见相悖时,你更应该重视它们。这些指标可以反映各种情况,例如合同的重要性、软件在不同场景下的有效性、关键决策者的意见和偏见等等。很少有人能像他们应该做的那样密切关注并认真对待这些指标。 6. 不要浪费时间空谈你打算思考什么;应该立即着手处理。 思维上的懒惰很容易悄悄地影响你。如果你只是坐在那里讨论你计划以后解决的问题,你很可能效率低下。同样,在“Getting Things Done”(GTD,高效能人士的七个习惯)方法中,你不会推迟那些只需几分钟就能完成的任务。在很多情况下,你可以在几分钟内概述并解决,或者至少理清你遇到的任何决策或问题。 7. 花时间倾听那些和你意见相左的聪明人的看法。 这并不容易。随着时间的推移,任何公司都会发现某些方法和偏见非常有效,而公司越成功,它就越会形成自己独特的思维模式。我们无法在没有这些方法和原则的情况下取得成功,也不能不断地向每个人解释为什么这些方法是正确的。 一种自豪感会自然而然地围绕成功的模式产生,但这种思维模式不能固化为教条。因此,我们必须运用判断力去寻找那些与我们意见相左的聪明人——甚至是那些采取不同方法的聪明人——并虚心学习。 尽管 Peter 的观点非常独特,并且与主流观点相悖,但他始终坚持这样做,这让他非常高效。 8. 对任何外部盟友保持怀疑态度,不要信任 Palantir 之外的任何人的执行能力。...

December 9, 2024 · 1 min · fisherdaddy

未来的挑战 • Peter Thiel

Peter Thiel是PayPal和Palantir的联合创始人。本文节选自他2014年出版的著作《从零到一》(Zero to One)。 我面试时喜欢问一个问题:“你认为哪个重要的真理鲜为人知?” 这个问题看似简单,实则不然。从知识层面来看,它很难,因为学校教育的内容通常是共识。从心理层面来看,它也很难,因为回答者必须表达自己知道会不受欢迎的观点。卓越的思想难得,而勇气更是比天才更稀缺。 我经常听到以下几种答案: “我们的教育体系已陷入困境,亟需改革。” “美国是例外。” “上帝不存在。” 这些都是糟糕的答案。前两者或许正确,但很多人已经认同了。第三个答案只是在一个老生常谈的辩论中选边站。好的答案通常是这种形式:“大多数人相信 *x*,但事实恰恰相反。” 我会在本章稍后给出我的答案。 这个看似悖论的问题与未来有何关联?从最简单的角度看,未来就是所有尚未发生的时间。但未来之所以独特而重要,并非因为它尚未发生,而是因为它将是一个世界面貌与今天截然不同的时代。如果我们的社会在未来一百年里毫无变化,那么未来就一百多年以后;如果未来十年发生剧变,那么未来就近在咫尺。没人能准确预测未来,但有两点是确定的:未来必将不同,且必然根植于现实世界。大多数对悖论问题的回答都是从不同角度看待现在;好的答案则尽可能接近于对未来的洞察。 从零到一:进步的未来 展望未来,我们渴望进步。进步可以分为两种形式:横向或外延式进步,意味着复制已有的成功模式——从1到 *n*;纵向或内涵式进步,意味着创造全新的事物——从0到1。横向进步容易想象,因为我们已经了解它的模式;纵向进步则更难想象,因为它需要开创前所未有的先河。例如,制造一百台打字机是横向进步;而将打字机改进成文字处理器则是纵向进步。 宏观层面上,横向进步的代名词是 *全球化*——将成功的模式复制到世界各地。中国是全球化的典型案例,其20年计划目标是达到与今天的美国相当的水平。中国一直效仿发达国家行之有效的一切:19世纪的铁路,20世纪的空调,甚至整个城市。过程中可能略有取舍——例如直接采用无线技术而跳过固定电话阶段——但其本质是复制。 而纵向进步,即从0到1的进步,其代名词是 *技术*。近几十年信息技术的飞速发展,使硅谷成为“技术”的代名词。但技术并不局限于计算机。广义而言,任何改进的做事方法都属于技术。 由于全球化和技术是两种不同的进步模式,因此可能同时存在、单独存在或都不存在。例如,1815年至1914年是技术和全球化都快速发展的时期;第一次世界大战到1971年基辛格访华期间,技术发展迅速,但全球化进展有限;1971年以来,全球化快速发展,但技术发展相对滞后,主要集中在IT领域。 这个全球化时代让人很容易认为未来将走向趋同和雷同。我们日常语言也暗示着我们相信某种技术上的历史终结:世界被分为发达国家和发展中国家,似乎发达国家已经达到了极限,发展中国家只需要追赶即可。 但我认为并非如此。我对那个悖论问题的答案是:大多数人认为未来的世界将由全球化定义,但事实是技术更为重要。如果没有技术变革,如果中国未来二十年能源产量翻一番,那么空气污染也将翻一番;如果印度数亿家庭都按照美国人的生活方式生活——只使用现有工具——结果将是环境灾难。在资源有限的世界中,没有新技术的全球化是不可持续的。 新技术并非历史的必然产物。我们的祖先生活在静态的零和社会中,成功意味着从他人手中夺取资源。他们很少创造新的财富来源,长期来看,他们无法创造足够的财富来改善普通人的生活。然而,在从原始农业到中世纪风车和16世纪星盘的数千年缓慢发展之后,现代世界从18世纪60年代蒸汽机出现到大约1970年,突然迎来了持续的技术进步。因此,我们继承了一个比以往任何一代人都无法想象的更加富裕的社会。 除了我们父母和祖父母那一代:在20世纪60年代后期,他们期待这种进步会持续下去。他们憧憬着每周工作四天,能源廉价到可以随意使用,以及在月球上度假。但这些并没有实现。分散我们注意力、让我们忽略周围环境的智能手机,也让我们忽略了周围环境的陈旧:自20世纪中期以来,只有计算机和通信技术得到了显著的改善。这并不意味着我们父母对美好未来的憧憬是错误的——他们只是错误地认为这是必然的。今天,我们的挑战是想象并创造新的技术,让21世纪比20世纪更加和平繁荣。 创业思维 新技术往往源于初创企业 (startup)。从美国的开国元勋到英国皇家学会,再到仙童半导体的“八叛逆”,那些由共同使命凝聚在一起的小团队,都为世界带来了积极的改变。这很容易用反面解释:在大公司中发展新技术很困难,独自一人则更加困难。官僚体制行动缓慢,既得利益者不愿承担风险。在最糟糕的公司里,表现出工作积极性比实际工作本身更能带来职业晋升(如果你的公司是这样,你应该立刻辞职)。反之,一位天才可能创造出经典的艺术或文学作品,但他无法独自创造出一个完整的产业。初创企业秉持的原则是:需要团队合作才能完成任务,但规模也必须足够小,才能真正做到这一点。 积极地说,初创企业 (startup) 是你能说服参与一项建立不同未来计划的最大团队。一家新公司最重要的优势是创新思维:它比灵活性更重要,小规模提供了思考的空间。本书探讨的是你需要问什么问题,以及为了在开创性事业中取得成功,你需要回答什么问题:这并非一本操作手册或知识总结,而是一次思维练习。因为这就是初创企业 (startup) 所需做的:质疑既有观念,从零开始重新思考商业。 本文翻译自: https://www.founderstribune.org/p/the-challenge-of-the-future-by-peter-thiel

December 9, 2024 · 1 min · fisherdaddy

中国大模型生存战:逆袭的豆包、开源的阿里以及乏力的六小龙

本文来自晚点LatePost的文章《中国大模型生存战:巨头围剿,创业难熬》,梳理出了其中的核心内容,并重新做了组织。 中国大模型的现状 现在悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。 一位去年跟踪了 4 家大模型公司的投资人,曾 “辛辛苦苦要到了” 六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些 founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。” 做大模型,“一年低消也要 20 亿-30 亿美元”,这超出任何一家中国大模型六小龙的总融资额。 目前大模型创业的两难是,to C AI 产品仍跳不出移动互联网生态,而字节、腾讯等公司在这里积累已久。其中,大公司最擅长,创业公司也绕不开的一个环节就是投放和流量获取。 投资人也逐渐认清现实:模型能持续比字节好,比开源的也好,而且好得很明显,这很难,最终要赢在产品。 现在大公司正处在 “上头” 期,但 “一旦一件事干了几年还拿不到结果”,内部张力会涌现,尤其是组织上的拉扯。这时如果创业公司还在场,可能有机会。百度已出现了类似的张力。在百度,训练基础大模型、开发 to C 大模型产品和提供 to B 大模型方案,分属三个事业群。一位百度人士说,到今年中,当百度模型训练团队希望调动更多算力,训更强的大模型时,会遭遇 GPU 不够用的情况,需要集团高层出面协调——同样是 GPU,放在 to B 业务,马上就有收入,而训练新模型,回报则不明确。 所有依靠新技术的创业,都是在和大公司赛跑——看创业团队先补上完整的商业化体系,还是大公司先学会新技术。这一竞赛的结果,取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛有多高、赛道有多长。 大模型 vs 移动互联网浪潮:移动互联网是新软件、新硬件同时出现,从电脑到手机,带来了 App 的强劲自然增长,当时的流量成本也低得多。“现在是新软件有了,还没有新硬件。”。但实际上,大模型产品现在的软件也还是 “半新状态”:由大模型支撑的很多产品,仍是一个个 App,模型能力是提升体验的最重要动力,但需求洞察、功能设计,流量和用户获取依然重要。如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏。 美团创始人王兴曾说:大多数人以为战争由拼搏组成,其实战争是由等待和煎熬组成。 当前中国 AI 产品数据战况 Kimi 和豆包激烈交战的生产力方向,普遍被认为价值高、智能含量高。而在类 Character.ai 的陪伴和虚拟社交产品上,巨头暂时没拿出那么多火力。 字节豆包 App: 今年 9 月的日活为 760 万,月活 4200 多万,30 日留存率34.5%。到 10 月,豆包的日活已达 945 万。中国日活最大的 AI 产品。 Kimi 智能助手:今年 9 月的日活为 130 多万,月活 1000 万出头,30 日留存率约 28%...

November 30, 2024 · 2 min · fisherdaddy

如何从零开始构建你的市场进入策略 (Go-to-Market, GTM)

本文由 Kyle Poyar 和 Maja Voje 合作撰写,探讨了如何从零开始构建一套有效的 Go-To-Market (GTM) 策略。GTM 策略并非单纯的产品发布或营销活动,而是一系列帮助产品进入市场并实现可扩展增长的系统性活动。作者通过三大核心框架和实际案例,详细解析了 GTM 的关键步骤和成功要素,旨在帮助初创企业更快、更低风险地实现市场突破。 GTM 策略的核心目标是找到至少一种可重复且可扩展的市场进入方式,从而推动产品增长。本文分为三个阶段来定义 GTM 适配性:问题-解决方案适配、产品-市场适配 和 市场进入适配,并介绍了三种框架来优化 GTM 策略。 三个阶段的 GTM 适配性 问题-解决方案适配: 确认产品能够解决目标用户的实际问题。 通常通过少量(如 5 个)早期付费客户验证这一阶段。 客户主要来自创始人的人脉或早期支持者。 产品-市场适配: 建立可持续的商业模式,确保客户留存并持续使用产品。 产品不仅要为客户创造价值,还需通过价值捕获实现盈利。 市场进入适配: 找到至少一种可预测、可扩展的市场进入方式(如直销、内容营销、合作伙伴关系等)。 这一阶段为打开新市场和进一步扩展奠定基础。 三大核心框架 框架 1:从早期客户画像(ECP)到理想客户画像(ICP) 早期客户画像(ECP) 是 GTM 初期的关键,需满足以下条件: 迫切需要解决问题。 具备付费意愿。 愿意作为参考客户,帮助产品建立信誉。 接近创始团队,便于快速达成交易。 示例:DevStats 在早期阶段优先服务于规模较小、决策更灵活的工程团队,而非要求高合规性的行业巨头。 框架 2:差异化定位(UVP 和 USP) 独特价值主张(UVP):向客户承诺的核心价值。 独特销售主张(USP):为何客户应选择你的产品,而非替代方案。 差异化定位的关键是理解竞争对手和客户的评价标准,并找到能够脱颖而出的领域。 示例:Post Rewriter 通过强调“易用性”和“安全性”成功吸引客户。 框架 3:制定 GTM 总体规划 在产品-市场适配阶段前,需通过用户访谈或调研找到目标受众的聚集地。 一旦进入市场进入适配阶段,需系统化和优化 GTM 动作,如直销、内容营销或合作伙伴关系。 示例:Expert9 通过个人网络获取早期案例研究,再利用内容营销和外联活动逐步扩大客户群。 重要提示...

November 21, 2024 · 1 min · fisherdaddy

AI 初创公司最危险的举动:为其他 AI 初创公司开发产品

本文探讨了 AI 初创公司如何在企业级市场中实现可持续收入 的策略,核心观点是:要在生成式 AI 领域取得商业成功,初创公司必须从一开始就采用 “企业基础设施原生”(enterprise infrastructure native) 的方法。这意味着在设计和开发产品时,优先考虑满足大型传统企业的复杂需求,而不是仅服务于科技公司或个人用户。文章还强调,与其在后期“修补”产品以适应企业需求,不如从一开始就将企业需求融入产品设计中。 此外,文章指出,生成式 AI 初创公司在现阶段更有可能通过服务非科技企业(如金融、医疗等)实现盈利,而不是与大科技公司竞争 B2C 或科技原生 B2B 市场。 企业基础设施原生的必要性 定义:企业基础设施原生指的是公司从一开始就设计产品以适应企业环境的复杂需求,包括安全性、合规性、个性化、延迟和规模等问题。 原因: 企业(尤其是非科技企业)拥有庞大的开发者群体和复杂的基础设施需求。 后期改造产品以满足企业需求会带来巨大的技术和文化挑战。 非科技企业的约束(如安全合规性)比科技公司更复杂,且需要专门的基础设施支持。 为什么专注于非科技企业 非科技企业的市场潜力: 大型非科技企业(如银行、医疗机构)比科技公司雇佣更多开发者,并且更愿意为提高生产力的工具付费。 相比个人用户,企业能带来更高的收入回报。 避开大科技公司的竞争: 大科技公司倾向于自己开发生成式 AI 工具,而非购买。 在 B2C 市场中,大科技公司拥有强大的分发渠道,初创公司难以与之竞争。 成功案例:Codeium 专注于解决非科技企业的特定约束,避免了与大科技公司的直接竞争。 企业基础设施原生的关键要素 安全性: 提供自托管或混合部署选项,以满足企业对数据隐私和安全的需求。 获得必要的安全认证(如 SOC2、ISO 27001),并确保不在训练中使用客户数据。 合规性: 确保训练数据不侵犯版权,并构建数据溯源和归因系统。 针对不同行业的法规(如医疗的 HIPAA 合规)提供定制化支持。 个性化: 利用企业的私有数据(如代码库)进行模型优化,同时确保数据的安全性和访问控制。 构建灵活的角色访问控制(RBAC)系统,以防止数据泄露。 性能和延迟: 设计低延迟系统,满足实时应用的需求(如代码自动补全需在毫秒级响应)。 优化模型推理速度,同时兼顾个性化和数据处理。 规模化: 针对企业级用户的规模(如数万开发者、数百万代码行)优化系统性能和基础设施。 解决大规模用户群体中的权限管理和数据更新问题。 生成式 AI 的 ROI 挑战 难以量化的价值: 例如,开发者生产力的提升难以用具体指标(如代码量或 PR 周期时间)衡量。 解决方法: 提供分团队的使用统计数据,帮助企业管理员识别高效团队和需要支持的团队。 逐步展示工具的价值,帮助客户更清楚地感知投资回报。 未来展望 尽管目前企业市场是生成式 AI 初创公司最可行的盈利途径,作者希望未来能看到更多初创公司在 B2C 和科技原生 B2B 市场中挑战大科技公司。 文章最后以 Codeium 的成功经验总结,强调了“企业基础设施原生”策略在生成式 AI 初创公司中的重要性。 原文 swyx:再次欢迎 Anshul 作为我们首位“二度回归”的客座作者!他此前关于 AI 产品理念的两篇文章在 Latent Space 和 Codeium 上大获成功,Codeium 的安装用户数增长了十倍,并且自上次交流以来,完成了 6500 万美元的 B 轮融资和1....

November 21, 2024 · 3 min · fisherdaddy

生成式 AI 的 Act o1

本文讨论了生成式 AI 领域的最新进展,特别是从快速响应(“System 1”)向推理能力(“System 2”)的转变。这一转变标志着 AI 系统在推理和认知操作方面的能力显著提升,开启了一个新的“代理性应用”时代。文章还探讨了生成式 AI 市场的现状及未来趋势,特别是 OpenAI 推出的 o1 模型如何通过推理时间计算实现更强的推理能力。此外,作者分析了 AI 市场的各个层次(基础设施、模型、开发工具和应用层)的竞争格局,指出应用层的机会最大,特别是在构建定制的认知架构以应对现实世界中的复杂任务。 市场结构的稳定:生成式 AI 市场的基础层已经趋于稳定,主要由几大巨头主导,如 Microsoft/OpenAI、AWS/Anthropic、Meta 和 Google/DeepMind。尽管竞争激烈,但市场结构逐渐固化,预示着更便宜且更强大的预测能力即将到来。 推理层的崛起:随着基础层的稳定,AI 研究的重点转向推理层,即“System 2”思维。这种思维模式类似于 AlphaGo 的运作方式,即通过推理和模拟多个未来场景来做出更有深度的决策。 OpenAI 的 o1 模型:2024 年最重要的模型更新是 OpenAI 的 o1 模型(代号 Strawberry),这是第一个具有真正推理能力的模型。它通过推理时间计算实现了更复杂的推理能力,特别是在逻辑和数学等领域表现突出。 推理的挑战:与 AlphaGo 不同,语言模型在推理时难以构建明确的价值函数,因为许多任务(如写作或制定旅行计划)没有明确的评分标准。这使得推理在开放性任务中更加困难。 系统 1 与系统 2 思维:系统 1 思维是基于模式匹配的快速响应,而系统 2 思维则需要模型在推理时停下来思考,生成多种可能性并评估其结果。这种深度推理对于复杂任务(如数学或生物学突破)至关重要。 推理时间计算的扩展:o1 模型揭示了推理时间计算的新扩展规律,即给模型更多的推理时间,它的表现会显著提升。这一发现将推动从大规模预训练集群向动态推理云的转变。 应用层的机会:尽管基础层和模型层由巨头主导,但应用层仍有巨大的机会,特别是在构建能够应对现实世界复杂任务的定制认知架构方面。许多 AI 公司已经开始在各个行业中开发代理性应用,如 Harvey(AI 律师)、Factory(AI 软件工程师)和 Sierra(AI 客户支持)。 服务即软件的转变:生成式 AI 正在推动从软件即服务(SaaS)向服务即软件的转变。AI 公司通过代理性应用提供具体的工作成果,而不是简单的软件工具,从而瞄准了数万亿美元的服务市场。 未来展望:未来的 AI 发展将继续围绕推理和推理时间计算展开,特别是在复杂的现实世界任务中。多代理系统可能会成为一种新趋势,帮助 AI 实现更复杂的任务协作。最终,AI 可能会达到类似 AlphaGo 的“Move 37”时刻,即展示出超越人类的创新能力。...

November 6, 2024 · 2 min · fisherdaddy

AI 规模扩展能否持续到 2030 年?

本文探讨了人工智能(AI)训练规模的快速扩展是否能够持续到2030年。研究表明,AI模型的性能提升与计算资源的增加密切相关,当前AI训练的计算量每年增长约4倍。文章分析了四个关键限制因素:电力供应、芯片制造能力、数据稀缺性和“延迟壁垒”,并预测到2030年可能实现2e29 FLOP的训练规模,远超当前的GPT-4水平。尽管技术上可行,但实现这一规模的关键在于AI开发者是否愿意投入数千亿美元的资金。 电力限制 预计到2030年,美国数据中心的电力需求将显著增加,可能需要多达2至45 GW的电力供应,支持2e28到2e30 FLOP的训练运行。 单一数据中心的电力供应可能达到1至5 GW,地理分布的训练网络则能利用多个地区的电力资源。 扩展电力基础设施,如建设新的发电厂,可能需要3至5年的提前规划。 芯片制造能力 AI芯片(如Nvidia H100)的生产能力是AI扩展的另一个关键因素。尽管芯片制造商计划扩展生产能力,但受限于先进封装和高带宽内存(HBM)的生产能力。 预计到2030年,全球将有足够的产能生产1亿个H100等效GPU,支持9e29 FLOP的训练运行。 数据稀缺性 训练大型AI模型需要大量数据。当前网络上可索引的文本数据约为500万亿词,预计到2030年增加50%。 多模态数据(图像、视频、音频)将有助于缓解数据稀缺问题,可能使训练数据增加至6e28至2e32 FLOP的规模。 生成合成数据可能进一步扩展数据供应,但需要额外的计算资源。 延迟壁垒 延迟壁垒是AI训练的“速度限制”,随着模型规模的增加,训练时间也会增加。通过并行处理更多数据可以部分缓解这一问题,但批量大小的增加有一定限制。 预计到2030年,延迟壁垒可能限制训练运行在3e30到1e32 FLOP之间。 经济与投资考量 实现大规模AI训练的关键在于AI开发者是否愿意投入数千亿美元。微软和OpenAI的“Stargate”项目表明,业界可能正在为实现这一目标做准备。 经济回报可能驱动巨额投资,特别是如果AI能够实现大规模的经济自动化。 尽管存在电力、芯片制造、数据和延迟等限制因素,但AI训练的扩展在技术上是可行的。到2030年,AI训练规模可能达到2e29 FLOP,这将带来与当前GPT-4相比显著的性能提升。然而,能否实现这一目标取决于资金投入和基础设施扩展的速度。 引言 近年来,AI 模型 (AI models) 的能力显著提升。我们的研究表明,计算资源的增长是 AI 性能提升的重要原因之一。[1] 持续且可预测的规模效益使得 AI 实验室积极扩大训练规模,训练计算量以每年约 4 倍的速度增长。 AI 训练计算量每年 4 倍的增长速度,甚至超过了近代史上一些技术发展最快的时期。它超过了移动电话普及速度最快时 (2 倍/年,1980-1987 年),太阳能装机容量 (1.5 倍/年,2001-2010 年) 和人类基因组测序 (3.3 倍/年,2008-2015 年) 的增长速度。 本文探讨当前 AI 训练规模快速扩张的步伐(约每年 4 倍)能否持续到 2030 年。我们调查了可能限制规模扩展的四个关键因素:电力供应、芯片制造能力、数据稀缺性和“延迟墙 (latency wall)”。延迟墙是由 AI 训练计算中不可避免的延迟造成的根本速度限制。 我们的分析涵盖了生产能力的扩张、投资和技术进步等因素。这包括分析先进芯片封装设施的扩建计划、新增发电厂的建设以及数据中心的地域分布(以便利用多个电网)。为了考虑这些变化,我们纳入了来自各公共渠道的预测数据,包括半导体代工厂的扩张计划、电力供应商的容量增长预测、其他相关行业数据以及我们自己的研究。 我们发现,到 2030 年,进行 2e29 FLOP 的训练很可能在技术上可行。换句话说,到 2030 年,训练出比 GPT-4 更强大的模型,就像 GPT-4 比 GPT-2 更强大一样,将很有可能。[2] 如果继续发展下去,我们可能会在 2030 年前后看到 AI 出现巨大的进步,就像 2019 年 GPT-2 只能生成简单的文本,而 2023 年 GPT-4 却具备了复杂的问题解决能力一样。...

November 6, 2024 · 11 min · fisherdaddy