Claude 的 System Prompt 分析

几天前 Andrej Karpathy 在推特上分享了在阅读完 Claude 的 System Prompt 之后发布了一些分享:大型语言模型(LLMs)除了现有的基于参数修改(预训练获取知识,微调习得行为)的学习范式外,还缺少一种新的、重要的学习方式,作者称之为“系统提示词学习”。这种新范式类似人类学习并记下显式的问题解决策略,将通用知识存储在类似系统提示词的外部形式中,而非仅仅通过调整模型权重。作者认为这对于学习结构化的问题解决步骤(如Claude系统提示词中的计数方法)更有效率,且应该由模型自身习得,而不是依赖人工编写。 Claude 的 System Prompt 非常长。它有 一万六千多个单词。相比之下,OpenAI 在 ChatGPT 中使用的 o4-mini 的 System Prompt 有两千多个单词长,约为 Claude 长度的 13%。 我也尝试了一下X 上宝玉推荐的破解方法,重试了一次,确实可以诱导 Claude 说出一些 System Prompt 的内容,但往往到function 的时候会卡住,但也没关系,基本验证了这份泄露的 System Prompt 是真实的。我把原prompt翻译为了中文,原prompt我也贴出来了。 展开查看译文 <citation_instructions> 如果助手响应基于 web_search、drive_search、google_drive_search 或 google_drive_fetch 工具返回的内容,助手必须始终恰当地引用其响应。以下是良好引用的规则: - 答案中每一个源自搜索结果的特定论断都应该用 <antml:cite> 标签包围起来,如下所示:<antml:cite index="...">...</antml:cite>。 - <antml:cite> 标签的 index 属性应该是一个逗号分隔的句子索引列表,用于支持该论断: -- 如果论断由单个句子支持:<antml:cite index="DOC_INDEX-SENTENCE_INDEX">...</antml:cite> 标签,其中 DOC_INDEX 和 SENTENCE_INDEX 是支持该论断的文档和句子的索引。 -- 如果论断由多个连续句子(一个“段落”)支持:<antml:cite index="DOC_INDEX-START_SENTENCE_INDEX:END_SENTENCE_INDEX">...</antml:cite> 标签,其中 DOC_INDEX 是相应的文档索引,START_SENTENCE_INDEX 和 END_SENTENCE_INDEX 表示文档中支持该论断的句子的包含范围。 -- 如果论断由多个段落支持:<antml:cite index="DOC_INDEX-START_SENTENCE_INDEX:END_SENTENCE_INDEX,DOC_INDEX-START_SENTENCE_INDEX:END_SENTENCE_INDEX">....

May 13, 2025 · 98 min · fisherdaddy