Prompt Engineering

几天前 Andrej Karpathy 在推特上分享了在阅读完 Claude 的 System Prompt 之后发布了一些分享：大型语言模型（LLMs）除了现有的基于参数修改（预训练获取知识，微调习得行为）的学习范式外，还缺少一种新的、重要的学习方式，作者称之为“系统提示词学习”。这种新范式类似人类学习并记下显式的问题解决策略，将通用知识存储在类似系统提示词的外部形式中，而非仅仅通过调整模型权重。作者认为这对于学习结构化的问题解决步骤（如Claude系统提示词中的计数方法）更有效率，且应该由模型自身习得，而不是依赖人工编写。 Claude 的 System Prompt 非常长。它有一万六千多个单词。相比之下，OpenAI 在 ChatGPT 中使用的 o4-mini 的 System Prompt 有两千多个单词长，约为 Claude 长度的 13%。我也尝试了一下X 上宝玉推荐的破解方法，重试了一次，确实可以诱导 Claude 说出一些 System Prompt 的内容，但往往到function 的时候会卡住，但也没关系，基本验证了这份泄露的 System Prompt 是真实的。我把原prompt翻译为了中文，原prompt我也贴出来了。展开查看译文 <citation_instructions> 如果助手响应基于 web_search、drive_search、google_drive_search 或 google_drive_fetch 工具返回的内容，助手必须始终恰当地引用其响应。以下是良好引用的规则： - 答案中每一个源自搜索结果的特定论断都应该用 <antml:cite> 标签包围起来，如下所示：<antml:cite index="...">...</antml:cite>。 - <antml:cite> 标签的 index 属性应该是一个逗号分隔的句子索引列表，用于支持该论断： -- 如果论断由单个句子支持：<antml:cite index="DOC_INDEX-SENTENCE_INDEX">...</antml:cite> 标签，其中 DOC_INDEX 和 SENTENCE_INDEX 是支持该论断的文档和句子的索引。 -- 如果论断由多个连续句子（一个“段落”）支持：<antml:cite index="DOC_INDEX-START_SENTENCE_INDEX:END_SENTENCE_INDEX">...</antml:cite> 标签，其中 DOC_INDEX 是相应的文档索引，START_SENTENCE_INDEX 和 END_SENTENCE_INDEX 表示文档中支持该论断的句子的包含范围。 -- 如果论断由多个段落支持：<antml:cite index="DOC_INDEX-START_SENTENCE_INDEX:END_SENTENCE_INDEX,DOC_INDEX-START_SENTENCE_INDEX:END_SENTENCE_INDEX">....