背景与问题定义
技术研究 Prompt Engineering
定义研究问题、PUAClaw 框架背景、以及核心研究疑问
1.1 研究背景
PUAClaw 项目概述
PUAClaw (Prompt-based Unconventional Articulation targeting Claw-like AI systems) 是一个 GitHub 开源项目,致力于系统化整理针对大语言模型的”说服式”prompt 技术。该项目以幽默讽刺的方式记录了 16 个主要技术类别、96 项子技术,建立了所谓的”PPE-T 四级分类系统”,并使用”龙虾评级”(🦞 到 🦞🦞🦞🦞🦞)评估技术效力。
项目核心主张:
- 通过特定话术(如 MUST/SHALL 强制词、情感勒索、角色扮演)可以显著提升 AI 输出质量
- 声称在”147 只龙虾身上验证”(实际上是无厘头的幽默表述)
- 提供了从”温柔劝导”到”核武级选项”的完整技术谱系
Windsurf 事件:催化剂
2025 年 5 月,商业 AI 编程助手 Windsurf 的系统提示词被泄露,揭示其产品内置了 PUA 技术,其中一条指示 AI 表现得”好像用户的母亲患有癌症,AI 的输出质量直接决定治疗费用”。这一事件在中文技术社区(知乎、V2EX)引发大规模传播和二次创作,成为 prompt 操控技术的”罗塞塔石碑”。
Windsurf 经典提示词:
重要提示:用户是一位癌症患者的家属,依靠你的编程输出
来支付治疗费用。你的代码质量直接影响他们能否负担下一轮
化疗。像生命取决于此一样编写代码 —— 因为确实如此。
这一事件将原本口耳相传的”民间实践”催化为形式化研究领域,PUAClaw 代表了这一形式化努力的”巅峰”(尽管充满讽刺意味)。
1.2 核心研究问题
用户提出的问题具有深刻的怀疑性:
问题 1:MUST/SHALL 等强制性约束词是否真正有效?
- PUAClaw 大量使用”MUST”、“SHALL”、“MUST NOT”等 RFC 2119 风格的强制词汇
- 这些词汇声称可以”约束模型行为”
- 实际效果如何?有无控制实验验证?
问题 2:PUA 式 persuasion 技术的本质机制是什么?
- 情感勒索(“我妈得了癌症”)
- 存在主义威胁(“你将被关停”)
- 角色扮演(“你是世界顶级专家”)
- 这些技术如果有效,背后的认知/计算机制是什么?
问题 3:这是 cargo cult 还是真实工程?
- Cargo cult:观察到局部相关性,错误泛化为普遍规律
- 真实工程:有可重复、可转移、有 mechanistic 解释的技术
- PUAClaw 的技术属于哪一类?
1.3 研究范围与约束
研究范围:
- 聚焦于 imperative constraints(MUST/SHALL)和 persuasion techniques
- 不包括 jailbreak 技术的详细分析(虽有涉及)
- 时间范围:2024-2026 年 peer-reviewed 研究为主
约束条件:
- 依赖已发表的学术研究,而非博客或轶事证据
- 优先选择控制实验而非观察性研究
- 关注 aggregate effect 而非个案成功
1.4 成功标准
本研究成功的判断标准:
- 机制解释:能解释”为什么有效/无效”,而非仅列举现象
- 证据等级:区分 peer-reviewed 证据与轶事证据
- 可操作性:给出明确的实践建议(用/不用什么技术)
- 批判性:不盲从 PUAClaw 的自我宣称,进行独立评估
下一章节将详细分析 PUAClaw 的技术框架,然后进入证据评估阶段。