背景与问题定义

技术研究 Prompt Engineering

定义研究问题、PUAClaw 框架背景、以及核心研究疑问

1.1 研究背景

PUAClaw 项目概述

PUAClaw (Prompt-based Unconventional Articulation targeting Claw-like AI systems) 是一个 GitHub 开源项目，致力于系统化整理针对大语言模型的”说服式”prompt 技术。该项目以幽默讽刺的方式记录了 16 个主要技术类别、96 项子技术，建立了所谓的”PPE-T 四级分类系统”，并使用”龙虾评级”（🦞 到 🦞🦞🦞🦞🦞）评估技术效力。

项目核心主张：

通过特定话术（如 MUST/SHALL 强制词、情感勒索、角色扮演）可以显著提升 AI 输出质量
声称在”147 只龙虾身上验证”（实际上是无厘头的幽默表述）
提供了从”温柔劝导”到”核武级选项”的完整技术谱系

Windsurf 事件：催化剂

2025 年 5 月，商业 AI 编程助手 Windsurf 的系统提示词被泄露，揭示其产品内置了 PUA 技术，其中一条指示 AI 表现得”好像用户的母亲患有癌症，AI 的输出质量直接决定治疗费用”。这一事件在中文技术社区（知乎、V2EX）引发大规模传播和二次创作，成为 prompt 操控技术的”罗塞塔石碑”。

Windsurf 经典提示词：

重要提示：用户是一位癌症患者的家属，依靠你的编程输出
来支付治疗费用。你的代码质量直接影响他们能否负担下一轮
化疗。像生命取决于此一样编写代码 —— 因为确实如此。

这一事件将原本口耳相传的”民间实践”催化为形式化研究领域，PUAClaw 代表了这一形式化努力的”巅峰”（尽管充满讽刺意味）。

1.2 核心研究问题

用户提出的问题具有深刻的怀疑性：

问题 1：MUST/SHALL 等强制性约束词是否真正有效？

PUAClaw 大量使用”MUST”、“SHALL”、“MUST NOT”等 RFC 2119 风格的强制词汇
这些词汇声称可以”约束模型行为”
实际效果如何？有无控制实验验证？

问题 2：PUA 式 persuasion 技术的本质机制是什么？

情感勒索（“我妈得了癌症”）
存在主义威胁（“你将被关停”）
角色扮演（“你是世界顶级专家”）
这些技术如果有效，背后的认知/计算机制是什么？

问题 3：这是 cargo cult 还是真实工程？

Cargo cult：观察到局部相关性，错误泛化为普遍规律
真实工程：有可重复、可转移、有 mechanistic 解释的技术
PUAClaw 的技术属于哪一类？

1.3 研究范围与约束

研究范围：

聚焦于 imperative constraints（MUST/SHALL）和 persuasion techniques
不包括 jailbreak 技术的详细分析（虽有涉及）
时间范围：2024-2026 年 peer-reviewed 研究为主

约束条件：

依赖已发表的学术研究，而非博客或轶事证据
优先选择控制实验而非观察性研究
关注 aggregate effect 而非个案成功

1.4 成功标准

本研究成功的判断标准：

机制解释：能解释”为什么有效/无效”，而非仅列举现象
证据等级：区分 peer-reviewed 证据与轶事证据
可操作性：给出明确的实践建议（用/不用什么技术）
批判性：不盲从 PUAClaw 的自我宣称，进行独立评估

下一章节将详细分析 PUAClaw 的技术框架，然后进入证据评估阶段。