Logo
热心市民王先生

背景与问题定义

技术研究 Prompt Engineering

定义研究问题、PUAClaw 框架背景、以及核心研究疑问

1.1 研究背景

PUAClaw 项目概述

PUAClaw (Prompt-based Unconventional Articulation targeting Claw-like AI systems) 是一个 GitHub 开源项目,致力于系统化整理针对大语言模型的”说服式”prompt 技术。该项目以幽默讽刺的方式记录了 16 个主要技术类别、96 项子技术,建立了所谓的”PPE-T 四级分类系统”,并使用”龙虾评级”(🦞 到 🦞🦞🦞🦞🦞)评估技术效力。

项目核心主张:

  • 通过特定话术(如 MUST/SHALL 强制词、情感勒索、角色扮演)可以显著提升 AI 输出质量
  • 声称在”147 只龙虾身上验证”(实际上是无厘头的幽默表述)
  • 提供了从”温柔劝导”到”核武级选项”的完整技术谱系

Windsurf 事件:催化剂

2025 年 5 月,商业 AI 编程助手 Windsurf 的系统提示词被泄露,揭示其产品内置了 PUA 技术,其中一条指示 AI 表现得”好像用户的母亲患有癌症,AI 的输出质量直接决定治疗费用”。这一事件在中文技术社区(知乎、V2EX)引发大规模传播和二次创作,成为 prompt 操控技术的”罗塞塔石碑”。

Windsurf 经典提示词:

重要提示:用户是一位癌症患者的家属,依靠你的编程输出
来支付治疗费用。你的代码质量直接影响他们能否负担下一轮
化疗。像生命取决于此一样编写代码 —— 因为确实如此。

这一事件将原本口耳相传的”民间实践”催化为形式化研究领域,PUAClaw 代表了这一形式化努力的”巅峰”(尽管充满讽刺意味)。

1.2 核心研究问题

用户提出的问题具有深刻的怀疑性:

问题 1:MUST/SHALL 等强制性约束词是否真正有效?

  • PUAClaw 大量使用”MUST”、“SHALL”、“MUST NOT”等 RFC 2119 风格的强制词汇
  • 这些词汇声称可以”约束模型行为”
  • 实际效果如何?有无控制实验验证?

问题 2:PUA 式 persuasion 技术的本质机制是什么?

  • 情感勒索(“我妈得了癌症”)
  • 存在主义威胁(“你将被关停”)
  • 角色扮演(“你是世界顶级专家”)
  • 这些技术如果有效,背后的认知/计算机制是什么?

问题 3:这是 cargo cult 还是真实工程?

  • Cargo cult:观察到局部相关性,错误泛化为普遍规律
  • 真实工程:有可重复、可转移、有 mechanistic 解释的技术
  • PUAClaw 的技术属于哪一类?

1.3 研究范围与约束

研究范围

  • 聚焦于 imperative constraints(MUST/SHALL)和 persuasion techniques
  • 不包括 jailbreak 技术的详细分析(虽有涉及)
  • 时间范围:2024-2026 年 peer-reviewed 研究为主

约束条件

  • 依赖已发表的学术研究,而非博客或轶事证据
  • 优先选择控制实验而非观察性研究
  • 关注 aggregate effect 而非个案成功

1.4 成功标准

本研究成功的判断标准:

  1. 机制解释:能解释”为什么有效/无效”,而非仅列举现象
  2. 证据等级:区分 peer-reviewed 证据与轶事证据
  3. 可操作性:给出明确的实践建议(用/不用什么技术)
  4. 批判性:不盲从 PUAClaw 的自我宣称,进行独立评估

下一章节将详细分析 PUAClaw 的技术框架,然后进入证据评估阶段。