
问题定义:比Prompt更重要的能力
图解导读:Prompt之前,先把问题变硬
模糊的请求通常会得到平庸的回答,不是因为AI不努力,而是因为它没有足够清楚的靶心。问题定义做的事情,就是把"帮我分析一下"这类软塌塌的想法,压成目标、对象、场景和标准都清楚的任务。

开始提问前,可以先给自己填一张任务定义卡。它不需要复杂,却能逼你回答几个关键问题:到底要解决什么,交付物是什么,给谁用,已有材料有哪些,按什么标准算好,以及哪些事情不能做。

情境案例
一个正在写毕业论文的营销学研究生打开Claude,输入了一句话:帮我设计一份问卷。Claude给了她一份20道题的问卷,格式规范,看起来可以直接用。她确实直接用了。
两个月后,导师提出尖锐的问题:你的研究假设是环保意识影响购买决策,但问卷里只有两道题涉及环保态度。你没有区分环保动机类型,没有控制交互效应,也没有设计反向题。这份问卷和你的研究假设之间,存在严重的脱节。
教训不是"AI设计问卷不靠谱",而是:一个模糊的请求,注定只能得到一个泛泛的回答。
为什么"帮我写一下"不是一个好任务
"帮我写一下XX"是最自然、也最低效的AI使用方式。这种请求有一个根本问题:它把最关键的决策 -- 写什么、写给谁、按什么标准写 -- 全部甩给了AI。
AI没有你和室友之间的共享上下文。你的室友听到"帮我看看这个PPT"时,他知道你是什么专业、这是什么课的作业、老师的风格是什么。但AI面对信息真空,它只能用训练数据中最常见的模板来填补空白。结果就是你得到一个"平均水平"的回答 -- 不会出大错,但也不会有任何针对性。
国内关于大模型提示工程的综述指出,提示工程通过设计提示指令来指导模型响应,是释放大语言模型能力的重要方法[1]。换句话说,一个好问题比一个大模型更重要。
对比实验
版本A:帮我写一下关于《乡土中国》的读书报告。
你会得到一篇中规中矩、放在任何学生作业里都不会显得格格不入的文章。它会概述费孝通的核心观点,提到"差序格局"和"礼治秩序",结尾说"对当代社会仍有启发"。正确,但毫无个性。
版本B:我是社会学专业大二学生,正在上"中国社会结构专题"课。老师要求2000字,重点是选择书中一个核心概念,结合当代社会现象讨论。我打算选"差序格局",结合社交媒体上的人际互动来分析。请帮我搭建论证框架。
第二种表述得到的回答会好出好几个层次。差异不在于Prompt技巧,而在于任务定义的精度。
定义:任务定义
任务定义是指将一个模糊的意图转化为一组清晰的、可执行的约束条件的过程。一个好的任务定义至少包含三个要素:目标(你要得到什么),背景(在什么条件下得到),标准(怎么判断得到的东西是好的)。这不是AI时代才需要的能力 -- 在任何协作场景中,清晰的任务定义都是高效合作的前提。
六种任务类型
在向AI发出请求之前,花几秒钟想一想:我要的到底是哪种类型?不同的类型需要你提供的信息完全不同。
| 类型 | 你期望得到什么 | 你需要提供什么 | 典型场景 |
|---|---|---|---|
| 答案 | 一个确定的事实或数据 | 精确度要求、时间范围 | "2024年诺贝尔文学奖获得者是谁?" |
| 解释 | 对概念或现象的理解 | 你的知识水平、希望的深度 | "用我能听懂的话解释量子纠缠" |
| 方案 | 一个可执行的行动计划 | 时间、资源等约束条件 | "帮我制定期末复习计划" |
| 比较 | 多选项的系统对比分析 | 比较维度、你的优先级 | "Python和R做数据分析各有什么优劣?" |
| 创意 | 新颖的想法和可能性 | 主题方向、受众、风格偏好 | "给我的环保主题演讲想一个有冲击力的开头" |
| 行动 | 一个直接可用的交付物 | 格式、规范、长度等精确要求 | "把这段访谈记录整理成表格" |
常见陷阱
很多人在需要"解释"的时候请求了"答案",或者在需要"方案"的时候请求了"创意"。任务类型的错配会导致AI的回答方向完全偏离你的预期 -- 不是因为AI不好,而是因为你没有告诉它你要什么。
如何描述背景、对象、约束和标准
好的AI请求应该包含足够的边界条件,让AI知道在什么范围内工作。教育部高等教育司公布的"人工智能+高等教育"应用场景典型案例,也反复体现了一个共同点:人工智能应用必须嵌入具体教学场景、任务流程和评价标准,才能真正改善学习与教学[2]。具体来说:
- 背景(Background):你为什么要做这件事?在什么情境下做?课程作业还是实习项目?课堂演示还是书面报告?这决定了AI输出的严肃程度、深度和表现形式
- 对象(Audience):谁会看到你的交付物?导师、客户、还是普通读者?这决定了语言风格和专业度
- 约束(Constraint):字数、格式、理论框架、参考文献要求?约束越明确,AI的输出越可控
- 标准(Standard):什么算好的输出?怎么判断交付物达标?标准越清晰,你和AI之间的"验收协议"越明确
这四个维度构成了一个容易记忆的框架:BACS(Background, Audience, Constraint, Standard)。
为什么"约束"反而能提高质量
这听起来反直觉:给AI更多约束,输出反而更好?但这和写作是一样的道理。"写一首诗"比"写一首五言绝句"更难出好作品。约束迫使你(和AI)在有限空间内做取舍,而取舍的过程就是质量产生的过程。提示工程研究中的角色设定、任务分解、输出格式约束等方法,本质上都是在减少模糊性、提高可控性[1:1]。中国古典诗歌的层层格律限制——平仄、对仗、韵脚——恰恰是伟大诗篇诞生的土壤,而不是束缚。
如何把大问题拆成小任务
以毕业论文为例,与其对AI说"帮我写毕业论文",不如拆解为:
- 文献检索与筛选 - 梳理相关研究,按方法和结论分类
- 研究设计咨询 - 让AI从方法论角度指出方案漏洞
- 数据分析思路 - 确认统计方法选择是否恰当
- 论文结构审查 - 审查逻辑结构和论证完整性
- 语言润色 - 最终的措辞和语法优化
判断标准:如果一个子任务的输出你能在五分钟之内判断好坏,粒度就是合适的。如果你需要花半小时才能判断AI的输出是否可用,说明任务还需要进一步拆分。
拆解的认知价值
任务拆解不仅让AI的输出更好 -- 它还迫使你自己把工作流程想清楚。很多学生在拆解任务的过程中才发现,自己对论文的整体思路还没有理清楚。拆解任务的过程本身就是思考的过程。
高质量AI请求的六要素
BACS是你在提问之前用来审视需求的框架 -- 确保你想清楚了背景、对象、约束和标准。下面的六要素则是你写请求时的检查清单 -- 确保请求本身包含了AI需要的全部信息。两者的关系是:BACS帮你想清楚,六要素帮你说清楚。
| 要素 | 核心问题 | 示例 |
|---|---|---|
| 目标 | 我要得到什么? | 一个2000字的案例分析框架 |
| 背景 | 我是谁,为什么需要? | 法学大三学生,模拟法庭准备 |
| 材料 | 我能提供什么素材? | 案件事实材料、相关法条 |
| 约束 | 有什么必须遵守的规则? | 必须引用最高法指导案例 |
| 格式 | 输出应该长什么样? | 分为事实、争议焦点、法律适用三部分 |
| 标准 | 什么算好的输出? | 要有逻辑推导过程,不要罗列 |
这六个要素不必每次都完整列出。日常简单问答时,一两个要素就够了。但当你需要AI帮你完成重要的、复杂的任务时,六要素越完整,结果越好。
把写Prompt的时间从10秒增加到2分钟,你得到的输出质量可能提升一个数量级。这两分钟不是浪费,而是你在为接下来节省的修改时间做投资。
帮我写一份关于新能源汽车的分析报告。
BACS框架中的'C'代表什么?
如何判断任务拆解的粒度是否合适?
选择你目前正在做的一个作业或项目,试着用六要素框架(目标、背景、材料、约束、格式、标准)完整定义一次。然后把这个定义发给AI,观察输出质量是否有提升。
参考文献
黄峻, 林飞, 杨静, 王兴霞, 倪清桦, 王雨桐, 田永林, 李娟娟, 王飞跃. (2024). 生成式AI的大模型提示工程:方法、现状与展望.《智能科学与技术学报》, 6(2):115-133. https://www.cjist.com.cn/thesisDetails#10.11959/j.issn.2096-6652.202424&lang=zh ↩︎ ↩︎
教育部高等教育司. (2024). 关于公布第二批"人工智能+高等教育"应用场景典型案例的通知. https://www.moe.gov.cn/s78/A08/tongzhi/202411/t20241118_1163542.html ↩︎
