提示词工程指南

提示词工程

实验中心

2024年05月11日

一.基本概念

二.提示词要素

三.设计提示的通用技巧

四.提示词示例

提示工程是一个较新的学科，应用于开发和优化提示词（Prompt），帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提高大语言模型处理复杂任务场景的能力，如问答和算术推理能力。开发人员可通过提示工程设计和研发出强大的技术，实现和大语言模型或其他生态工具的高效接轨。

一．基本概念

1.基础提示词

您可以通过简单的提示词（Prompts）获得大量结果，但结果的质量与您提供的信息数量和完善度有关。一个提示词可以包含您传递到模型的_指令_或_问题_等信息，也可以包含其他详细信息，如_上下文_、_输入_或_示例_等。您可以通过这些元素来更好地指导模型，并因此获得更好的结果。

看下面一个简单的示例：

从上面的提示示例中可以看出，语言模型能够基于我们给出的上下文内容 `"The sky is" 完成续写。而输出的结果可能是出人意料的，或远高于我们的任务要求。但是，我们可以通过改进提示词来获得更好的结果。

让我们试着改进以下：

结果是不是要好一些了？本例中，我们告知模型去完善句子，因此输出的结果和我们最初的输入是完全符合的。提示工程（Prompt Engineering）就是探讨如何设计出最佳提示词，用于指导语言模型帮助我们高效完成某项任务。

以上示例基本说明了现阶段的大语言模型能够发挥的功能作用。它们可以用于执行各种高级任务，如文本概括、数学推理、代码生成等。

2.提示词格式

前文中我们还是采取的比较简单的提示词。标准提示词应该遵循以下格式：

<问题>?或<指令>

这种可以被格式化为标准的问答格式，如：

Q: <问题>? A:

以上的提示方式，也被称为 零样本提示（zero-shot prompting），即用户不提供任务结果相关的示范，直接提示语言模型给出任务相关的回答。某些大型语言模式有能力实现零样本提示，但这也取决于任务的复杂度和已有的知识范围。

具体的零样本提示示例如下：

提示词: Q: What is prompt engineering?

对于一些较新的模型，你可以跳过 Q: 部分，直接输入问题。因为模型在训练过程中被暗示并理解问答任务，换言之，提示词可以简化为下面的形式：

提示词: What is prompt engineering?

基于以上标准范式，目前业界普遍使用的还是更高效的 小样本提示（Few-shot Prompting）_范式，即用户提供少量的提示范例，如任务说明等。小样本提示一般遵循以下格式：

<问题>?<答案><问题>?<答案><问题>?<答案><问题>?

而问答模式即如下：

Q: <问题>?A: <答案>Q: <问题>?A: <答案>Q: <问题>?A: <答案>Q: <问题>?A:

注意，使用问答模式并不是必须的。你可以根据任务需求调整提示范式。比如，您可以按以下示例执行一个简单的分类任务，并对任务做简单说明：

语言模型可以基于一些说明了解和学习某些任务，而小样本提示正好可以赋能上下文学习能力。我们将在接下来的章节中更广泛的讨论如何使用零样本提示和小样本提示。

二．提示词要素

如果您接触过大量提示工程相关的示例和应用，您会注意到提示词是由一些要素组成的。

提示词可以包含以下任意要素：

指令：想要模型执行的特定任务或指令。

上下文：包含外部信息或额外的上下文信息，引导语言模型更好地响应。

输入数据：用户输入的内容或问题。

输出指示：指定输出的类型或格式。

为了更好地演示提示词要素，下面是一个简单的提示，旨在完成文本分类任务：

提示词：请将文本分为中性、否定或肯定文本：我觉得食物还可以。情绪：

在上面的提示示例中，指令是“将文本分类为中性、否定或肯定”。输入数据是“我认为食物还可以”部分，使用的输出指示是“情绪：”。请注意，此基本示例不使用上下文，但也可以作为提示的一部分提供。例如，此文本分类提示的上下文可以是作为提示的一部分提供的其他示例，以帮助模型更好地理解任务并引导预期的输出类型。

注意，提示词所需的格式取决于您想要语言模型完成的任务类型，并非所有以上要素都是必须的。我们会在后续的指南中提供更多更具体的示例。

三．设计提示的通用技巧

以下是设计提示时需要记住的一些技巧：

1.从简单开始

在设计提示时，需要记住这是一个迭代的过程，需要大量的实验来获得最佳结果。使用像文心一言或 Kimi 这样的简单平台是一个很好的起点。

您可以从简单的提示开始，随着您的目标是获得更好的结果，不断添加更多的元素和上下文。在此过程中对您的提示进行版本控制是至关重要的。当您阅读本指南时，您会看到许多例子，其中具体性、简洁性和简明性通常会给您带来更好的结果。

当您有一个涉及许多不同子任务的大任务时，您可以尝试将任务分解为更简单的子任务，并随着获得更好的结果而不断构建。这避免了在提示设计过程中一开始就添加过多的复杂性。

2.指令

您可以使用命令来指示模型执行各种简单任务，例如“写入”、“分类”、“总结”、“翻译”、“排序”等，从而为各种简单任务设计有效的提示。

请记住，您还需要进行大量的实验，以查看哪种方法最有效。尝试使用不同的关键字、上下文和数据尝试不同的指令，看看哪种方法最适合您的特定用例和任务。通常情况下，上下文与您要执行的任务越具体和相关，效果越好。我们将在即将推出的指南中介绍采样和添加更多上下文的重要性。

其他人建议将指令放在提示的开头。建议使用一些清晰的分隔符，如“###”，来分隔指令和上下文。

例如：

3.具体性

对您希望模型执行的指令和任务非常具体。提示越具体和详细，结果就越好。当您有所期望的结果或生成样式时，这一点尤为重要。没有特定的令牌或关键字会导致更好的结果。更重要的是具有良好的格式和描述性提示。实际上，在提示中提供示例非常有效，可以以特定格式获得所需的输出。

在设计提示时，您还应考虑提示的长度，因为提示的长度有限制。考虑到您应该具体和详细的程度是需要考虑的。包含太多不必要的细节并不一定是一个好方法。这些细节应该是相关的，并有助于完成手头的任务。这是您需要进行大量实验的事情。我们鼓励大量实验和迭代，以优化您的应用程序的提示。

例如，让我们尝试从一段文本中提取特定信息的简单提示。

4.避免不精确

在上面关于详细和格式改进的提示中，很容易陷入想要过于聪明的提示陷阱，从而可能创建不精确的描述。通常最好是具体和直接。这里的类比非常类似于有效的沟通——越直接，信息传递就越有效。

例如，您可能有兴趣了解提示工程的概念。您可以尝试这样做：

解释提示工程的概念。保持解释简短，只有几句话，不要过于描述。

从上面的提示中不清楚要使用多少句话和什么样的风格。您可能仍然可以通过上面的提示获得良好的响应，但更好的提示是非常具体、简洁和直接的。例如：

使用 2-3 句话向高中学生解释提示工程的概念。

四．提示词示例

在上一节中，我们介绍并给出了如何赋能大语言模型的基本示例。

在本节中，我们会提供更多示例，介绍如何使用提示词来完成不同的任务，并介绍其中涉及的重要概念。通常，学习概念的最佳方法是通过示例进行学习。下面，我们将通过示例介绍说明如何使用精细的提示词来执行不同类型的任务。

1.文本概括

自然语言生成的标准任务之一是文本概括。文本概括可能涉及到不同的风格和领域。事实上，语言模型最前景的应用场景之一就是能够快速概括出易于理解的文章大意和相关概念。我们可以使用提示词尝试一个简单的概括任务。

假设我想了解抗生素的相关信息，我可以给出这样的提示：

在问答形式中，“A:” 是一种明确的提示格式。在这个示例中，我用它去提示模型，我想要该概念的进一步解释。在这个例子中，我们可能还不清楚使用它是否有用，我们会在之后的示例中探讨这一点。现在假设我们感觉模型给了太多的信息，想要进一步提炼它。我们可以指导模型帮我们用一句话总结相关内容：

本示例是模型在没有过多关注上文输出内容的准确性的情况下，尝试用一个句子来总结段落内容。关于上文准确性，我们可以通过指令或说明进一步改善它，这一点我们会在后续指南中进行探讨。读到这里，您可以暂时停住并进行实验，看看是否能获得更好的结果。

2.信息提取

语言模型通过训练不仅可以用于执行自然语言生成相关任务，还可以用于执行文本分类和其他一系列自然语言处理 (NLP) 任务。

使用以下示例提示词从指定段落中提取信息：

我们可以通过许多方式改进以上结果，但当前方式已经非常有用。

现在应该很明显，您可以通过简单地指示语言模型去执行不同的任务。 AI 研发人员也利用这种能力来构建强大的产品和体验。

3.问答

提高模型响应精确度的最佳方法之一是改进提示词的格式。如前所述，提示词可以通过指令、上下文、输入和输出指示以改进响应结果。虽然这些要素不是必需的，但如果您的指示越明确，响应的结果就会越好。以下示例可以说明结构化提示词的重要性。

4.文本分类

目前，我们已经会使用简单的指令来执行任务。作为提示工程师，您需要提供更好的指令。此外，您也会发现，对于更负责的使用场景，仅提供指令是远远不够的。所以，您需要思考如何在提示词中包含相关语境和其他不同要素。同样，你还可以提供其他的信息，如输入数据和示例。

可以通过以下示例体验文本分类：

我们给出了对文本进行分类的指令，语言模型做出了正确响应，判断文本类型为 'Neutral'。如果我们想要语言模型以指定格式做出响应，比如，我们想要它返回 neutral 而不是 Neutral，那我们要如何做呢？我们有多种方法可以实现这一点。此例中，我们主要是关注绝对特性，因此，我们提示词中包含的信息越多，响应结果就会越好。我们可以使用以下示例来校正响应结果：

完美！这次模型返回了 neutral，这正是我们想要的特定标签。提示词中的示例使得模型可以给出更具体的响应。有时给出具体的指令十分重要，可以通过以下示例感受这一点：

这时候你知道给出具体指令的重要性了吧？

5.对话

你可以通过提示工程进行更有趣的实验，比如指导大语言模型系统如何表现，指定它的行为意图和身份。如果你正在构建客服聊天机器人之类的对话系统时，这项功能尤其有用。

比如，可以通过以下示例创建一个对话系统，该系统能够基于问题给出技术性和科学的回答。你可以关注我们是如何通过指令明确地告诉模型应该如何表现。这种应用场景有时也被称为角色提示（Role Prompting）。

我们的 AI 助理给出的回答非常技术对吧？下面，我们让它给出更易于理解的答案。

我想我们应该取得了一些进展，你也可以继续改进它。如果你再添加更多的示例，可能会得到更好的结果。

6.代码生成

大语言模型另外一个有效的应用场景是代码生成。在此方面，Copilot 就是一个很好的示例。你可以通过一些有效的提示词执行代码生成任务。让我们来看一下下面的例子。

我们先用它写个简单的用户欢迎程序：

你看，我们甚至都不需要指定要使用的编程语言。

来，我们再稍微升级一下。下面的例子会向你展示提示词会让大语言模型变得多么强大。

挺厉害的嘛。本例中，我们提供了有关数据库架构并要求它生成有效的 MySQL 查询。

7.推理

目前对于大语言模型来说，推理任务算是最具有挑战性的了。推理任务最让人兴奋的地方就是可以促使各种复杂的应用程序从大语言模型中诞生。

目前，涉及数学能力的推理任务已经有了一些改进。对于当前的大型语言模型来说，执行推理任务可能会有一些难度，因此就需要更高级的提示词工程技术。我们会在后面的指南中介绍这些高级技术。现在，我们将介绍几个基本示例来展示算术功能。

来，我们加大难度：

文章来源：https://www.promptingguide.ai/introduction