LLMs之APE：基于Claude的Prompt Improver的简介、使用方法、案例应用之详细攻略

Prompt Improver的简介

0、背景痛点

1、优势

2、实现思路

Prompt优化

示例管理

提示词评估

Prompt Improver的使用方法

1、使用方法

Prompt Improver的案例应用

1、Kapa.ai的迁移实践

Prompt Improver的简介

Anthropic推出了Prompt Improver，支持通过Claude自动优化提示词，以及在Workbench中直接管理和生成多示例输入/输出对。Prompt Improver通过系统性的提示词优化和示例管理功能，显著提升了AI模型的准确性、一致性和性能，为开发者提供了一套高效、可靠的提示词工程工具。Prompt Improver通过自动化和结构化方法，极大地简化了提示词优化和管理的过程，为开发者提供了高效的工具链。这一工具不仅提高了模型响应的准确性和一致性，还支持灵活的提示词迁移和格式调整，是开发可靠AI应用的关键助力。

相关文章地址：Improve your prompts in the developer console \ Anthropic

0、背景痛点

>> 高质量提示词的重要性：提示词的质量直接决定了AI模型对任务的响应效果。然而，优秀的提示词设计（Prompt Engineering）不仅耗时，还因不同模型提供商的差异而存在标准不统一的困扰。
>> 迁移复杂性：从其他模型迁移至Claude需要对提示词进行优化，而手动调整的过程可能会出错或效率低下。
>> 标准化需求：当前提示词中的示例缺乏统一的结构和高效的格式，使得模型输出的准确性和一致性难以保障。

1、优势

>> 效率提升：自动优化和生成功能显著缩短提示词优化的时间。
>> 精确性增强：优化后的提示词能够显著提高模型的任务完成度（例如多标签分类任务的准确率提升30%）。
>> 一致性与格式控制：通过标准化和格式化，提示词输出的格式一致性达到100%。
>> 适应性强：支持迁移其他模型的提示词，灵活调整输出格式（如XML到JSON）。

2、实现思路

Prompt优化

>> 连锁思维（Chain-of-thought reasoning）：为Claude提供推理步骤，提升回答的准确性和可靠性。
>> 示例标准化：将示例转化为统一的XML格式，增强清晰度和可处理性。
>> 示例丰富化：增加符合优化提示词逻辑的连锁思维示例。
>> 重写提示词：优化提示词结构并修正语法或拼写问题。
>> 预填补充（Prefill addition）：在Assistant消息中预填内容，指导Claude行动并确保输出格式。

示例管理

>> 结构化示例添加：开发者可以在Workbench中添加或编辑明确的输入/输出示例对。
>> Claude驱动的示例生成：自动创建合成示例输入和输出，简化示例创建流程。

提示词评估

>> 理想输出列：在Evaluations标签页中提供可选的“理想输出”列，便于对模型响应进行一致的5分制评分。
>> 循环反馈优化：允许开发者多轮反馈，直至提示词和示例达到预期效果。

Prompt Improver的使用方法

1、使用方法

>> 登录Anthropic Console。
>> 在控制台中使用Prompt Improver上传或输入提示词。
>> 选择优化选项（链式思维、标准化、重写等），并添加示例或利用Claude自动生成。
>> 在Evaluations页面测试提示词性能，比较理想输出和实际结果。
>> 提供反馈并重复优化，直到提示词达到预期效果。

登录地址：App unavailable \ Anthropic