【大模型基础_毛玉仁】3.5 Prompt相关应用


目录

    • 3.5 相关应用
      • 3.5.1 基于大语言模型的Agent
      • 3.5.2 数据合成
      • 3.5.3 Text-to-SQL
      • 3.5.4 GPTs


3.5 相关应用

Prompt工程应用广泛,能提升大语言模型处理基础及复杂任务的能力,在构建Agent、数据合成、Text-to-SQL转换和设计个性化GPTs等方面不可或缺。

.

3.5.1 基于大语言模型的Agent

智能体(Agent)是能自主感知并行动以达成目标的实体,作为实现通用人工智能(AGI)的有力手段,被期望在多样化环境中完成复杂任务并展现类人智能。

传统Agent依赖简单启发式策略函数,在受限环境中学习操作,难以复制人类决策过程,限制了其能力与应用范围。基于大语言模型的Agent展现出强大决策能力,拥有全面通用知识,即便缺乏训练数据,也能进行规划、决策、工具调用等复杂行动。

Prompt工程在Agent中至关重要。Agent系统以大语言模型为核心控制器,依赖Prompt完成规划、决策、行动等操作。其框架包括:配置模块(Profile)、记忆模块(Memory)、计划模块(Planning)和行动模块(Action),Prompt工程技术贯穿整个流程,为各模块提供支持。

图3.30: 基于大语言模型的Agent框架流程示意图
在这里插入图片描述

在Agent中:

  • 配置模块:利用Prompt工程的角色扮演技术定义Agent角色,将其背景、技能等信息嵌入交互Prompt;

  • 记忆模块:作为存储中心,通过检索增强等技术并借助上下文学习优化查询,将获取的记忆添加到交互Prompt中辅助决策;

  • 计划模块:借助Prompt工程的思维链和上下文学习技术,将复杂任务分解为子任务并调控粒度;

  • 行动模块:将计划转化为行动步骤,通过工具API接口生成并执行代码以实现目标。这四个组件分工协作完成复杂任务。

.

3.5.2 数据合成

数据质量是决定大语言模型性能的关键因素之一,因为“Garbage in, Garbage out”,即模型表现高度依赖训练数据的质量,无论模型架构、训练算法和计算资源多么优秀。然而,获取高质量数据面临挑战:

  • 公共领域:高质量语言数据预计2026年左右耗尽;

  • 特定领域:垂直数据因隐私保护和标注难度等问题难以大量提供,限制了模型的进一步发展。

数据合成作为补充或替代真实数据的手段,因可控、安全、低成本等优势受关注,特别是利用大语言模型生成训练数据成为研究热点。

通过Prompt工程技术,利用大语言模型的思维和指令跟随能力合成高质量数据,Self-Instruct是代表性方法。它通过构建Prompt,多步骤调用大语言模型,依据少量指令数据合成大量多样化指令数据。

如金融场景中,先人工标注少量金融指令数据,再用Self-Instruct方法调用大语言模型,将数据扩展至数万条且保持高质量和多样性。

图3.31: Self-Instruct 流程示例图
在这里插入图片描述

Self-Instruct 包含构建任务池、指令生成、指令分类、数据生成、数据过滤五个步骤。

  • 任务池:存储初始及后续生成的指令数据;

  • 指令生成:参考任务池样例生成指令部分;

  • 指令分类:将指令分为分类任务和生成任务,不同模式下生成数据方式不同;

  • 数据生成:根据已有指令生成输入和回答部分;

  • 数据过滤:去除低质量数据,保证指令数据质量。

它从有限的手动编写任务种子集开始,通过与大语言模型交互,不断生成指令数据,扩充原始数据集。

.

3.5.3 Text-to-SQL

Text-to-SQL:将自然语言查询翻译成可执行SQL语句。

C3是最早使用大语言模型进行零样本Text-to-SQL的方法,其核心是Prompt工程设计,包括三个关键部分:清晰提示(ClearPrompting)、提示校准(Calibration with Hints)和一致输出(Consistent Output)。

图3.33: C3 方法整体框架图
在这里插入图片描述

在模型输入端,清晰提示包含:

  • 清晰布局:通过明确符号划分指令、上下文和问题,提升模型理解能力;

  • 清晰上下文:设计零样本Prompt,指示模型从数据库中召回相关信息,提高SQL生成准确性。

为应对模型固有偏差,C3采用提示校准策略,利用包含历史对话的上下文提示,将先验知识纳入模型,通过设定模型为SQL专家角色并引导其遵循预设提示,有效校准偏差。

在模型输出端,C3采用输出校准,应用Self-Consistency方法对多种推理路径采样,选择最一致的答案,增强输出稳定性,保持SQL查询一致性。

.

3.5.4 GPTs

GPTs是OpenAI推出的支持用户自定义的GPT应用,允许用户通过编写Prompt, 添加工具等方式创建定制版的GPT应用,也可以使用别人分享的GPTs模型。

.


其他参考:【大模型基础_毛玉仁】系列文章


声明:资源可能存在第三方来源,若有侵权请联系删除!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37991.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

主成分分析PCA与奇异值分解SVD

线性代数 SVD 奇异值分解(Singular Value Decomposition,简称 SVD)是线性代数中的一种基本工具,它将任意一个 (m * n) 矩阵 (A) 分解成三个简单矩阵的乘积,即 其中: (U) 是一个 (m*m) 的正交&#xff08…

自主代理的摩尔定律:AI 的指数级革命

图像由 Gemini 生成 前言:AI 正在以超过摩尔定律的速度迅速提升其自主工作能力,研究显示,AI 能够可靠完成的任务时长正以每 7 个月翻一倍的速度增长。这种指数级的发展趋势意味着,AI 不再只是应对简单问答或短任务的工具&#xff…

气膜文化馆:打造沉浸式文娱新空间—轻空间

演唱会、展览、音乐剧……都能办? 当然!气膜文化馆不仅适用于体育赛事,在文化娱乐方面同样大放异彩! 声学优化,打造极致听觉体验 气膜文化馆采用专业声学设计,避免传统场馆的回声干扰,提供更清…

【数据标准】数据标准化框架体系-对象类数据标准

导读:对象类数据标准化框架通过统一数据定义、分类和标记,解决数据孤岛与不一致问题,支撑数据分析、AI应用与合规需求。企业需结合自身业务特性,灵活选择国际标准(如ISO)、行业规范或自建体系,并…

【江协科技STM32】软件SPI读写W25Q64芯片(学习笔记)

SPI通信协议及S为5Q64简介:【STM32】SPI通信协议&W25Q64Flash存储器芯片(学习笔记)-CSDN博客 STM32与W25Q64模块接线: SPI初始化: 片选SS、始终SCK、MOSI都是主机输出引脚,输出引脚配置为推挽输出&…

C 语 言 --- 扫 雷 游 戏(初 阶 版)

C 语 言 --- 扫 雷 游 戏 初 阶 版 代 码 全 貌 与 功 能 介 绍扫雷游戏的功能说明游 戏 效 果 展 示游 戏 代 码 详 解game.htest.cgame.c 总结 💻作 者 简 介:曾 与 你 一 样 迷 茫,现 以 经 验 助 你 入 门 C 语 言 💡个 人 主…

数据库基础知识

目录 一、什么是数据库? 二、基本使用方法 (1)启动服务器进程 (2)连接服务器 (3)基本sql语句 三、MySQL架构 四、SQL语句分类 五、存储引擎是什么 一、什么是数据库? 数据库…

在线生成自定义二维码

在线生成自定义二维码 1. 引言 二维码已成为现代互联网的重要工具,广泛应用于链接分享、支付、身份认证等场景。然而,很多在线二维码生成工具功能有限,难以满足个性化需求。如果你需要 自定义颜色、Logo、不同形状的二维码,那么…

DeepSeek处理多模态数据的技术要点和实现方式

DeepSeek具备处理多模态数据的能力,以下是相关技术要点和实现方式。 1. ‌多模态模型架构‌ ‌单流/双流网络‌:通过将文本和图像输入统一编码器(单流)或分别编码后交互(双流)实现模态融合‌。‌预训练模…

系统架构设计知识体系总结

1.技术选型 1.什么是技术选型? 技术选型是指评估和选择在项目或系统开发中使用的最合适的技术和工具的过程。这涉及考虑基于其能力、特性、与项目需求的兼容性、可扩展性、性能、维护和其他因素的各种可用选项。技术选型的目标是确定与项目目标相符合、能够有效解…

数智读书笔记系列022《算力网络-云网融合2.0时代的网络架构与关键技术》读书笔记

一、书籍核心价值与定位 1.1 书籍概述:中国联通研究院的权威之作 《算力网络 —— 云网融合 2.0 时代的网络架构与关键技术》由中国联通研究院算力网络攻关团队精心撰写,是业界首部系统性探讨云网融合 2.0 与算力网络的专著。在云网融合从 1.0 迈向 2.0 的关键节点,本书的…

知识图谱中NLP新技术

知识图谱与自然语言处理(NLP)的结合是当前人工智能领域的前沿方向,其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面,系统梳理知识图谱中NLP的最新进展: 一、核心技术突…

ASP.NET Web的 Razor Pages应用,配置热重载,解决.NET Core MVC 页面在更改后不刷新

Razor Pages应用,修改页面查看修改效果,如果没有热重载,改一句话跑一次,这个活就没法干了。 1、VS2022中的NuGet中安装RuntimeCompilation Microsoft.AspNetCore.Mvc.Razor.RuntimeCompilation 需要配套你的.net sdk版本&#x…

DeepSeek(8):结合Kimi-PPT助手一键生成演示报告

1 生成内容 在Deepseek中生成内容: 帮我创建年度计划,描述《智能枕头》产品的如何在全国销售,计划切分到每个月。从而让我们的老板和团队对报告充满信息。输出的内容我需要放到ppt中进行展示。 使用Deepseek R1模型,如下&#x…

到底爱不爱我

L2-3 到底爱不爱我 古代少女有了心上人时,会悄悄折一条树枝,揪那枝上的叶子,揪一片叶子念一句“爱我”,再揪一片念一句“不爱我”…… 这样揪落最后一片叶子的时候,看看是停在“爱”还是“不爱”。 但聪明的慧娘一眼洞…

网络华为HCIA+HCIP 网络编程自动化

telnetlib介绍 telnetlib是Python标准库中的模块。它提供了实现Telnet功能的类telnetlib.Telnet。这里通过调用telnetlib.Telnet类里的不同方法实现不同功能。 配置云

【10】高效存储MongoDB的用法

目录 一、什么是MongoDB 二、准备工作 (1)安装MongoDB ​(2)安装pymongo库 三、连接MongoDB 四、指定数据库 五、指定集合 六、插入数据 (1) insert 方法 (2)insert_one(…

datawhale组队学习--大语言模型—task4:Transformer架构及详细配置

第五章 模型架构 在前述章节中已经对预训练数据的准备流程(第 4 章)进行了介绍。本章主 要讨论大语言模型的模型架构选择,主要围绕 Transformer 模型(第 5.1 节)、详细 配置(第 5.2 节)、主流架…

Tomcat虚拟主机配置详解:Centos环境下多域名部署(详细教程!)

🏡作者主页:点击! Tomcat服务器📝专栏:点击! 🐧Linux高级管理防护和群集专栏:点击! ⏰️创作时间:2025年3月18日14点14分 最近在折腾 Tomcat 的时候&…

Java+Html实现前后端客服聊天

文章目录 核心组件网络通信层事件调度层服务编排层 Spring实现客服聊天技术方案对比WebScoket建立连接用户上线实现指定用户私聊群聊离线 SpringBootWebSocketHtmljQuery实现客服聊天1. 目录结构2. 配置类3. 实体类、service、controller4. ChatWebSocketHandler消息处理5.前端…