LLM生成式 AI 项目生命周期Generative AI project lifecycle

news/2024/11/15 1:45:42/文章来源:https://blog.csdn.net/zgpeace/article/details/132418370

在本课程的其余部分中，您将学习开发和部署LLM驱动应用所需的技巧。在这个视频中，您将了解一个能帮助您完成此工作的生成式AI项目生命周期。此框架列出了从构思到启动项目所需的任务。到课程结束时，您应该对您需要做的重要决策、可能遇到的困难以及需要开发和部署应用程序的基础设施有一些良好的直觉。这是整个生命周期的图表。
在这里插入图片描述

我们将逐步讨论它。

任何项目最重要的步骤是尽可能准确和具体地定义范围。
在这里插入图片描述

正如您在这门课程中看到的，LLMs能够执行许多任务，但它们的能力在很大程度上取决于模型的大小和架构。您应该思考LLM在您特定应用中的功能。

您是否需要模型能够执行许多不同的任务，包括长文本生成或具有高度的能力，在这里插入图片描述
还是任务更为具体，例如命名实体识别，所以您的模型只需要擅长一件事.

正如您在课程的其余部分中所看到的，真正明确您需要模型做什么可以为您节省时间，更重要的是，计算成本。一旦您满意，并且已经足够确定了模型的要求，就可以开始开发。

您的第一个决定将是从零开始训练自己的模型还是使用现有的基础模型。通常，您将从一个现有的模型开始，尽管在某些情况下，您可能会发现有必要从头开始训练一个模型。
在这里插入图片描述

您将在本周稍后了解关于此决策背后的考虑因素，以及一些经验法则，以帮助您估计训练自己的模型的可行性。

拥有了模型后，下一步是评估其性能并进行额外的训练，以满足您的应用程序的需求。
在这里插入图片描述

正如您本周早些时候所看到的，提示工程有时足以使您的模型表现得很好，所以您可能会首先尝试上下文学习，使用适合您的任务和用例的例子。
在这里插入图片描述

但是，仍然存在一些情况，即使在一个或几个短的推理中，模型也可能无法像您所希望的那样表现得很好，那么您可以尝试微调模型。
在这里插入图片描述

这种有监督的学习过程将在第2周详细介绍，您将有机会在第2周的实验室中自己尝试微调一个模型。

随着模型变得更加强大，确保它们在部署中表现良好并与人类的偏好一致变得越来越重要。在第3周，您将学习一种称为“与人类反馈的强化学习”的额外微调技巧，这可以帮助确保您的模型表现得很好。
在这里插入图片描述

所有这些技术的一个重要方面是评估。下周，您将探索一些可以用来确定模型的性能或与您的偏好有多么一致的指标和基准。
在这里插入图片描述
请注意，这种适应和对齐应用程序开发的阶段可能是高度迭代的。
您可能会首先尝试提示工程和评估输出，

然后使用微调来提高性能，
在这里插入图片描述

然后再次回顾和评估提示工程，以获得所需的性能。
在这里插入图片描述

最后，当您拥有满足您的性能需求并且对齐得很好的模型时，您可以将其部署到您的基础设施中并将其与您的应用程序集成。
在这里插入图片描述

在此阶段，一个重要的步骤是优化模型以供部署。这可以确保您最大限度地利用您的计算资源，并为应用程序的用户提供最佳的体验。
在这里插入图片描述

最后但同样重要的一步是考虑您的应用程序需要正常工作的任何其他基础设施。
在这里插入图片描述

LLM存在一些基本的局限性，仅通过培训很难克服，例如当它们不知道答案时发明信息，或者它们执行复杂的推理和数学的能力有限。

在本课程的最后部分，您将学习一些可以用来克服这些局限性的强大技巧。

我知道这里有很多事情要考虑，但是现在不用担心一次性吸收所有内容。在您探索每个阶段的详细信息时，您将在课程中一次又一次地看到这个架构。

参考

https://www.coursera.org/learn/generative-ai-with-llms/lecture/21Nwn/generative-ai-project-lifecycle

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/100294.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

dockerfile编写LNMP

dockerfile编写LNMP

目录 1. 项目环境 2. 服务器环境二、部署nginx（容器IP为192.168.158.26） 1、整个Dockerfile文件内容编辑 2、配置nginx.conf文件 3、构建镜像三、部署mysql 1、整个Docker文件内容 3、生成镜像 4、启动镜像容器 5、验证mysql 四、PHP部署 1…

阅读更多...

机器学习｜决策树：数学原理及代码解析

机器学习｜决策树：数学原理及代码解析

机器学习｜决策树：数学原理及代码解析决策树是一种常用的监督学习算法，适用于解决分类和回归问题。在本文中，我们将深入探讨决策树的数学原理，并提供 Python 示例代码帮助读者更好地理解和实现该算法。决策树数学原…

阅读更多...

Go语言里面的各种疑难杂症

Go语言里面的各种疑难杂症

什么是闭包？闭包有什么缺陷？ func AddUpper() func(int)int{var n int 10return func (x int) int{n nxreturn n} }func main(){f : AddUpper()fmt.Println(f(1))//11fmt.Println(f(2))//13fmt.Println(f(3))//16 }（1） AddUpper…

阅读更多...

PyTorch学习笔记（十六）——利用GPU训练

PyTorch学习笔记（十六）——利用GPU训练

一、方式一网络模型、损失函数、数据（包括输入、标注） 找到以上三种变量，调用它们的.cuda()，再返回即可 if torch.cuda.is_available():mynn mynn.cuda() if torch.cuda.is_available():loss_function loss_function.cuda(…

阅读更多...

【操作系统】虚拟内存相关分段分页页面置换算法

【操作系统】虚拟内存相关分段分页页面置换算法

虚拟内存是什么？ 【进程地址空间虚拟地址空间C/C程序地址空间就是那个4G的空间】虚拟内存是操作系统内核为了对进程地址空间进行管理，而设计的一个逻辑意义上的内存空间概念。在程序运行过程中，虚拟内存中需要被访问的部分会被映射到物理内…

阅读更多...

安防视频监控平台EasyCVR视频集中存储平台接入RTSP设备出现离线情况的问题解决方案

安防视频监控平台EasyCVR视频集中存储平台接入RTSP设备出现离线情况的问题解决方案

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快，可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等，以及支持厂家私有协议与SDK接入，包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安…

阅读更多...

$用户新增预测——baseline学习笔记$

用户新增预测——baseline学习笔记

一、赛题理解 1. 赛题名称用户新增预测挑战赛 2. 赛题数据集赛题数据由约62万条训练集、20万条测试集数据组成，共包含13个字段。其中uuid为样本唯一标识，eid为访问行为ID，udmap为行为属性，其中的key1到key9表示不同的行为属性…

阅读更多...

什么是RNN(循环神经网络)

什么是RNN(循环神经网络)

什么是RNN(循环神经网络) 循环神经网络(Recurrent Neural Network)，在识别图像时，输入的每张图片都是孤立的，认出这张图片是苹果，并不会对认出下一张图片是梨造成影响。但对语言来说，顺序是十分重要的，“…

阅读更多...

07 mysql5.6.x docker 启动, 无 config 目录导致客户端连接认证需要 10s

07 mysql5.6.x docker 启动, 无 config 目录导致客户端连接认证需要 10s

前言呵呵最近再一次环境部署的过程中碰到了这样的一个问题我基于 docker 启动了一个 mysql 服务, 然后挂载出了数据目录和配置目录, 没有手动复制配置目录出来, 所以配置目录是空的然后我基于 docker 启动了一个 nacos, 配置数据库设置为上面的这个 mysql 然后启…

阅读更多...

ARM汇编【1】：数据类型

ARM汇编【1】：数据类型

与高级语言类似，ARM支持对不同数据类型的操作。我们可以加载或存储的数据类型可以是有符号和无符号字、半字或字节。这些数据类型的扩展名是：-h或-sh表示半字，-b或-sb表示字节，不表示字的扩展名。有符号数据类型或无符号数据类型之…

阅读更多...

Consistency Models终结扩散模型

Consistency Models终结扩散模型

最近看到一篇论文，觉得特别有意思，并且在学术界引起了不小的动静，他就是一致性模型，据说图像生成效果快、质量高，并且还可以实现零样本图像编辑，即不进行一些视觉任务训练，可以实现图像超分、修…

阅读更多...

基于springboot+vue的论坛系统(前后端分离)

基于springboot+vue的论坛系统(前后端分离)

博主主页：猫头鹰源码博主简介：Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战主要内容：毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询文末联系获取项目介绍…

阅读更多...

改进YOLO系列：3.添加SOCA注意力机制

改进YOLO系列：3.添加SOCA注意力机制

添加SOCA注意力机制 1. SOCA注意力机制论文２. SOCA注意力机制原理３. SOCA注意力机制的配置３.１common.py配置３.２yolo.py配置３.３yaml文件配置1. SOCA注意力机制论文暂未找到２. SOCA注意力机制原理３. SOCA注意力机制的配置３.１common.py配置 ./models/common.p…

阅读更多...

Docker+Jmeter+InfluxDB+Grafana 搭建性能监控平台

Docker+Jmeter+InfluxDB+Grafana 搭建性能监控平台

当今互联网发展迅速，应用程序的性能监控显得越来越重要。 DockerJmeterInfluxDBGrafana 是一种常用的性能监控平台，可以帮助开发者快速搭建一套可靠的监控体系。在本文中，我们将介绍如何使用这些工具搭建性能监控平台，以便开发人…

阅读更多...

实现chatGPT 聊天样式

实现chatGPT 聊天样式

效果图代码： <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Chat Example</title&g…

阅读更多...

第9步---MySQL的索引和存储引擎

第9步---MySQL的索引和存储引擎

第9步---MySQL的索引和存储引擎 1.索引 1.1分类索引可以快速的找出具有特定值的行。不用从头开始进行寻找了。类别 hash和btree hash 根据字段值生生成一个hash的值快速的进行定位到对应的行的值可能会出现相同的值，找到对应的空间会出现对应的值 btree树…

阅读更多...

CMA和CNAS是什么？两者有什么用途和区别？

CMA和CNAS是什么？两者有什么用途和区别？

CMA和CNAS是两个不同的概念，它们分别有着自己的用途和区别。 CMA是中国计量认证（China Metrology Accreditation）的缩写，是根据《中华人民共和国计量法》及其配套法规的规定，由国家质量监督检验检疫总局授权的计量认证…

阅读更多...

HTML a标签

HTML a标签

<a>标签定义一个超链接。它有如下主要属性： href：指定链接的地址，可以是一个URL、文件路径或锚点。target：指定链接在何处打开。其值包括： _blank：在新窗口或新标签页打开链接。_self：在…

阅读更多...

Go语言基础之切片

Go语言基础之切片

切片切片（Slice）是一个拥有相同类型元素的可变长度的序列。它是基于数组类型做的一层封装。它非常灵活，支持自动扩容。切片是一个引用类型，它的内部结构包含地址、长度和容量。切片一般用于快速地操作一块数据集合切片的定义…

阅读更多...

事物有哪些特性？MySQL 如何保证事物的四大特性？

事物有哪些特性？MySQL 如何保证事物的四大特性？

目录 1.事物有哪些特性 2. MySQL 如何保证事物的四大特性 3. 事物的隔离级别 1.事物有哪些特性 1.1 何为事物 ？ 事物就是把一件事情的多个步骤，多个操作，打包成一个步骤，一个操作。其中任意一个步骤执行失败，都会进…

阅读更多...

最新文章

推荐文章