Elasticsearch：RAG vs Fine-tunning (大语言模型微调)

Elasticsearch：RAG vs Fine-tunning (大语言模型微调)

news/2024/12/24 0:05:43/文章来源:https://blog.csdn.net/UbuntuTouch/article/details/134226686

如果你对 RAG 还不是很熟悉的话，请阅读之前的文章 “Elasticsearch：什么是检索增强生成 - RAG？”。你可以阅读文章 “Elasticsearch：在你的数据上训练大型语言模型 (LLM)” 来了解更多关于如何训练你的模型。在今天的文章中，我们来讲述 RAG 及大语言模型的优缺点。这篇文章旨在优化语言模型的终极指南。

介绍

你是否正在努力充分利用大型语言模型 (LLM)？你不是一个人。好消息是，你可以选择：检索增强生成 (RAG) 和微调。但哪一款适合你呢？让我们来看看吧。

两大巨头：RAG 和微调

RAG：想象一下你的 LLM 是一名侦探。 RAG 允许它在解决案件（回答你的查询）之前从各种来源搜索线索（数据）。
- 该方法帮助模型搜索并使用外部信息来回答问题或生成文本。可以把它想象成一个学生在回答问题之前先在教科书中查找事实。

在很多的情况下，我们可以很方便地使用 Elasticsearch 来作为向量数据库，并轻松地实现 RAG。详细实现请参阅文章 “ChatGPT 和 Elasticsearch：OpenAI 遇见私有数据（一）”。

微调：将其视为 LLM 的专门训练营。它针对特定游戏（任务）磨练自己的技能，使其成为明星玩家。
- 在这里，你可以根据特定数据训练已经构建的模型，以使其更好地完成特定任务。这就像一位厨师已经知道如何烹饪，但参加了一门特殊的课程来改进特定的食谱。

是什么让他们与众不同

目标：RAG 是你的数据侦探，而微调则将你的模型变成专家。
轻松又省钱：RAG 就像按照菜谱做饭一样；它更容易而且通常更便宜。 Fine-Tuning 就像创造一道美食；它很复杂，但可以更令人满意。

风险：为什么你的选择很重要

明智地选择，否则你最终可能会得到一个低效、昂贵且难以管理的模型。以下是如何避免陷阱。

你的清单：做出正确的选择

你需要外部信息吗？选择 RAG。
想要自定义行为吗？选择微调。
有很多具体数据吗？微调会发光。
数据不断变化？ RAG 保持更新。
需要解释模型的答案吗？ RAG 提供更高的透明度。

现实世界场景：哪一个获胜？

我们将探讨如何在 RAG 和微调之间进行选择，以完成总结文章、在公司环境中回答问题以及自动化客户支持等任务。

超越基础：需要考虑的其他因素

从可扩展性和实时需求到道德和现有系统，我们将讨论其他可能使天平有利于一种方法而不是另一种方法的因素。

结论：你的成功之路

请记住，最好的方法是符合你的特定需求和目标的方法。在许多情况下，你需要同时使用两者。因此，评估、选择和优化你的 LLM 成功之路！

更多有关 Elasticsearch 在大数据及人工智能方面的文章，请参阅 “AI”。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/182284.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MFC 基础篇(一)

MFC 基础篇(一)

目录一.SDK编程二.为什么要学MFC？ 三.MFC能做什么？ 四.MFC开发环境搭建五.MFC项目创建六.消息映射机制一.SDK编程 Application Programming Interface 应用程序编程接口。 Software Development Kit 软件开发工具包，一般会包括A…

阅读更多...

【LeetCode】每日一题 2023_11_6 最大单词长度乘积

【LeetCode】每日一题 2023_11_6 最大单词长度乘积

文章目录刷题前唠嗑题目：最大单词长度乘积题目描述代码与解题思路偷看大佬题解结语刷题前唠嗑 LeetCode? 启动！！！ 题目：最大单词长度乘积题目链接：318. 最大单词长度乘积题目描述代码与解题思路…

阅读更多...

飞书开发学习笔记(二)-云文档简单开发练习

飞书开发学习笔记(二)-云文档简单开发练习

飞书开发学习笔记(二)-云文档简单开发练习一.云文档飞书开发环境API 首先还是进入开放平台飞书开放平台：https://open.feishu.cn/app?langzh-CN 云文档相关API都在“云文档”目录中，之下又有"云空间",“文档”，“电子表格”&a…

阅读更多...

java智能在线考试系统源码基于SpringBoot+Vue开发

java智能在线考试系统源码基于SpringBoot+Vue开发

java智能在线考试系统源码基于SpringBootVue开发环境介绍语言环境：Java: jdk1.8 数据库：Mysql: mysql5.7 应用服务器：Tomcat: tomcat8.5.31 开发工具：IDEA或eclipse 开发技术：SpringbootVue 项目简介&…

阅读更多...

手拿5份offer，最高18k! 95后艺术生转行后台网优，这个火花有点大！

手拿5份offer，最高18k! 95后艺术生转行后台网优，这个火花有点大！

当艺术生碰上理工科，会有怎样的火花？在大众的刻板认知里，艺术和理工科就像两条很少重合的平行线，双方从业者在自己的行业下按部就班，规划未来。来自东北长春的W同学却打破了常人的认知，身为美术老师的他却…

阅读更多...

观察者模式——解决解耦的钥匙

观察者模式——解决解耦的钥匙

● 观察者模式介绍观察者模式是一个使用频率非常高的模式，它最常用的地方是GUI系统、订阅——发布系统。因为这个模式的一个重要作用就是解耦，将被观察者和观察者解耦，使得它们之间依赖性更小，甚至做到毫无依赖。以CUI系统来说&a…

阅读更多...

Unisat的核心成员神秘失踪两个月后，CHAX横空出世

Unisat的核心成员神秘失踪两个月后，CHAX横空出世

在这个快速变化的数字世界中，故事似乎总是在不断上演。最近，一则消息在加密货币社区中引起了轩然大波：Unisat的核心成员神秘失踪两个月后，CHAX横空出世，带来了一股新的风潮。受够了BRC20-Swap多次难产，落地…

阅读更多...

2023年11月5日网规考试备忘

2023年11月5日网规考试备忘

早上题目回忆： pki体系 ipsec，交换安全（流量抑制） aohdlc bob metclaf —ethernet pon tcp三次握手 OSPF lsa？交换机组ospf配置问题，ping网关可通，AB不通 raid6 300G*8 网络利用率停等协议10…

阅读更多...

VUE多语言i18n配置

VUE多语言i18n配置

1、i18n官网格式化 | Vue I18n 2、安装i18n 8---指版本号 // vue2必须安装8版本的i18n包，vue3必须安装9版本的i18n包。 npm i vue-i18n8 3、卸载i18n npm uninstall vue-i18n 4、安装 js-cookie npm install vue-cookies --save 5、代码 5.1 main.js /…

阅读更多...

ActiveMQ、RabbitMQ、RocketMQ、Kafka介绍

ActiveMQ、RabbitMQ、RocketMQ、Kafka介绍

一、消息中间件的使用场景消息中间件的使用场景总结就是六个字：解耦、异步、削峰 1.解耦如果我方系统A要与三方B系统进行数据对接，推送系统人员信息，通常我们会使用接口开发来进行。但是如果运维期间B系统进行了调整，或者推送过…

阅读更多...

Java后端开发——JDBC组件

Java后端开发——JDBC组件

JDBC（Java Database Connectivity）是Java SE平台的一种标准API，它提供了一种标准的方法来访问关系型数据库，使得Java程序能够与各种不同的数据库进行交互，这篇文章我们来进行实验体验一下。自定义JDBC连接工具类 1.编…

阅读更多...

stm32整理（三）ADC

stm32整理（三）ADC

1 ADC简介 1.1 ADC 简介 12 位 ADC 是逐次趋近型模数转换器。它具有多达 19 个复用通道，可测量来自 16 个外部源、两个内部源和 VBAT 通道的信号。这些通道的 A/D 转换可在单次、连续、扫描或不连续采样模式下进行。ADC 的结果存储在一个左对齐或右对齐的 16 位…

阅读更多...

6款优质办公软件，个个都是效率神器，可免费使用

6款优质办公软件，个个都是效率神器，可免费使用

今天给大家分享6款优质的办公软件，这些软件不仅功能强大，还可以免费使用，让你高效完成工作。 Todo清单——待办事项软件 Todo清单是一款强大的跨平台待办事项和时间管理软件。它可以帮助用户记录、跟踪和完成待办事项。通过创建清单&#xff…

阅读更多...

异星工场入门笔记-02-一个重要地学习方法

异星工场入门笔记-02-一个重要地学习方法

编程学习地整个过程，最重要的工具就是电脑，其中有一个重点就是可以无成本的重复测试，这大大降低了难度，节约了时间。真正难以学习的不是技术本身，而是材料成本和时间成本，降低这两个因素平地起高楼根本不是…

阅读更多...

【MySQL】MVCC机制（undo log，read view）

【MySQL】MVCC机制（undo log，read view）

文章目录前言一. 预备知识二. 模拟MVCC三. Read View四. RC与RR的本质区别结束语前言 MVCC（多版本并发控制）是一种用来解决读-写冲突的无锁并发控制 MVCC为事务分配单向增长的事务ID，为每个修改保存一个版本，版本与事物ID相关联…

阅读更多...

关闭 win10自动更新、关闭激活

关闭 win10自动更新、关闭激活

做工控或者数据大屏、服务器之类的，都不想系统自动更新，不知不觉自动重启类。激活过了一段时间，又要重新激活这些事情，所以需要手工去关闭这些服务。一、关闭 win10自动更新首先打开服务，找到windows update: window +R 输入:Services.msc 停止windows update ，然…

阅读更多...

【实战Flask API项目指南】之一概述

【实战Flask API项目指南】之一概述

实战Flask API项目指南之概述本系列文章将带你深入探索实战Flask API项目指南，通过跟随小菜的学习之旅，你将逐步掌握Flask在实际项目中的应用。让我们一起踏上这个精彩的学习之旅吧！ 前言小菜是一个Python编程爱好者，他目前…

阅读更多...

3dmax经常渲染失败？优化方法提升渲染质量！

3dmax经常渲染失败？优化方法提升渲染质量！

3DMAX是一款专业的三维建模、动画和渲染软件，被广泛应用于影视、游戏、建筑、广告等领域。而云渲染是一种利用云计算技术，将渲染任务分配到海量的服务器上进行并行计算的服务，能够显著提升渲染效率和质量，节省时间和成本。使用…

阅读更多...

Spring之AOP

Spring之AOP

动态代理代理模式的解释：为其他对象提供一种代理以控制对这个对象的访问，增强一个类中的某个方法，对程序进行扩展。比如，现在存在一个UserService类： public class UserService {public void test() {System.out…

阅读更多...

正则表达式续篇

正则表达式续篇

位置锚定： ^:行首锚定，表示以什么为开头例如： $:行尾锚定，表示以什么为结尾例如： ^：匹配的是空行例如： ^root$：匹配整行，而且整行只能有这一个字符串实验&#x…

阅读更多...

最新文章

推荐文章