Llama 2 模型

Llama 2 模型

news/2024/12/21 16:45:33/文章来源:https://blog.csdn.net/m0_62032391/article/details/136944018

非常清楚！！！Llama 2详解 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/649756898?utm_campaign=shareopn&utm_medium=social&utm_psn=1754103877518098432&utm_source=wechat_session一些补充理解：

序列化：将文本进行Tokenization，将其切分成单词或字符，形成Token序列。之后将文本序列转换为索引序列(语料库中的index) ---- sentencepiece （开源的文本Tokenzier工具）

input_tensor:[batch_size,seq_len,hidden_dim]

batch_size：批量大小，每次处理的样本数

seq_len：句子的长度

hidden_dim：每个word映射的embedding长度

softmax：

用于多类分类问题的激活函数，在多类分类问题中，超过两个类标签则需要类成员关系。对于长度为K的任意实向量，Softmax函数可以将其压缩为长度为K，值在[0,1]范围内，并且向量中元素的总和为1的实向量。

注意力机制（单头、多头）

Llama 2的模型结构与标准的Transformer Decoder结构基本一致，主要由32个 Transformer Block 组成，不同之处主要包括以下几点：

前置的RMSNorm层
Q在与K相乘之前，先使用RoPE进行位置编码
K V Cache，并采用Group Query Attention
FeedForward层

为什么不用缓存Q？ maybe->当前Q会和之前KV进行计算，计算结束后就不会再使用了。

缺点：访存太慢，产生内存墙

->改进GQA(进行分组共享K、V)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/283009.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

活用 C语言之union的精妙之用

活用 C语言之union的精妙之用

一、union的基本定义 Union的中文叫法又被称为共用体、联合或者联合体。它的定义方式与结构体相同，但意义却与结构体完全不同。下面是union的定义格式： union 共用体名 {成员列表}共用体变量名;它与结构体的定义方式相同，但区别在于共用体中的成员的起始地址都是相同的，…

阅读更多...

备考ICA----Istio实验7---故障注入 Fault Injection 实验

备考ICA----Istio实验7---故障注入 Fault Injection 实验

备考ICA----Istio实验7—故障注入 Fault Injection 实验 Istio 的故障注入用于模拟应用程序中的故障现象，以测试应用程序的故障恢复能力。故障注入有两种: 1.delay延迟注入 2.abort中止注入 1. 环境准备 kubectl apply -f istio/samples/bookinfo/platform/kube/…

阅读更多...

Flask 与小程序的图片数据交互过程及探讨研究学习

Flask 与小程序的图片数据交互过程及探讨研究学习

今天不知道怎么的，之前拿编程浪子地作品抄过来粘上用好好的，昨天开始照片突的就不显示了。今天不妨再耐味地细细探究一下微信小程序wxml 和flask服务器端是怎么jpg图片数据交互的。 mina/pages/food/index.wxml  <!--1px …

阅读更多...

学习添加03（优惠卷）

学习添加03（优惠卷）

1.优化卷模块的介绍整体流程： 优惠卷表设计： 优惠卷范围表设计： 兑换码表设计：

阅读更多...

Python核心编程 --- 高级数据类型

Python核心编程 --- 高级数据类型

Python核心编程 — 高级数据类型字符串列表元组字典 1.序列序列：一组按顺序排列的数据集合。在Python中存在三种内置的序列类型：字符串、列表、元组优点：可支持索引和切片操作特点：第一个正索引为0，指…

阅读更多...

【vue3.0】实现导出的PDF文件内容是红头文件格式

【vue3.0】实现导出的PDF文件内容是红头文件格式

效果图: 编写文件里面的主要内容 <main><div id"report-box"><p>线索描述</p><p class"label"><span>线索发现时间:</span> <span>{{ detailInfoVal?.problem.createdDate }}</span></p><…

阅读更多...

腾讯在GDC 2024展示GiiNEX AI游戏引擎现已投入《元梦之星》中开发使用，展示强大AIGC能力

腾讯在GDC 2024展示GiiNEX AI游戏引擎现已投入《元梦之星》中开发使用，展示强大AIGC能力

在近日举行的GDC 2024游戏开发者大会上，腾讯揭开了其AI Lab团队精心打造的GiiNEX AI游戏引擎的神秘面纱。这款引擎依托先进的生成式AI和决策AI技术，为游戏行业带来了革命性的变革。相关阅读：腾讯游戏出品！腾讯研效AIGC&#xff…

阅读更多...

hyperf 二十八修改器一

hyperf 二十八修改器一

教程：Hyperf 一修改器和访问器根据教程，可设置相关函数,如set属性名Attribute()、get属性名Attribute()，设置和获取属性。这在thinkphp中也常见。修改器：set属性名Attribute()；访问器：get属性名Attri…

阅读更多...

lora-scripts 训练IP形象

lora-scripts 训练IP形象

CodeWithGPU | 能复现才是好算法CodeWithGPU | GitHub AI算法复现社区，能复现才是好算法https://www.codewithgpu.com/i/Akegarasu/lora-scripts/lora-trainstable-diffusion打造自己的lora模型（使用lora-scripts）-CSDN博客文章浏览阅读1.1k次…

阅读更多...

什么是RabbitMQ的死信队列

什么是RabbitMQ的死信队列

RabbitMQ的死信队列（Dead Letter Queue，简称DLQ）是一种用于处理消息失败或无法路由的消息的机制。它允许将无法被正常消费的消息重新路由到另一个队列，以便稍后进行进一步处理、分析或排查问题。当消息对立里面的消息出现以下几…

阅读更多...

python网络相册设计与实现flask-django-nodejs-php

python网络相册设计与实现flask-django-nodejs-php

此系统设计主要采用的是python语言来进行开发，采用django框架技术，框架分为三层，分别是控制层Controller，业务处理层Service，持久层dao，能够采用多层次管理开发，对于各个模块设计制作有一定的安…

阅读更多...

利用API打造卓越的用户体验

利用API打造卓越的用户体验

🍎个人博客：个人主页 🏆个人专栏：日常聊聊 ⛳️ 功不唐捐，玉汝于成目录正文 1. 数据驱动的设计 2. 功能扩展与整合 3. 实时性与响应性 4. 个性化推荐与定制化服务结语我的其他博客正文随着数字化时代的…

阅读更多...

如何让电脑定时开机？这个方法你一定要学会

如何让电脑定时开机？这个方法你一定要学会

前言前段时间小白在上班的时候，个人使用一台台式机和一台笔记本电脑。台式机并不是经常使用，但整个公司的数据中心是建立在小白所使用的那台台式机上。如果台式机没有开机，同事们就没办法访问数据中心获取自己想要的资料。领导也没办法链…

阅读更多...

4核16G服务器租用优惠价格，26.52元1个月，半年149元

4核16G服务器租用优惠价格，26.52元1个月，半年149元

阿里云4核16G服务器优惠价格26.52元1个月、79.56元3个月、149.00元半年，配置为阿里云服务器ECS经济型e实例ecs.e-c1m4.xlarge，4核16G、按固定带宽 10Mbs、100GB ESSD Entry系统盘，活动链接 aliyunfuwuqi.com/go/aliyun 活动链接打开如下图&a…

阅读更多...

Tkinter 一文读懂

Tkinter 一文读懂

Tkinter 简介 Tkinter（即 tk interface，简称“Tk”）本质上是对 Tcl/Tk 软件包的 Python 接口封装，它是 Python 官方推荐的 GUI 工具包，属于 Python 自带的标准库模块，当您安装好 Python 后，就可…

阅读更多...

爬虫分析-基于Python的空气质量数据分析与实践

爬虫分析-基于Python的空气质量数据分析与实践

概要本篇文章利用了Python爬虫技术对空气质量网站的数据进行获取，获取之后把数据生成CSV格式的文件，然后再存入数据库方便保存。再从之前24小时的AQI（空气质量指数）的平均值中进行分析,把数据取出来后，对数据进行数据…

阅读更多...

Android Studio 编译报错 ( Could not find com.android.tools.build:gradle:4.2.1.）

Android Studio 编译报错 ( Could not find com.android.tools.build:gradle:4.2.1.）

检查下根目录下的 build.gradle 配置 , 是否只配置了 jcenter 仓库 ，加上 google()mavenCentral() 重新编译试一下

阅读更多...

nacos服务注册中心，配置中心

nacos服务注册中心，配置中心

Spring Cloud alibaba: nacos服务注册中心，配置中心首先搭建Nacos服务注册中心。在搭建Nacos服务注册中心之前需要搞清楚两个概念：namespace和group。先创建namespace，然后配置nacos的依赖spring-cloud-alibaba-dependencies，…

阅读更多...

分享Pandas 数据分析实战课程

分享Pandas 数据分析实战课程

分享Pandas 数据分析实战课程，3 小时掌握数据分析核心技能。链接：https://pan.baidu.com/s/1Ikk3I1dfoFO0id3EBZJdGg?pwd4y83 提取码：4y83 链接：https://pan.quark.cn/s/fa2acd7513f4 提取码：yWu7

阅读更多...

第十四届蓝桥杯JavaB组省赛真题 - 幸运数字

第十四届蓝桥杯JavaB组省赛真题 - 幸运数字

进制转换可以参考如下的十进制，基本一样的，只是把10变成了其他数字， sum就是各个数位之和 public static int myUtil(int n) {int sum 0;while(n > 0) {sum n % 10;n / 10;}return sum;} 注意： 如果写在同一个类里面&…

阅读更多...

最新文章

推荐文章