书生·浦语大模型全链路开源体系（陈恺|上海人工智能实验室青年科学家）-听课笔记

书生·浦语大模型全链路开源体系（陈恺|上海人工智能实验室青年科学家）-听课笔记

news/2024/11/15 10:23:45/文章来源:https://blog.csdn.net/jasonjwl/article/details/135391538

大模型重要性

大模型确实已成为发展通用人工智能（AGI）的重要途径。它们通过整合和处理大量数据，学习语言、图像、声音等多种模式的表示，以此来模拟人类的学习和思维方式。通过不断地学习和优化，这些模型能够在各种任务中表现出越来越高的智能水平，例如自然语言理解、图像识别、策略制定等。大模型的发展涉及到算法创新、计算资源的大规模部署、数据的高效管理等多个方面，是推动人工智能进步的关键因素之一。

书生-浦语大模型开源历程

书生·浦语大模型系列

1.轻量级：InternLM-7B
70亿模型参数
1000亿训练token数据
长语境能力，支持8K语境窗口长度
通用工具调用能力，多种工具调用模板

2.中量级：InternLM-20B
200亿模型参数，在模型能力与推理代价间取得平衡
采用深而窄的结果，降低推理计算量但提高推理能力
4K训练语境长度，推理时可外推至16K

3.重量级：1230亿模型参数，强大的性能
极强推理能力、全面的知识覆盖面、超级理解能力与对话能力
准确的API调用能力，可实现各类Agent

书生·浦语大模型性能评测

“书生·浦语”联合团队选取了20余项评测对其进行检验，其中包含全球最具影响力的四个综合性考试评测集：由伯克利加州大学等高校构建的多任务考试评测集MMLU；微软研究院推出的学科考试评测集AGIEval（含中国高考、司法考试及美国SAT、LSAT、GRE 和 GMAT等），AGIEval的19个评测大项中有9个大项是中国高考，通常也列为一个重要的评测子集AGIEval（GK）；由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval；以及由复旦大学研究团队构建的高考题目评测集Gaokao。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/231876.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

用户管理第2节课--idea 2023.2 后端--实现基本数据库操作(操作user表) -- 自动生成 --【本人】

用户管理第2节课--idea 2023.2 后端--实现基本数据库操作(操作user表) -- 自动生成 --【本人】

一、插件安装 1.1 搜索插件 mybatis 安装 1.2 接受安装 1.3 再次进入，说明安装好了 1.4 与鱼皮不同点 1）mybatis 版本不一致鱼皮： 本人： 2）鱼皮需重启安装本人不需要 1.5 【需完成三、步骤，再来看】 …

阅读更多...

系列七、Ribbon

系列七、Ribbon

一、Ribbon 1.1、概述 Ribbon是基于Netflix Ribbon实现的一套客户端负载均衡的工具，是Netflix发布的一款开源项目，其主要功能是提供客户端的软件负载均衡算法和服务调用，Ribbon客户端组件提供一系列完善的配置项，例如&#xff1a…

阅读更多...

linux用户态与内核态通过字符设备交互

linux用户态与内核态通过字符设备交互

linux用户态与内核态通过字符设备交互简述 Linux设备分为三类，字符设备、块设备、网络接口设备。字符设备只能一个字节一个字节读取，常见外设基本都是字符设备。块设备一般用于存储设备，一块一块的读取。网络设备，Linux将对网络…

阅读更多...

异常控制流ECF

异常控制流ECF

大家好，我叫徐锦桐，个人博客地址为www.xujintong.com，github地址为https://github.com/jintongxu。平时记录一下学习计算机过程中获取的知识，还有日常折腾的经验，欢迎大家访问。一、异常控制流（ECF) 现代…

阅读更多...

【年终总结系列 2023】新起点，同时追寻更高的起点

【年终总结系列 2023】新起点，同时追寻更高的起点

什么是攀登者，用一个场景来概括就是：经常弯腰低头手脚并用向上攀爬，待到山的顶峰后终于可以舒展一下身体，但若舒展的时间过长便会觉得无聊，此时向远处眺望，发现了更高的山峰，便又充满了激情。对…

阅读更多...

web前端——clear可以清除浮动产生的影响

web前端——clear可以清除浮动产生的影响

clear可以解决高度塌陷的问题，产生的副作用要小未使用clear之前 <!DOCTYPE html> <head><meta charset"UTF-8"><title>高度塌陷相关学习</title><style>div{font-size:50px;}.box1{width:200px;height:200px;backg…

阅读更多...

排序算法——关于快速排序的详解

排序算法——关于快速排序的详解

目录 1.基本思想 2.基本原理 2.1划分思想 2.2排序过程 （1）选择基准值 （2）分割过程（Partition） （3）递归排序 （4）合并过程 2.3具体实例 2.4实现代码 2.5关键要…

阅读更多...

软件工程：用例图相关知识和多实例分析

软件工程：用例图相关知识和多实例分析

目录一、用例图相关知识 1. 基本介绍 2. 常用符号二、用例图实例分析 1. 新闻管理系统 2. 医院病房监护系统 3. 实验上机安排系统 4. 远程网络教学系统一、用例图相关知识 1. 基本介绍用例图（use case diagram）是用户与系统交互的最简表示…

阅读更多...

HarmonyOS 组件通用属性之位置设置

HarmonyOS 组件通用属性之位置设置

本文我们来说通用属性中的位置设置主要是针对组件的对齐方式布局方向显示位置做过WEB开发的对流式布局应该都不陌生就是一行放内容不够放就换行我们可以先这样写 Entry Component struct Index {build() {Row() {Column() {Stack(){Text("你好")Text(&…

阅读更多...

Springboot整合MQ学习记录

Springboot整合MQ学习记录

Mq介绍 RabbitMQ是由erlang语言开发，基于AMQP（Advanced Message Queue 高级消息队列协议）协议实现的消息队列，它是一种应用程序之间的通信方法，消息队列在分布式系统开发中应用非常广泛。支持Windows、Linux/Unix、MA…

阅读更多...

＜HarmonyOS主题课＞1~3课后习题汇总

＜HarmonyOS主题课＞1~3课后习题汇总

＜HarmonyOS第一课＞1~10课后习题汇总 1使用DevEco Studio高效开发单选题用哪一种装饰器修饰的组件可作为页面入口组件？（B） A. ComponentB. EntryC. PreviewD. Builder ArkTS Stage模型支持API Version 9&#xf…

阅读更多...

智能座舱的下一个价值“爆点”——让“光”更智能

智能座舱的下一个价值“爆点”——让“光”更智能

汽车智能化快速升级，智能座舱作为人机交互的主要窗口，交互模态、用户体验也呈现多维度升级。例如，今年下半年上市的多款高端智能车型纷纷基于高性能座舱硬件平台，集成了AR-HUD、DMS/OMS等高阶功能，同时结合超大屏/多…

阅读更多...

简单介绍Java 的内存泄漏

简单介绍Java 的内存泄漏

java最明显的一个优势就是它的内存管理机制。你只需简单创建对象，java的垃圾回收机制负责分配和释放内存。然而情况并不像想像的那么简单，因为在Java应用中经常发生内存泄漏。本教程演示了什么是内存泄漏，为什么会发生内存泄漏以及如何预防…

阅读更多...

SpringMVC通用后台管理系统源码

SpringMVC通用后台管理系统源码

整体的SSM后台管理框架功能已经初具雏形，前端界面风格采用了结构简单、性能优良、页面美观大的Layui页面展示框架数据库支持了SQLserver,只需修改配置文件即可实现数据库之间的转换。系统工具中加入了定时任务管理和cron生成器，轻松实现系统调度问…

阅读更多...

Glide加载不出图片与请求浏览器资源时中文转码问题

报错代码如图：Image load failed: Failed to load resourse 首先确保你的图片 URL 地址是正确的，可以通过在浏览器中直接访问这个 URL 来测试。另外，确保 URL 地址不包含特殊字符或空格，以免影响加载。然后确定依赖库没有问题&am…

阅读更多...

地平面--高速布线

地平面--高速布线

https://baijiahao.baidu.com/s?id1764139038516816855&wfrspider&forpc 概念回顾传输线，由任意两条有一定长度的导线组成，一条为信号路径，一条为返回路径。基本电路理论告诉我们，信号是由电流传播的，明确的…

阅读更多...

目标检测-One Stage-YOLOv2

目标检测-One Stage-YOLOv2

文章目录前言一、YOLOv2的网络结构和流程二、YOLOv2的创新点预处理网络结构训练总结前言根据前文目标检测-One Stage-YOLOv1可以看出YOLOv1的主要缺点是： 和Fast-CNN相比，速度快，但精度下降。（边框回归不加限制）…

阅读更多...

高并发如何保证接口的幂等性？

高并发如何保证接口的幂等性？

前言接口幂等性问题，对于开发人员来说，是一个跟语言无关的公共问题。本文分享了一些解决这类问题非常实用的办法，绝大部分内容我在项目中实践过的，给有需要的小伙伴一个参考。不知道你有没有遇到过这些场景： 有时我…

阅读更多...

Docker（八）Python+旧版本chrome+selenium+oss2+fastapi镜像制作

Docker（八）Python+旧版本chrome+selenium+oss2+fastapi镜像制作

目录一、背景二、能力三、核心流程图四、制作镜像1.资源清单2.Dockerfile3.制作镜像五、启动测试一、背景近几年我们线下的创业团队已从零到一开发过好几个小程序项目，都是和体育相关。其中生成海报分享图片好像都是不可或缺的功能。之前的项目老板给的时间都比…

阅读更多...

如何让CHAT使用python绘制概率密度图像？

如何让CHAT使用python绘制概率密度图像？

问CHAT：用python绘制概率密度图像 CHAT回复：你可以使用Python的matplotlib库和numpy库进行概率密度的绘制。以下是一个简单的例子： python import numpy as np import matplotlib.pyplot as plt #随机生成1000个正态分布的数 data np.rand…

阅读更多...

最新文章

推荐文章