四期书生大模型实战营(【基础岛】- 第1关 | 书生·浦语大模型开源开放体系)

文章目录

  • 1. 性能提升、推理能力领先
    • 1.1. 书生浦语开源时间线
      • 1.1.1. 时间节点
      • 1.1.2. InternLM性能天梯
    • 1.2. 模型亮点
      • 1.2.1. 推理能力
      • 1.2.2. 长文本支持
      • 1.2.3. 复杂任务的自动规划与搜索
    • 1.3. 核心技术思路
  • 2. 支持多模态预训练与微调
    • 2.1. 开源模型谱系
    • 2.2. 核心优势
  • 3. 书生浦语大模型开源链条
    • 开源链条
    • 3.1. 数据
    • 3.2. 开源数据处理工具箱
    • 3.3. 预训练框架 - Intern Evo
    • 3.4. 微调框架 - X-Tuner
    • 3.5. 评测体系 - OpenCompass
    • 3.6. 部署框架 - LM Deploy
    • 3.7. 智能体框架 - Legend
    • 3.8. 搜索引擎 - MindSearch
    • 3.9. 企业级知识库工具 - HuixiangDou
  • 总结


书生浦语官网:官网链接
GitHub:GitHub链接
本关卡视频: 关卡视频

书生大模型全链路开源开放体系是由上海人工智能实验室打造的完整的大模型生态系统,包含从数据处理、模型训练到应用部署的全链路解决方案。该体系不仅支持全流程的开源工具,还大幅度降低了大模型技术的门槛,助力企业和开发者快速高效地构建定制化的AI应用。


1. 性能提升、推理能力领先

1.1. 书生浦语开源时间线

1.1.1. 时间节点

书生浦语生态的构建和升级遵循清晰的时间节点,不断迭代和优化,以实现更强的性能和更广泛的应用支持:

  1. 2023年7月6日:推出首个7B模型InternLM-7B,率先实现免费商用,并发布了全链条开源工具体系,为后续模型的更新升级奠定了基础。
  2. 2023年9月20日:进一步推出InternLM-20B,该模型具备更高的综合性能,开源工具链全线升级。
  3. 2024年1月17日:发布InternLM2,该模型在同量级开源模型中表现领先,成为新的性能标杆。
  4. 2024年7月4日:正式发布InternLM2.5,在推理、理解、任务规划方面实现进一步提升。
    在这里插入图片描述

1.1.2. InternLM性能天梯

书生浦语构建了性能天梯系统,通过直观的方式展示不同版本的模型在各种任务中的表现,帮助用户选择合适的模型用于特定应用场景。
在这里插入图片描述

1.2. 模型亮点

涵盖从数据采集、模型训练到实际应用场景的全流程解决方案,并实现了显著性能提升及创新功能突破。例如,最新版Informer LM 2.5拥有卓越的推理能力和长达百万级别的上下文容量,在某些指标上甚至超过同类开源模型。

  1. 推理能力:InternLM2.5的推理能力较InternLM2提升20%,其表现已处于社区领先地位,能够适应更复杂的语境推理和信息理解。
  2. 长文本支持:该模型具备处理百万字长文的能力,在信息提取和上下文理解方面尤为出色,尤其适用于法律、金融、科研等领域的文本分析。
  3. 复杂任务的自动规划与搜索:InternLM2.5能够高效搜索、整合信息,解决复杂问题,效率较前代模型提升60倍,可撰写更专业、系统的回答。
    在这里插入图片描述

1.2.1. 推理能力

在这里插入图片描述

1.2.2. 长文本支持

在这里插入图片描述

1.2.3. 复杂任务的自动规划与搜索

在这里插入图片描述
在这里插入图片描述

1.3. 核心技术思路

书生浦语采用了独特的“模型能力飞轮”策略,通过不断迭代模型并广泛使用模型进行自身优化,加速其能力提升。此外,书生浦语构建了高质量的合成数据集,融合多种数据合成技术,以提升模型的适用性和性能。

  1. 基于规则的数据构造:引入代码、数学公式、题解等半结构化数据,增强模型的逻辑推理能力。
  2. 基于模型的数据扩充:利用现有模型自动生成注释、拓展代码语料,丰富模型的训练数据。
  3. 基于反馈的数据生成:基于人类反馈生成数据,确保模型输出更符合人类偏好,提升模型的实用性和精确性。
    在这里插入图片描述

2. 支持多模态预训练与微调

2.1. 开源模型谱系

书生浦语发布了适用于不同应用场景的多种参数规模的模型,使用户能够选择适合其特定需求的模型:

6.1. 按参数规模分类

  • 1.8B:适合资源受限的轻量级应用和端侧设备。
  • 7B:为轻量级的研究和应用提供强力支持。
  • 20B:适合更复杂的实际场景和推理任务。
  • 102B:为闭源模型,性能接近GPT-4,适用于高精度场景。

6.2. 按应用场景分类

  • InternLM-XComposer(灵笔):面向写作应用,支持内容创作。
  • InternLM-Math(数学):针对数学问题进行解答。
  • InternLM-WQX(文曲星):考试辅助,支持多学科题解。
    在这里插入图片描述

2.2. 核心优势

强调高性能模型的全面覆盖,从小规模至大规模均适用;同时推出了一系列配套工具,诸如高效的微调框架、自动标签系统Label LLM等,极大简化开发者的工作流。
在这里插入图片描述

3. 书生浦语大模型开源链条

开源链条

书生浦语全链条开源方案涵盖数据处理、模型预训练、微调、部署、评测到应用开发的所有环节,支持与Hugging Face、vLLM等生态系统的无缝衔接。
在这里插入图片描述

3.1. 数据

书生万卷预训练语料库包含了多模态数据,涵盖图像、语音、视频、3D模型等,数据量达180TB,提供丰富的开放数据资源。
在这里插入图片描述

3.2. 开源数据处理工具箱

  • MinerU:一站式数据提取工具,从PDF、网页、电子书中提取文本。
  • Label LLM和Label U:标注工具,支持NLP和图像标注,适合大规模标注任务。
    在这里插入图片描述

3.3. 预训练框架 - Intern Evo

通过显存和通信优化,降低硬件要求,提升预训练效率。
在这里插入图片描述

3.4. 微调框架 - X-Tuner

支持多模态微调,兼容QLORA、LORA等优化算法。

在这里插入图片描述
在这里插入图片描述

3.5. 评测体系 - OpenCompass

高效评测系统,提供权威性能榜单,助力AI模型的性能优化。

在这里插入图片描述在这里插入图片描述

3.6. 部署框架 - LM Deploy

支持多推理引擎和接口,便于模型快速部署应用。
在这里插入图片描述
在这里插入图片描述

3.7. 智能体框架 - Legend

兼容多种大语言模型的智能体,适合多任务场景。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.8. 搜索引擎 - MindSearch

结合AI技术,提供人脑逻辑模拟的智能搜索。
在这里插入图片描述在这里插入图片描述

3.9. 企业级知识库工具 - HuixiangDou

支持RAG和知识图谱,便于企业构建高效、安全的知识管理系统。

在这里插入图片描述

在这里插入图片描述

总结

书生浦语全链路开源体系通过提供从数据构建到模型应用的全套工具,显著降低了大模型研发和应用的门槛,为人工智能开发提供了更广泛的支持。此生态系统不仅帮助企业更快速地部署大模型,还加速了通用人工智能技术的落地应用。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/468037.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python之正则表达式总结

正则表达式 对于正则表达式的学习,我整理了网上的一些资料,希望可以帮助到各位!!! 我们可以使用正则表达式来定义字符串的匹配模式,即如何检查一个字符串是否有跟某种模式匹配的部分或者从一个字符串中将与…

Jmeter的安装,设置中文,解决乱码问题

1.Jmeter安装 1-Jmeter如何下载 1---我这里提供一个下载快的方式 https://www.123684.com/s/lWZKVv-4jiav?提取码:4x4y 2---Jmeter官网下载地址 Apache JMeter - Download Apache JMeter 2-配置java环境 1---下载javaJDK 官方下载地址 https://www.oracle.com/java/techno…

机器学习(七)——集成学习(个体与集成、Boosting、Bagging、随机森林RF、结合策略、多样性增强、多样性度量、Python源码)

目录 关于1 个体与集成2 Boosting3 Bagging与随机森林4 结合策略5 多样性X 案例代码X.1 分类任务-Adaboost-SVMX.1.1 源码X.1.2 数据集(鸢尾花数据集)X.1.3 模型效果 X.2 分类任务-随机森林RFX.2.1 源码X.2.2 数据集(鸢尾花数据集&#xff09…

融合虚拟与现实,AR Engine为用户提供沉浸式交互体验

当今的应用市场中,传统的应用产品已经难以完全满足消费者的多样化需求。为了在竞争激烈的市场中脱颖而出,企业需要深入洞察用户需求,提供个性化的服务体验和差异化的产品创新,以吸引并留住消费者。 比如,购物类App通过…

「QT」几何数据类 之 QPolygon 多边形类

✨博客主页何曾参静谧的博客📌文章专栏「QT」QT5程序设计📚全部专栏「VS」Visual Studio「C/C」C/C程序设计「UG/NX」BlockUI集合「Win」Windows程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「PK」Parasolid…

.NET 一款替代cmd.exe的交互式命令渗透工具

01阅读须知 此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等(包括但不限于)进行检测或维护参考,未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失&#xf…

跨境访问难题?SD-WAN跨境加速专线加速电商社交媒体推广

在全球化日益加深的今天,跨境电商已成为企业拓展国际市场的重要途径。然而,跨境电商在社交媒体平台进行推广时,常常面临一系列网络访问难题,如公网速度慢、员工办事效率低下、IP被封禁以及公司运维对网络维护的繁琐等。这些问题不…

让redis一直开启服务/自动启动

文章目录 你的redis是怎么打开的黑窗不能关?必须要自动启动吗?再说说mysql 本文的所有指令都建议在管理员权限下打开cmd控制台 推荐的以管理员身份打开控制台的方式 Win R 打开运行 输入cmdShift Ctrl Enter 你的redis是怎么打开的 安装过redis的朋友都知道, redis的安…

Python 分子图分类,GNN Model for HIV Molecules Classification,HIV 分子图分类模型;整图分类问题,代码实战

一、分子图 分子图(molecular graph)是一种用来表示分子结构的图形方式,其中原子被表示为节点(vertices),化学键被表示为边(edges)。对于HIV(人类免疫缺陷病毒&#xff…

vue项目实战

1.项目文件夹添加(结构如下) 2.页面构建 安装路由 npm install react-router-dom 3.页面基本模板 router文件夹下index.js的模板 // 引入组件 import Login from "../views/login"; // 注册路由数组 const routes [{// 首页默认是/path: …

势不可挡 创新引领 | 生信科技SOLIDWORKS 2025新品发布会·苏州站精彩回顾

2024年11月01日,由生信科技举办的SOLIDWORKS 2025新产品发布会在江苏苏州圆满落幕。现场邀请到制造业的专家学者们一同感受SOLIDWORKS 2025最新功能,探索制造业数字化转型之路。 在苏州站活动开场,达索系统专业客户事业部华东区渠道经理马腾飞…

论文阅读《Structure-from-Motion Revisited》

摘要 增量式地运动结构恢复是从无序图像集合中进行三维重建的一个普遍策略。虽然增量式地重建系统在各个方面上都取得了巨大的进步,但鲁棒性、准确性、完整度和尺度仍然是构建真正通用管道的关键问题。我们提出了一种新的运动结构恢复技术,它改进了目前…

【人工智能】10分钟解读-深入浅出大语言模型(LLM)——从ChatGPT到未来AI的演进

文章目录 一、前言二、GPT模型的发展历程2.1 自然语言处理的局限2.2 机器学习的崛起2.3 深度学习的兴起2.3.1 神经网络的训练2.3.2 神经网络面临的挑战 2.4 Transformer的革命性突破2.4.1 Transformer的核心组成2.4.2 Transformer的优势 2.5 GPT模型的诞生与发展2.5.1 GPT的核心…

Vue 组件传递数据-Props(六)

一、Props传递静态数据 defineProps() 和 defineEmits() 为了在声明 props 和 emits 选项时获得完整的类型推导支持&#xff0c;我们可以使用 defineProps 和 defineEmits API&#xff0c;它们将自动地在 <script setup> 中可用&#xff1a; defineProps 和 defineEmits …

移动开发(七):.NET MAUI使用RESTAPI实现查询天气笔记

目录 一、接口准备 二、实体部分 三、页面部分 四、后台代码逻辑 五、总结 在移动开发过程中,第三方对接是非常常见的。今天给大家分享.NET MAUI如何使用REST API实现输入城市名称查询天气的示例,希望对大家学习.NET MAUI可以提供一些帮助! 一、接口准备 首先我们需要…

【网络安全 | 并发问题】Nginx重试机制与幂等性问题分析

未经许可,不得转载。 文章目录 业务背景Nginx的错误重试机制proxy_next_upstream指令配置重试500状态码非幂等请求的重试问题幂等性和非幂等性请求non_idempotent选项的使用解决方案业务背景 在现代互联网应用中,高可用性(HA)是确保系统稳定性的关键要求之一。为了应对服务…

C++入门基础(三)

目录 引用引用概念例子1例子2例子3例子4常引用拓展 引用 引用概念 引用不是新定义一个变量&#xff0c;而是给已存在变量取了一个别名&#xff0c;编译器不会为引用变量开辟内存空 间&#xff0c;它和它引用的变量共用同一块内存空间。 比如&#xff1a;同学A有一个别名为张…

ChatGPT键盘快捷键(按ctrl + /呼出)

文章目录 ChatGPT键盘快捷键- 打开新聊天: Ctrl Shift O- 聚焦聊天输入: Shift Esc- 复制最后一个代码块: Ctrl Shift ;- 复制最后一个回复: Ctrl Shift C- 设置自定义指令: Ctrl Shift I- 切换边栏: Ctrl Shift S- 删除聊天: Ctrl Shift ⌫- 显示快捷方式: Ctrl …

VCS:三步法的仿真流程

相关阅读 VCShttps://blog.csdn.net/weixin_45791458/category_12828763.html 使用三步流程仿真设计涉及三个基本步骤&#xff1a; 分析(Analysis)展开(Elaboration)仿真(Simulation) VCS使用这三个步骤编译任何设计&#xff0c;无论所使用源代码的是HDL、HVL或其他支持的技术…

万字长文解读深度学习——Transformer

文章目录 &#x1f33a;深度学习面试八股汇总&#x1f33a;初识Transformer1. 编码器-解码器架构解码器的额外结构 2. 自注意力机制&#xff08;Self-Attention Mechanism&#xff09;解码器中的注意力机制的2点特殊 3. 位置编码&#xff08;Positional Encoding&#xff09;4.…