零一万物新模型Yi-Lightning:超越GPT-4o

        10月16日,零一万物发布了最新的旗舰模型Yi-Lightning(闪电),在中国大模型中首度超越 GPT-4o。它在国际权威盲测榜单 LMSYS 上取得了显著成绩,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。这一成就标志着中国在人工智能领域的实力和进步。

        在多个子榜单中,Yi-Lightning 的表现同样十分出色。在中文子榜单上,Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13 和智谱发布的 GLM-4-Plus 等国内外优秀模型,与 o1-mini 等模型并列全球第二。

        在数学和代码能力方面,Yi-Lightning 也位居全球第一梯队。在数学和代码子榜单上,Yi-Lightning 分别获得了第三名和第四名的成绩。

        在以专业性和高难度著称的艰难提问与长提问榜单上,Yi-Lightning 表现依然出色,均获得全球第四的优异成绩。

1. Yi-Lightning的主要特点

  • 推理速度与成本:据官方数据显示,基于8xH100算力的环境下,Yi-Lightning的首包时间仅为其前一代模型Yi-Large的一半。与上一代旗舰模型 Yi-Large 相比,Yi-Lightning 的最高生成速度提升了近 40%,首包时间缩短了一半。每百万个 token 的推理成本仅为 0.99 元,接近行业最低水平。
  • AI 2.0 数字人解决方案:专注于零售和电商等应用场景,提供角色大模型、直播语音大模型和电商话术大模型等,具备动作训练、表情生成、多国语言支持、情感表达和智能对话等功能。
  • 全行业解决方案:广泛应用于零售、医疗、教育和物流等领域,涵盖 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。
  • 模型架构创新:与之前的稠密模型架构相比,这款新模型采用了混合专家模型架构(Mixture of Experts, MoE)。这一架构通过激活不同的专家子模型,能够在处理大量数据时显著提升效率和准确性。结合深度学习与机器学习的优势,Yi-Lightning展现了前所未有的灵活性,极大地拓宽了应用场景。
  • 极速推理:基于动态 Top-P 路由机制,根据任务难度自动选择最适合的专家网络组合,平衡推理成本与模型性能。
  • 多阶段训练:训练过程采用多阶段模式,前期注重数据多样性,后期则侧重于更丰富和知识性更强的数据。

2. Yi-Lightning的技术原理

  • MoE 混合专家模型架构:结合多个专家网络处理不同任务,动态选择激活哪些专家网络。在训练过程中,所有专家网络都被激活,在推理阶段,模型会选择性地激活更匹配的专家网络。
  • 混合注意力机制:Yi-Lightning 优化了混合注意力机制,只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention),降低计算成本,同时保持对长序列数据的高效处理能力。
  • 跨层注意力(CLA):Yi-Lightning 引入了跨层注意力机制,支持模型在不同的层次之间共享键(Key)和值(Value)头,减少对存储资源的需求,提高模型的推理效率。
  • 动态 Top-P 路由:根据任务难度动态选择最合适的专家网络组合,实现极速推理。

3. Yi-Lightning的主要应用场景

  • 翻译领域
    • 提供高质量的翻译服务,处理语言理解和生成、跨语言能力、上下文感知能力等。
    • 在多个模型的对比中,Yi-Lightning展现了其精准且具有文学色彩的翻译能力。
  • 零售和电商直播
    • 零一万物推出的AI 2.0数字人方案,基于Yi-Lightning模型,聚焦于零售和电商场景。
    • 实现弹幕互动、商品信息提取、实时话术生成等功能,提升数字人的实时互动效果,使话术更流畅,回复更准确。
  • 企业级解决方案
    • 应用于零一万物的To B战略下的企业级解决方案,为企业提供定制化的AI服务。
    • 帮助企业提升效率和营收,通过接入Yi-Lightning,某酒旅企业的GMV较此前上升了170%。
  • 多语言处理
    • 在中文分榜上,Yi-Lightning展现了强大的中文处理能力,与国际顶尖模型相比也毫不逊色。
  • 数学和代码生成
    • 在数学和代码分榜上,Yi-Lightning分别取得了第三、第四名的成绩,显示了其在这些领域的强大能力。
  • 处理长提问和复杂问题
    • Yi-Lightning在处理长提问和艰难提问方面也表现出众,均取得世界第四的优异成绩,证明了其解决复杂问题的能力。

4. 结语

    零一万物于10月16日发布的 Yi-Lightning 模型,标志着中国在人工智能领域取得了重要突破。作为首款在国际权威盲测榜单 LMSYS 上超越 GPT-4o 的中国模型,Yi-Lightning 的技术和性能备受关注。该模型采用混合专家模型架构,推理速度提高近 40%,成本接近行业最低,展现出卓越的效率和灵活性。

    Yi-Lightning 在多个领域展现出巨大应用潜力,包括零售、电商直播、企业级解决方案、多语言处理以及数学和代码生成等。其独特的动态 Top-P 路由机制和优化的混合注意力机制,使其在处理复杂任务时表现尤为出色,尤其在长提问和难题处理方面位居世界前列。Yi-Lightning 不仅在技术上取得了重大突破,还为各行业带来了创新解决方案,预示着中国人工智能的未来将更加光明。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/458066.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于iPhone 16 Pro评测视频评论区特征的多维度分析

1.项目背景 随着智能手机的迅速发展,消费者在选择新设备时越来越依赖于网络评价和用户反馈,B站作为中国领先的视频分享平台,聚集了大量科技评测内容,其中UP主的评论区成为用户讨论和交流的重要场所,特别是在iPhone 16…

基于SSM的汽车客运站管理系统【附源码】

基于SSM的汽车客运站管理系统(源码L文说明文档) 目录 4 系统设计 4.1 设计原则 4.2 功能结构设计 4.3 数据库设计 4.3.1 数据库概念设计 4.3.2 数据库物理设计 5 系统实现 5.1 管理员功能实现 5.1.1 管理员信息 5.1.2 车…

【程序员的逆袭】:在失业的阴影下寻找光明

故事摘要 在失业的阴霾中,一位程序员如何通过外包项目重燃希望之火?这个故事讲述了他的谋生手段,如何在压力之下,通过信息差赚取生活所需。 要点 信息的力量:赚钱的关键在于信息差,而非单纯的体力或脑力…

【轻量级聊天应用】Vocechat本地服务器部署结合cpolar异地即时通讯

文章目录 前言1. 拉取Vocechat2. 运行Vocechat3. 本地局域网访问4. 群晖安装Cpolar5. 配置公网地址6. 公网访问小结 7. 固定公网地址 前言 本文主要介绍如何在本地群晖NAS搭建一个自己的聊天服务Vocechat,并结合内网穿透工具实现使用任意浏览器远程访问进行智能聊天…

iTerm2 保持SSH远程连接

1、保持SSH远程连接的稳定,防止因闲置时间过长而断开连接 When idle, send ASCII code 35 every 60 seconds每60秒 输入# 2、客户端设置保持活动 设置客户端每隔60秒发送一次保活信号,总共尝试3次。 vim ~/.ssh/configHost *ServerAliveInterval 60…

python csv库

python csv库 水一水又是一篇,乐 读取 import csv # 打开 CSV 文件 with open(example.csv, moder, newline) as file: csv_reader csv.reader(file) # 读取文件头(可选) headers next(csv_reader) print(f"Headers: {heade…

w001基于SpringBoot的在线拍卖系统

🙊作者简介:多年一线开发工作经验,原创团队,分享技术代码帮助学生学习,独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹赠送计算机毕业设计600个选题excel文…

gateway 整合 spring security oauth2

微服务分布式认证授权方案 在分布式授权系统中,授权服务要独立成一个模块做统一授权,无论客户端是浏览器,app或者第三方,都会在授权服务中获取权限,并通过网关访问资源 OAuth2的四种授权模式 授权码模式 授权服务器将授…

【密码学】全同态加密张量运算库解读 —— TenSEAL

项目地址:https://github.com/OpenMined/TenSEAL 论文地址:https://arxiv.org/pdf/2104.03152v2 TenSEAL 是一个在微软 SEAL 基础上构建的用于对张量进行同态加密操作的开源Python库,用于在保持数据加密的状态下进行机器学习和数据分析。 Ten…

CSS基础—网页布局(重点!)

1、两列布局 (1)概念 经典两列布局是指一种网页布局方式,其中一列宽度固定,另一列宽度自适应。‌ 这种布局方式在网页设计中非常常见,因为它能够提供良好的视觉效果和用户体验。 如图所示: 页面顶部放置一…

网络搜索引擎Shodan(4)

声明:学习视频来自b站up主 泷羽sec,如涉及侵权马上删除文章 声明:本文主要用作技术分享,所有内容仅供参考。任何使用或依赖于本文信息所造成的法律后果均与本人无关。请读者自行判断风险,并遵循相关法律法规。 感谢泷…

【JavaEE】【多线程】volatile,wait/notify

目录 一、volatile关键字1.1 内存可见性1.2 volatile解决内存可见性问题 二、wait和notify2.1 wait2.2 notify2.3 使用例子2.3.1 例子12.3.2 例子二 一、volatile关键字 volatile可以保证内存可见性,只能修饰变量。 1.1 内存可见性 在前面介绍线程不安全原因时介…

大数据开发扩展shell 笔记

大数据开发扩展shell 此笔记来自尚硅谷 学习目标 1 熟悉shell脚本的原理和使用 2 熟悉shell的编程语法 第一节 Shell概述 1)Linux提供的Shell解析器有: [atguiguhadoop101 ~]$ cat /etc/shells /bin/sh/bin/bash/sbin/nologin/bin/dash/bin/tcsh/b…

JCSA-Journal of Consumer Affairs

文章目录 一、征稿简介二、重要信息三、服务简述四、投稿须知五、联系咨询 一、征稿简介 二、重要信息 期刊官网:https://ais.cn/u/3eEJNv 三、服务简述 Journal of Consumer Affairs由美国消费者利益委员会(ACCI)拥有,成立于1…

淘宝商品详情的“侦探游戏”:如何用API接口揭开数据的面纱

在这个充满神秘数据的电商世界里,淘宝商品详情就像是一个个隐藏的宝藏,等待着我们去发掘。而API接口,就是我们的“侦探工具”,帮助我们快速揭开这些宝藏的面纱。今天,我们就来一场幽默的“侦探游戏”,看看如…

炒股VS炒CSGO游戏装备,哪个更好做

这个项目,赚个10%都是要被嫌弃的 虽然天天都在抒发自己对股市的看法,但自己自始至终也没有买进任何一支股票。之所以对这个话题感兴趣,着实是因为手上的游戏搬砖项目也是国际性买卖,跟国际形势,国际汇率挂钩&#xff…

C++线程池手写实现

1.Thread类的封装 封装Thread类&#xff0c;使其可以直接在外部调用对象的start,detach,join和cancel等方法来实现对线程的操作 1.1代码 //Thread.h// // Created by crab on 2024/10/20. //#ifndef THREAD_H #define THREAD_H#include <pthread.h>class Thread { pub…

使用 Docker 管理完整项目:Java、Vue、Redis 和 Nginx 的一站式部署

个人名片 🎓作者简介:java领域优质创作者 🌐个人主页:码农阿豪 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[2435024119@qq.com] 📱个人微信:15279484656 🌐个人导航网站:www.forff.top 💡座右铭:总有人要赢。为什么不能是我呢? 专栏导…

[大模型学习推理]资料

https://juejin.cn/post/7353963878541361192 lancedb是个不错的数据库&#xff0c;有很多学习资料 https://github.com/lancedb/vectordb-recipes/tree/main/tutorials/Multi-Head-RAG-from-Scratch 博主讲了很多讲解&#xff0c;可以参考 https://juejin.cn/post/7362789…

js纯操作dom版购物车(实现购物车功能)

代码&#xff1a; <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title>Document</title>&l…