Gemini 1.0:Google推出的全新AI模型,改变生成式人工智能领域的游戏规则!

个人头像Gemini 1.0:Google推出的全新AI模型,将改变生成式人工智能领域的游戏规则!

🎥 屿小夏 : 个人主页
🔥个人专栏 : IT杂谈
🌄 莫道桑榆晚,为霞尚满天!

文章目录

  • 📑前言
  • 一. Gemini的发布前期
    • 1.1 Gemini的准备
    • 1.2 DeepMnid
  • 二. Gemini的三大杀手锏
    • 2.1 多模态能力
    • 2.2 可拓展性
    • 2.3 新硬件,新架构
  • 三. 生成式人工智能领域的新格局会是什么样?

image-20231218202658001

📑前言

北京时间 12 月 6 日晚,Google 给近期稍显沉寂的 AI 模型战场扔下了一颗新的炸弹:号称多模态任务处理能力首次超越人类的 AI 模型,Gemini 1.0 正式发布。

一. Gemini的发布前期

1.1 Gemini的准备

在Gemini正式发布之前,外媒就有诸多关于 Google 这款全新 AI 模型的消息流出,Google 最早在今年五月的 IO 大会期间透露了 Gemini 的存在,但与之前外界预期的不同,Google 声称 Gemini 的发布并未因为任何内部原因而延期,表示其 AI 模型的研发进程从 2012 年已经开始,直到最近 2023 年发布 PaLM2 与 Bard 之后,就开始为 Gemini 的正式发布做准备。

1.2 DeepMnid

DeepMind本就是 AI 领域顶尖研究机构,早在 OpenAI 踏入聚光灯下之前,DeepMind 就凭借 AI 围棋棋手 —— AlphaGo 赢得了全世界对 AI 时代的关注,如今名为「双子座」的新一代 AI 大模型正式对外发布,也颇有抢回 AI 模型领域主导地位的感觉:双子座在神话本身就对应着「快速思维」的能力,同时也有着包罗万象、善于沟通等寓意。

image-20231218202900640

二. Gemini的三大杀手锏

2.1 多模态能力

Gemini是一款由Google开发的AI模型,它是史上第一款原生支持多模态能力的模型。与以往的多模态模型不同,Gemini在不同的模态上进行预训练,并利用额外的多模态数据进行微调,从而在处理复杂问题时表现更为出色。Gemini Ultra在行业标准MMLU基准测试中取得了90%的成绩,超过了人类专家和GPT-4同类测试的结果,并在九项独立基准测试中击败了竞争对手。这一突破性的训练架构让Gemini能够快速理解和推理人类的各种内容,为解决复杂问题提供了更加高效的解决方案。

image-20231218203433174

Gemini展示了其多模态理解能力,包括根据简笔画实时解读、根据视频中的颜色比例推荐编织玩具、以及玩猜硬币游戏。它与其他生成式AI模型最大的区别在于能够同时处理多种形态的信息输入。Google强调了Gemini在数学领域的复杂理解能力,展示了通过视频输入数学题,Gemini辅助解决的场景。这展示了Gemini在处理复杂逻辑的数学问题中的优势。

image-20231218203601183

2.2 可拓展性

到 2023 年下半年,大模型并行发展成为行业主流,尤其是端侧大模型在生成式 AI 应用中备受瞩目。vivo、小米、OPPO等手机品牌推出了端侧大模型与云端大模型的结合应用。在Gemini 1.0中,Google发布了三个版本:Gemini Ultra最聪慧,需要更大的计算量;Pro最均衡,适用于多场景;Nano体积最小最高效,主打部署在Android手机等设备上的端侧大模型。

image-20231218203908773

Gemini Nano具备完全在端侧离线运行的能力,已适配Pixel系统自带的录音App,可生成AI摘要,甚至在无网络连接时也可运行。Gemini Nano的能力已整合进Android系统,第三方应用开发者也可通过应用适配调用其能力。Google计划将Gemini适配到其他Android智能手机,但目前仅有Pixel 8 Pro适配。虽未正面回应是否超越GPT-4,但Gemini Ultra在MMLU中获得的评分比GPT-4更高,是唯一超越人类专家测试结果的AI模型。

img

img

2.3 新硬件,新架构

Google的TPU(张量处理单元)是专为神经网络机器学习开发的专用硬件,从2015年发布TPU v1至今已经迭代了五个大版本。

Gemini 1.0基于Google数据中心的TPU v4和TPU v5e大规模阵列训练而来。TPU阵列不仅用于训练Gemini,也应用在Gmail、YouTube、Google Play等Google生态应用中,并从2018年开始开放给第三方客户使用。

Gemini在TPU上的运行速度也明显优于早期的小模型。同时,Google展示了最新的TPU v5p系列,提升了可拓展性,浮点运算能力相比v4提升了两倍,训练速度也提升了2.8倍以上。

此外,还推出了代号为「AI Hypercomputer」的超级计算机架构,可以与Google Cloud计算中心的硬件协同工作,支持现代AI模型开发的工作负载。

image-20231218203827197

三. 生成式人工智能领域的新格局会是什么样?

最近OpenAI经历了一些领导层的变动,包括首席执行官被罢免后又回归,导致了一些不确定性。谷歌发布了Gemini,与OpenAI的GPT-4进行了对比,显示出在大型语言模型领域的激烈竞争。OpenAI也在密切关注谷歌的动向,并推出了一系列更新,包括GPT-4的升级版、将个性化GPT赋予用户的功能以及计划开放GPT应用商店等。OpenAI目前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

image-20231218205446562

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/221898.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python之set集合的相关介绍

认识python中的set集合及其用法 python中,集合(set)是一个无序排列,可哈希,支持集合关系测试,不支持索引和切片操作,没有特定语法格式,只能通过工厂函数创建.集合里不会出现两个相同的元素,所以集合常用来…

鸿蒙Harmony4.0开发-ArkTS基础知识运用

概念 1.渲染控制语法: 条件渲染:使用if/else进行条件渲染。 Column() {if (this.count > 0) {Text(count is positive)} }循环渲染:开发框架提供循环渲染(ForEach组件)来迭代数组,并为每个数组项创建…

云原生系列2-CICD持续集成部署-GitLab和Jenkins

1、CICD持续集成部署 传统软件开发流程: 1、项目经理分配模块开发任务给开发人员(项目经理-开发) 2、每个模块单独开发完毕(开发),单元测试(测试) 3、开发完毕后,集成部…

数据治理与大模型一体化实践

引言: 大模型落地到当前这个阶段,核心关注点还是领域大模型,而领域大模型落地的前提在于两点:需求端,对当前应用的降本增效以及新应用的探索;供给端,训练技术已经有较高的成熟度。 专家介绍: …

2023 英特尔On技术创新大会直播 |探索视觉AI的无限可能

2023 英特尔On技术创新大会直播 | 探索视觉AI的无限可能 前言一未来的 AI:释放视觉 AI 真正潜力二AI技术突破、视觉Al挑战及前沿研究创新三全尺度视觉学习全尺度视觉学习示例1.GridConv 实现三维人体姿态估计更高准确率2.KW 预训练及迁移模型性能3.无数据增强稠密对…

linux搭建gitlab

gitlab的介绍 区别于github,github是面向互联网基于git实现的代码托管平台,gitlab是基于Ruby语言实现的git管理平台软件,一般用于公司内部代码仓库。 gitlab组成 Nginx 静态Web服务器Gitlab-workhorse 轻量级的反向代理服务器Gitlab-shell 用…

TikTok获客工具定制开发怎么做?

随着社交媒体的兴起,越来越多的企业开始把目光投向了海外市场,而在这个数字化时代,TikTok已经成为了一个备受欢迎的短视频平台,不仅吸引了大量的年轻用户,也成为了许多企业的新宠。 但是,如何在TikTok上获…

全球移动通信(2G/3G/4G/5G)频谱分布情况

一、概述 随着通信技术的不断发展,全球各国都在积极推进2G、3G、4G、5G网络的建设和应用。根据FCC统计,目前全球移动通信频谱分布如下: 二、分布 (一)俄罗斯 2G:主要使用900MHz和1800MHz两个频段。其中&…

jvm相关命令操作

查看jvm使用情况 jmap -heap PID 查看线程使用情况 jstack pid 查看当前线程数 jstack 21294 |grep -E (#[0-9]) -o -c 查看系统线程数 top -H top -Hp pid #查看具体的进程中的线程信息 使用 jps 命令查看配置了JVM的服务 查看某个进程JVM的GC使用情况 jstat -gc 进程…

算法基础之约数个数

约数个数 核心思想&#xff1a; 用哈希表存每个质因数的指数 然后套公式 #include <iostream>#include <algorithm>#include <unordered_map>#include <vector>using namespace std;const int N 110 , mod 1e9 7;typedef long long LL; //long l…

链接未来:深入理解链表数据结构(一.c语言实现无头单向非循环链表)

在上一篇文章中&#xff0c;我们探索了顺序表这一基础的数据结构&#xff0c;它提供了一种有序存储数据的方法&#xff0c;使得数据的访 问和操作变得更加高效。想要进一步了解&#xff0c;大家可以移步于上一篇文章&#xff1a;探索顺序表&#xff1a;数据结构中的秩序之美 今…

Linux 音视频SDK开发实践

一、兼容性适配处理 为什么需要兼容处理&#xff1f; 1、c兼容处理 主要有ABI兼容性问题&#xff0c;不同ubuntu系统依赖的ABI版本如下&#xff1a; ubuntu 18.04ubuntu 16.04ubuntu 14.04g7.55.44.8stdc版本libstdc.so.6.0.25libstdc.so.6.0.21libstdc.so.6.0.19GLIBCXXG…

org.slf4j日志组件实现日志功能

slf4j 全称是Simple Logging Facade for Java。facade是一种设计模式。 slf4j 是一个抽象程度更高的日志组件&#xff0c;本身并不提供实际的日志功能。实际的日志功能是通过log4j等日志组件实现&#xff0c;而使用者只需要关心 slf4j 给出的API。 slf4j 仅仅是一个为Java程序提…

STM32-ADC模数转换器

目录 一、ADC简介 二、逐次逼近型ADC内部结构 三、STM32内部ADC转换结构 四、ADC基本结构 五、输入通道 六、转换模式 6.1单次转换&#xff0c;非扫描模式 6.2连续转换&#xff0c;非扫描模式 6.3单次转换&#xff0c;扫描模式 6.4连续转换&#xff0c;扫描模式 七、…

QT打包exe文件,在其它电脑里双击exe就可以直接运行

想要不依赖QT环境&#xff0c;在其它电脑里直接双击exe文件就可以运行当前程序。具体打包过程如下&#xff1a; 使用QT编译出release版本的exe release版本运行无误后&#xff0c;需要找到当前构建生成的exe所在文件夹 可以看到具体目录在这里 我在该目录下的bin文件夹里找到…

高速视频采集卡设计方案:620-基于PCIe的高速视频采集卡

一、产品概述 基于PCIe的高速视频采集卡&#xff0c;通过PCIe3.0X8传输到存储计算服务器&#xff0c;实现信号的分析、存储。 北京太速科技 产品固化FPGA逻辑&#xff0c;适配视频连续采集&#xff0c;缓存容量2GB&#xff0c;开源的PCIe QT客户端软件&#xff0c…

在mt4上怎么查看CHFJPY品种的合约细则?

在MetaTrader 4 (MT4) 上查看CHFJPY品种的合约细则的方法如下&#xff1a; FXCM福汇官方个人注册登录流程 1.打开MT4软件并登录到您的交易账户。 2.在MT4界面的"市场观察"窗格中&#xff0c;找到并右键单击"CHFJPY"货币对。如果您无法找到"市场观察…

Transformer Decoder的输入

大部分引用参考了既安的https://www.zhihu.com/question/337886108/answer/893002189这篇文章&#xff0c;个人认为写的很清晰&#xff0c;此外补充了一些自己的笔记。 弄清楚Decoder的输入输出&#xff0c;关键在于图示三个箭头的位置&#xff1a; 以翻译为例&#xff1a; 输…

MyBatis ORM映射

MyBatis只能自动维护库表”列名“与”属性名“相同时的对应关系&#xff0c;二者不同时无法自动ORM 因此需要使用到ORM映射。 共有两种解决办法&#xff1a;1.列的别名 2.结果映射 1.列的别名 在SQL中使用 as 为查询字段添加列别名&#xff0c;以匹配属性名 public List<…

Kafka--Kafka日志索引详解以及生产常见问题分析与总结

一、Kafka的Log日志梳理 ​ 这一部分数据主要包含当前Broker节点的消息数据(在Kafka中称为Log日志)。这是一部分无状态的数据&#xff0c;也就是说每个Kafka的Broker节点都是以相同的逻辑运行。这种无状态的服务设计让Kafka集群能够比较容易的进行水平扩展。比如你需要用一个新…