2024年企业级通用人工智能的关键技术趋势

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在当今这个时代,企业级人工智能与众不同之处在于,它专注于可测量、受控制的产出,企业可以将其与自身品牌联系起来。今年,技术工具将主导舞台,使得通用人工智能(以下简称为“它”)克服挑战,成为一种可靠的工具,而不仅仅是潜力所在。

数据科学家在预测自己领域的未来方面确实很糟糕(这里有点自嘲!)。因此,对这些预测,请以95%的置信区间来接受 :)

转变资本支出周期这一块,现如今没有哪个企业不投资于“它”。

今年的某个时候,这些投资将开始要求回报。新技术的资本支出周期通常遵循18个月的规律:投资18个月,找到市场18个月,然后决定是否进一步开发以达到顶尖位置或转而投资于其他领域。虽然构建通用人工智能的概念验证是容易的部分,但将其投入生产却极具挑战性,鉴于幻觉问题、治理缺失、缺乏评估标准和架构混乱等问题。

到2024年秋天,我们将看到公司们努力为去年春天开始嵌入人工智能的一切找到产品市场契合点。这意味着一些企业将无法达标,而真正的强者将从人群中脱颖而出。这将意味着那些找不到产品市场契合点的公司将面临有关其投资和工作团队的艰难决定。

这是否意味着通用人工智能的泡沫即将破灭?远非如此。然而,我们将看到企业通过整合资源,不仅仅关注于概念验证项目,而是关注于他们打算在今年秋天结束之前投入生产的项目。那些没能做到的,将不得不要么展示出成果,要么剥离。

推理优化这一领域,在迄今为止的大多数通用人工智能的概念验证中,最被忽视的就是运行这些庞大的基于大型语言模型的推理的成本。

看似单位价格很小,但对于一个拥有几百万推理调用的中等规模公司来说,成本很快就会累积起来。今年的一个重点将是开发推理优化方法。这将是一个可以平衡成本效益权衡的领域,通过考虑各种因素如准确性、投资回报率预测、底层的本地云对比云基础设施对比软件即服务模型、大型语言模型的大小,以及它是否应该是检索增强生成或微调或自定义调整模型等。

至于想要利用“它”为客户增加价值的公司来说,关键在于如何利用其数据的独特性。这意味着使用检索增强生成或微调等方法来实现。

今年,我们还将看到对小型语言模型、中型语言模型和非常小的语言模型的兴趣激增,这些模型通常具有不到7亿参数,可以轻松地适应单个图形处理单元。我之前也在我的博客中写过这个话题:“为什么更大并不总是更好”。

“多”将是今年的关键词:多模型、多模态和多云。

对于任何企业来说,协调这么多选择将会产生一系列新问题。今年,人工智能领导者将需要解决几个挑战:

企业希望在其架构中支持多少个不同的大型语言模型?(记住,由于图形处理单元短缺,仅加载和推理一个340亿参数的大型语言模型就需要6个图形处理单元)。我们是否想要支持所有这些,还是选择更多的小型模型,或几个中等大小的模型,或一个大型和一个小型模型?
单一云运行风险高且昂贵,那么我们如何在多个云与本地大型语言模型之间管理工作负载?通常,本地模型部署从长远来看可以节省大量资金,并提供更好的治理和输出控制。
多模态——结合文本、图像、视频和音频将是一个值得关注的主题。部署这些多模态模型仍然是一个需要开发工具的领域。
如果有一个领域让顶级执行官们在通用人工智能方面夜不能寐,那就是人工智能治理。他们不知道何时他们的聊天机器人应用会提供错误信息,他们将不得不支付罚款(如加拿大航空的案例),或何时它会脱口而出仇恨内容并被撤下(如谷歌),或如何遵守新的一套规定,如欧盟法律。

所有公司都想知道的答案是,一旦将其投入生产后,它将如何运作。尚未解决的问题是“如何衡量”它。没有简单的度量或解决方案来衡量幻觉,特别是当涉及到没有普遍基准真相的特定领域数据(如政策)时。另一个挑战是为合规性而工具化,就像为审计目的一样。使黑盒变得开放和可预测是阻碍许多公司将他们的通用人工智能概念验证推向生产的一个挑战。

期待在私人和公共空间对这个问题进行大量讨论。希望美国国会能通过一些法律,行业能采纳一套类似于药物试验的通用标准。当然,大部分还是一厢情愿的想法,直到那时,像WatsonX.Governance这样的工具将是不可或缺的。

最后但同样重要的是,数据科学家的回归(或称为绝地武士)。

去年,似乎成为一个人工智能工程师就是从事人工智能工作所需的一切(一些误导性的新报道声称,成为一名人工智能工程师可以让你年薪90万到40万美元,而无需其他薪水)。

今年可能会慢慢意识到的最后一个变化是,数据科学家仍然非常需要,以将通用人工智能从潜力推向效能。

首先,两者有什么区别?传统的机器学习需要训练模型,数据科学家会利用他们的统计和算法专业知识来使模型适应你的用例。有了大型语言模型,你已经有了一个预训练的模型,所以人们认为你不再需要这样做了。无论你需要什么都可以通过提示调优来完成,这是一种聪明的英语写作。因此,人工智能工程师的数量增加了,他们不太关注科学部分,而是更多地专注于机器学习运维工程,以配置、集成和部署通用人工智能到应用程序中。

事实证明,现实要复杂得多,特别是对于企业级通用人工智能。以检索增强生成应用为例,为几十个文档构建检索增强生成很容易,但当涉及到几百万个文档时,你需要了解检索和重排算法(如KNN、编码器、BM-25)的深度知识。对于另一个用例,如text2sql,你需要技能来微调模型(比如PEFT、束搜索等)。此外,所有通用人工智能应用都需要评估模型的技能,并提出适合该数据集和用例的正确统计指标(如NDCG、Fleiss-Kappa)。所有这些意味着,统计和机器学习算法的核心技能仍然非常相关,仅仅组合起来是不够的。

因此,数据科学家将作为绝地武士回归,以使通用人工智能成为现实。核心统计技能将是你能多快提供高度准确的通用人工智能解决方案的关键因素。

期待意想不到的事情发生。人工智能的美在于它的不可预测性(这不是一个缺陷,而是一个特性,鉴于一切都建立在概率之上)。包括Sam Altman在内的每个人都未能预测当前的通用人工智能浪潮。我们首先看到的是2012年视觉模型的高峰和自动驾驶汽车的炒作。现在,又有了关于大型语言模型的另一波热潮。

所有企业都应该准备好,以迎接可能出现的任何意外。他们自己的计划可能会因为一些表现超出预期的新模型(如Llama3或GPT-5)或某些真正不同寻常的新事物而被推翻。一个新的模型、方法、数据集或服务器都可能颠覆现状。在通用人工智能领域,总是要期待意想不到的高潮和低谷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/283285.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

爬虫(七)

1.批量爬取知网数据 lxml:是 Python 的一个功能强大且易用的 XML 和 HTML 处理库。它提供了简单又轻巧的 API,使得解析、构建和操作 XML 和 HTML 文档变得非常方便。lxml 库通常用于处理 XML 和 HTML 文档,例如解析网页、处理配置文件等。openpyxl:是 Python 中用于操作 Ex…

二、Kubernetes(k8s)中部署项目wordpress(php博客项目,数据库mysql)

前期准备 1、关机顺序 2、开机顺序 (1)、k8s-ha1、k8s-ha2 (2)、master01、master02、master03 (3)、node01、node02 一、集群服务对外提供访问,需要通过Ingress代理发布域名 mast01上传 ingress-nginx.yaml node01、node02 上传 ingress-nginx.tar 、kube-webh…

五、C#归并排序算法

简介 归并排序是一种常见的排序算法,它采用分治法的思想,在排序过程中不断将待排序序列分割成更小的子序列,直到每个子序列中只剩下一个元素,然后将这些子序列两两合并排序,最终得到一个有序的序列。 归并排序实现原…

Android Studio实现内容丰富的安卓校园二手交易平台(带聊天功能)

获取源码请点击文章末尾QQ名片联系,源码不免费,尊重创作,尊重劳动 项目编号083 1.开发环境android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端: 1.注册登录 2.查看二手商品列表 3.发布二手商品 4.商品详情 5.聊天功能…

【超全详解】Maven工程配置与常见问题解决指南

Maven工程 目录 Maven工程一、如何检查Maven工程是否配置正确?1、检查路径2、检查基本配置3、其他配置 二、Maven的基本操作基本操作install和package的区别 三、获取别人的Maven工程之后如何修改?四、如何正确写好配置文件?1.寻找配置资源2.…

第六十一回 放冷箭燕青救主 劫法场石秀跳楼-编译安装飞桨paddlepaddle@openKylin+RISCV

卢俊义在水里被张顺抓住,用轿子抬到了梁山。宋江等人下马跪在地上迎接,请他坐第一把交椅。卢俊义宁死不从,大家只好说留他在山寨几天,先让李固带着马车货物回去。吴用对李固说,你的主人已经答应坐第二把交椅了&#xf…

基于python+vue分类信息服务平台移动端的设计与实现flask-django-php-nodejs

分类信息服务平台是在Android操作系统下的应用平台。为防止出现兼容性及稳定性问题,框架选择的是django,Android与后台服务端之间的数据存储主要通过MySQL。用户在使用应用时产生的数据通过 python等语言传递给数据库。通过此方式促进分类信息服务平台信…

51单片机中断信号的种类及应用场景

在嵌入式系统中,中断是一种重要的事件处理机制,它可以在程序执行的任何时候暂停当前任务,转而执行与之相关的特殊任务或事件。51单片机作为一种常见的微控制器,其中断功能在各种应用中起着关键作用。然而,对于初学者和…

【理解机器学习算法】之分类问题的模型评估(ROC-AUC)

ROC曲线(接收者操作特性曲线)和AUC(曲线下面积)是在不同阈值设置下,用于分类问题的性能度量工具。下面是它们所代表的含义以及使用方法: ROC曲线 代表含义:ROC曲线是一个图形化的表示&#xf…

Unity---Lua语言

Lua Binaries Download 13.2 逻辑热更新——Lua1-3_哔哩哔哩_bilibili nil表示空 只有false和nil为false,其他值都为true ..连接两个字符串

浙江IGM机器人K5控制柜维修需要注意哪些问题?

IGM机器人K5控制柜常见故障及维修方法 1、电源故障: 表现为IGM机器人K5控制柜不能开机或突然断电。 检查:检查电源线是否连接良好,有无破损;检查电源模块的输出电压是否正常; 维修方法:如电源模块损坏&…

硬核分享|AI语音识别转文字与自动生成字幕

硬核分享|AI语音识别转文字与自动生成字幕_哔哩哔哩_bilibili 在现代快节奏的生活中,语音转文字工具成为了我们工作和学习中的得力助手。它能够将我们说出的话语迅速转化为文字或者将语音视频自动生成字幕,提供便捷和高效。 语音转文字转字幕工具是一种…

docker学习笔记 三-----docker安装部署

我使用的部署环境是centos 7.9 1、安装依赖工具 yum install -y yum-utils device-mapper-persistent-data lvm2 安装完成如下图 2、添加docker的软件信息源 yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo url地址为如…

【ReactJS】使用GoJS实现自己的图表App

目录 1:用于绘制自定义图表的JavaScript库:用于绘制UML(或BPMN或ERD …)图表的JavaScript库:2:为什么选择GoJS?3:让我们使用现有的React应用程序:步骤1:步骤2:步骤3:步骤4:推荐超级课程: Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战1:…

IDEA上的Scala环境搭建

Scala环境搭建 一、搭建Scala开发环境 安装Scala编译器 安装scala-2.12.10.msi 检查scala安装情况 在dos窗口输入scala,检查是否能够进入编译器。进行简单的scala命令计算 在IDEA中进行scala编码 File - Settings - Plugins - MarketPlace中搜索scala插件 安…

RabbitMQ在Java中使用 SpringBoot 从基础到高级

充分利用每一个监听者 需要充分利用每一个消费者,需要在配置文件中加上prefetch配置并设置为1 rabbitmq:listener:simple:prefetch: 1 # 每次只能获取一条消息,处理完成才能获取下一个消息创建交换机和队列 创建队列 "fanout.queue1"&…

集简云新增“文本语音转换”功能,实现智能语音交互

为丰富人工智能领域的应用集成,为用户提供更便捷和智能化的信息获取和视觉创作方式,本周集简云上线了内置应用—文本语音转换。目前支持OpenAI TTS和TTS HD模型,实现文本语音高效智能转换,也可根据你的产品或品牌创建独特的神经网…

二、SpringBoot3 配置文件

本章概要 统一配置管理概述属性配置文件使用YAML 配置文件使用批量配置文件注入多环境配置和使用 2.1 统一配置管理概述 SpringBoot工程下,进行统一的配置管理,你想设置的任何参数(端口号、项目根路径、数据库连接信息等等)都集中到一个固定…

福建科立讯通信 指挥调度管理平台 SQL注入漏洞复现(CVE-2024-2620、CVE-2024-2621)

0x01 产品简介 福建科立讯通信指挥调度管理平台是一个专门针对通信行业的管理平台。该产品旨在提供高效的指挥调度和管理解决方案,以帮助通信运营商或相关机构实现更好的运营效率和服务质量。该平台提供强大的指挥调度功能,可以实时监控和管理通信网络设备、维护人员和工作任…

如何在linux环境上部署单机ES(以8.12.2版本为例)

ES安装(以8.12.2版本为例) 首先创建好对应的文件夹然后在对应的文件夹下执行依次这些命令 1.wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.12.2-linux-x86_64.tar.gz 2.wget https://artifacts.elastic.co/downloads/…