多模态AI崛起,2022年人工智能5大发展趋势

3c01ecca1018eba8732a552d8591dacb.png

来源:CSDNnews

转自:中国机器人网

前言

国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点出 2022 年值得人们期待的五个人工智能发展趋势。

随着深度学习的开放,人工智能在几年中快速发展,尖端技术慢慢向普及应用到各行各业。以下是国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点的 2022 年值得人们期待的五个人工智能发展趋势。

趋势 1:大型语言模型(LLMs),定义交互式人工智能的下一个浪潮

    cb3fe8f94627000261f4e4aa2551e79d.png   

人工智能的语言模型是基于自然语言处理技术和算法创建的。比如在某一句话说一半的时候,这个模型会根据以往记录的实例,来推断出这句话后面的几个字。总的来说就是总结文本信息,甚至从纯文本中创建视觉图表。

大型语言模型(LLMs)是在包含巨大数据量的大规模数据集上训练的。像是 Google 的 BERT 和 OpenAI 的 GPT-2 和 GPT-3 就是 LLMs 很好的例子。据了解,GPT-3 中约有 1750 亿个参数,在 570 千兆字节的文本上进行训练。这些模型生成的东西可以从简单的文章到复杂的金融模型。现如今,包括 OpenAI、Hugging Face、Cohere、AI21 Labs 以及 AI12 在内的人工智能初创公司,正在通过训练具有数十亿参数的模型来推动 LLMs 的发展。

韩国一家叫做 Naver 的公司宣布,它已经建立了最全面的基于人工智能的语言模型之—— HyperCLOVA,一个类似于 GPT-3 的韩语模型。与上述模型不同的是,华为的 PanGu-Alpha 以及百度的 Ernie 3.0 Titan 则是在由电子书、百科全书和社交媒体组成的海量中文数据集上进行训练的。

在 2022 年,我们将看到大型语言模型成为下一代交互式人工智能工具的基础模型。

趋势 2:多模态人工智能的崛起

    1bcce8ecf241976761323c0e7ec9ff96.png   

" 模态 "(Modality)是德国理学家赫尔姆霍茨提出的一种生物学概念,即生物凭借感知器官与经验来接收信息的通道,如人类有视觉、听觉、触觉、味觉和嗅觉模态。多模态是指将多种感官进行融合,而多模态交互是指人通过声音、肢体语言、信息载体(文字、图片、音频、视频)、环境等多个通道与计算机进行交流,充分模拟人与人之间的交互方式。

传统的深度学习算法专注于从一个单一的数据源训练其模型。例如,计算机视觉模型是在一组图像上训练的,NLP 模型是在文本内容上训练的,语音处理则涉及声学模型的创建、唤醒词检测和噪音消除。这种类型的机器学习与单模态人工智能有关,其结果都被映射到一个单一的数据类型来源。而多模态人工智能是计算机视觉和交互式人工智能智能模型的最终融合,为计算器提供更接近于人类感知的场景。

多模态人工智能的最新例子是 OpenAI 的 DALL-E,该模型使用艺术家萨尔瓦多 - 达利和皮克斯的瓦力的谐音来命名。它可以从文本描述中生成对应图像。例如,当文本描述为 " 一个甜甜圈形状的时钟 " 被发送到该模型时,它就可以生成以下图像。

a302c723838c907161fb85d10a456e5e.png

图片来源 TheNewStark

谷歌的多任务统一模型(MUM)是多模态人工智能的另一个例子。它承诺通过从 75 种不同语言中挖掘出的上下文信息对用户搜索结果进行优先排序,从而提高用户的搜索体验。MUM 使用 T5 文本到文本框架,比 BERT 中流行的基于变换器的自然语言处理模型要强大 1000 倍。

英伟达的 GauGAN2 模型则将根据简单的文本输入生成照片般逼真的图像。它在一个单一的模型中结合了分割映射、内画和文本到图像的生成,使其成为一个强大的多模态工具,可以用文字和图画的混合来创造逼真的艺术。

在不远的未来我们就可以见到计算机视觉、语言以及语音模型的融合,这使得人工智能更丰富,更自然逼真。

趋势 3:简化和精简 MLOps

    c67217cd150eca39c946708bd04a1793.png   

机器学习操作(MLOps),是一个将机器学习投入到工业生产中的实践,是机器学习和 DevOPs 在软件领域交叉的产物,所以它在许多方面与 2012 年的 DevOps 相似。在 2012 年 DevOps 上线的时候,许多企业就意识到了它的价值,但是他们在实施 DevOps 的时候很困难,工具链非常复杂,生态系统也不够完善。而 MLOps 相比来说更加复杂,它的软件包包括安装、配置训练、推理基础设施、配置特征存储、配置模型注册表、监控模型的衰减以及检测模型漂移等所有的相关内容。其庞大的软件包也导致 MLOps 的部署比 DevOps 还困难。

MLOps 是被纳入基于云计算的 ML 平台的概念之一,平台包括如亚马逊网络服务的 Amazon SageMaker, Azure ML,   以及谷歌的 Vertex AI。然而,它所拥有的这些能力却不能用于混合和边缘计算这两个环境。因此,监测边缘计算的环境模型被证明是企业要面临的一个重大挑战。在处理计算机视觉系统和交互式人工智能系统时,创建一个为其服务的监测边缘计算的模型就变得更加具有挑战性。

随着 Kubeflow 和 MLflow 等开源项目的逐渐成熟,MLOps 其实已经很容易就能获取到。在未来几年我们或许可以看到一个精简和简化的 MLOps 方法横跨云领域和边缘计算环境。

趋势 4:AI 驱动的开发者生产力

    0382c382bd7b4667cd9ed0ad68ce27cf.png   

在未来,人工智能几乎会影响到 IT 行业的每个方面,包括编程和开发。在过去的几年里,我们已经看到了诸如亚马逊代码大师这样的工具,该产品会在开发者编程时,为其提供智能建议,以提高代码质量,并识别出应用程序中最重要的代码行。就在最近,Github Copilot 作为一个 " 人工智能配对程序员 " 首次亮相,协助开发人员编写高效的代码。而 Salesforce 的研究团队也推出了 CodeT5,这是一个开源项目,将帮助 Apex 开发人员进行由人工智能驱动的编码。Tabnine,即以前的 Codata,将智能代码完全带到了主流开发环境。Ponicode 也是一个 AI 驱动的工具,可以提供函数创建、可视化和运行单元测试的快捷方式。

d5a4aa6d99b285c798d1cab0a4f31ebc.png

图片来源 TheNewStark

大型语言模型(LLMs)的兴起和开源代码更广泛的可用性,使 IDE 供应商能够再其基础上建立智能代码生成和分析系统。

展望未来,人们期望看到能够从内联注释中生成高质量和紧凑代码的工具。它们甚至能够从一种语言编写的代码翻译成另一种语言,通过将传统代码转换为现代语言来实现应用程序的现代化。

趋势 5:云平台新的垂直化人工智能解决方案

    4e079802a13a778b487f81c6bcc69272.png   

世界领先的人工智能供应商,包括亚马逊、谷歌和微软,都正专注于将研究和开发工作商业化。他们通过旗下的云平台提供托管服务,并建立硬件设备,配备人工智能加速器和针对特定场景的预训练模型。

亚马逊连接和谷歌联络中心 AI 是垂直整合的典型例子。两者都利用机器学习能力来执行智能路由,由机器人驱动的客服对话,以及对联络中心代理商的自动协助。AWS Panorama 可以连接到现有的 IP 摄像机,以此来执行基于计算机视觉的推理。客户可以在其云平台训练新的模型,并将它们部署在全景设备的边缘。Azure Percept 采用了类似的方法,在边缘提供计算机视觉模型和交互式人工智能。微软基于 Azure 上现有的物联网、人工智能和边缘计算服务建立了 Percept。

最后,亚马逊 Lookout for Equipment 和谷歌 Cloud Visual Inspection AI 等服务,利用基于云的人工智能平台,对设备进行预测性维护和产品的异常检测。这些服务是专为零售和制造业定制的。

在 2022 年,我们将看到人工智能平台和云供应商利用前沿研究技术和现有的管理服务,提供针对特定的例子和场景的解决方案。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

0c42223567f76bc8371c6b2c0442771b.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32493.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能驾驶奥运会 Duckietown AI Driving Olympics

重要参考链接: 1. http://www.theconstructsim.com/ros-developers-live-class-develop-with-ros/ 2. https://www.duckietown.org/research/AI-Driving-Olympics We now have templates for ROS, PyTorch, and TensorFlow, as well as an agnostic template. Us…

使用Recast.AI创建具有人工智能的聊天机器人

很多SAP顾问朋友们对于人工智能/机器学习这个话题非常感兴趣,也在不断思考如何将这种新技术和SAP传统产品相结合。Jerry之前的微信公众号文章C4C和微信集成系列教程曾经介绍了Partner如何利用SAP Cloud for Customer内置的社交媒体集成框架,做一些简单的…

2020中国人工智能年度评选开启,4大类别7大奖项申报正式启动

编辑部 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在,是时候从落地的角度给予AI行业年度性评价了。 从2018年开始,量子位的「中国人工智能年度评选」已经进行了两年。 过去的两届评选,我们锁定了不少风头正盛或者极具潜力的公司&#xff0c…

最全整理:中国人工智能百强企业(100)榜单

http://blog.itpub.net/29829936/viewspace-2375626/ 2019-01-11 10:25:24 1、创略科技 总部:上海 简介:创略科技隶属于创络(上海)数据科技有限公司。创略科技是一家客户数据技术和AI公司,总部设立在上海&#xff0c…

NDD(notepad--)的AI机器人插件制作过程

兴趣是最好的老师。周末晚上熬夜到半夜十二点多,花了几个钟头给NDD制作了一款AI搜索问答插件,时间仓促界面较丑,后续插件代码开源并维护和美化。Notepad记事本工具挺常用的,把AI接口接入进来使用起来方便多啦,直接在上…

Qt常用的按钮控件编程(四)-- QCheckBox 按钮

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言6、QCheckBox 按钮6.1 例程功能和程序执行效果6.2 生成项目6.3 添加资源文件6.3.1 添加图片资源6.3.2 添加 qss 文件 6.4 完成代码编辑6.4.1 修改项目文件 _rad…

chatgpt赋能python:Python按键控制灯:简单易用的物联网解决方案

Python按键控制灯:简单易用的物联网解决方案 随着物联网技术的快速发展,人们对智能家居的需求也越来越高。本文将介绍如何使用Python按键控制灯,轻松实现家居自动化控制,为您的生活带来方便与舒适。 Python语言简介 Python是一…

chatgpt赋能python:Python中按下某个按键的实现方法

Python中按下某个按键的实现方法 Python是一种广泛应用于各种领域的高级编程语言,可以用于编写各种类型的应用程序和工具。其中,它在游戏开发方面有着广泛的应用。而在游戏开发过程中,按键响应是至关重要的一个组成部分。本文将带领读者了解…

chatgpt赋能python:Python校验用户按键的方法

Python校验用户按键的方法 在Python编程中,我们有时需要校验用户按键的输入。这对于需要用户输入特定字符或按键组合的程序来说是非常必要的。本文将介绍一些Python校验用户按键的方法。 使用getch()函数 Python的getch()函数可以用于校验用户的按键输入。这个函…

chatgpt赋能python:Python编程中的按键事件

Python编程中的按键事件 在Python编程中,按键事件是一项非常有用的功能。通过监控按下键盘中的特定键,您可以触发程序的某些特定操作,这些操作可用于增强应用程序的功能和用户体验。 按键事件的基本工作原理 Python中的按键事件基于图形用…

网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录

简介: 网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能…

如何用ChatGPT做品牌项目的二手信息搜集?

该场景对应的关键词库(25个): 品牌案例、竞品、信息来源、项目分析、官方渠道、品类、品牌、节日节庆、明星、国家、奖项、代理商、项目名称、项目描述、品牌介绍、竞争情况、运营数据、财务信息、交易信息、法律问题、网络平台、行业人士、品…

金山办公的WPS AI将引入大模型能力(LLM)到表格、文字、演示和PDF四大组件

🚀 金山办公的WPS AI将引入大模型能力(LLM)到表格、文字、演示和PDF四大组件,并支持桌面电脑和移动设备。 金山办公的WPS AI将引入大模型能力(LLM)到表格、文字、演示和PDF四大组件,并支持桌面…

系统内的在线协同富文本,如何寻求解决方案?

如果只是普通的富文本编辑,前端市面上已经有成熟的解决方案, 来自国产的富文本编辑器,开源 Web 富文本编辑器,开箱即用,配置简单。支持 JS Vue React 。 GitHub - wangeditor-team/wangEditor: wangEditor —— 开源…

WPS Office AI 开放内测,名额有限,先到先到

没等来Microsoft 365 Copilot,等来了 WPS AI,作为国内第一款集成多类AI功能的日常办公多件套应用,真是广大用户的福音。内测申请入口已经放开了,想一睹风采且想让自己的Office灵动起来的,抓紧行动(文末获取…

WPS Office AI实战:AI带来的文档智能化体验

前面我们已经了解过 AI 在PPT制作、Word写作方面带来的革命性效率提供,今天一起来聊聊在线文档的AI应用。如果你习惯用在线文档的话,一样也可以享受到AI的强大优势。金山在线智能云文档已经接入WPS Office AI套件大家庭,用AI来改造写作的新时…

不用等微软了!实测:全线接入AI的WPS,做PPT就是一句话的事

金磊 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 要问现在办公、学习最最最fashion的姿势是什么? 那必然是跟AI来一个深度合体。 例如老板丢过来一份纸质合同(还是全英文的),让你快速浏览并做总结。 此时不必惊慌,遇事掏…

与ChatGPT 技术对话 42 天后,30多岁男子过于焦虑自杀身亡...

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 来自:极目新闻 最近ChatGPT的飞速发展引起了世界范围的广泛关注,有人兴奋,也有人担忧。 据比利时媒体LAvenir3月28日报道,一名热衷于环境问题的比利时男子…

影刀知识点总结

判断字符串之间的包含关系,用if条件就可以。影刀社区:https://www.winrobot360.com/community/homePage启动excel的意思是,如果没有打开,就打开,如果打开了,就激活已打开的excel,输入内容&#…

影刀Rpa 、英佑科技面试总结

文章目录 1、dubbo spi 都使用过哪些? Java Spi 的缺点有哪些?2、dubbo的负载均衡策略有哪些3、设计一个rpc,有哪些模块4、Dubbo注册中心有哪些5、apollo框架,如何保证容错6、List线程安全实现方式有哪些?7、mysql 索引& 优化CSDN话题挑战赛第2期 参赛话题: 面试宝典…