AIGC和智能数字化新时代

目录

    • AIGC的意义
    • AIGC底座及生态
    • AIGC赋能内容创作4大模态
      • AI文本生成
      • AI音频生成
      • AI图像生成
      • AI视频生成
    • AIGC的技术思想
    • AIGC的重要基建Transformer
    • ChatGPT的训练过程示意图
      • ChatGPT的局限性包括
    • AIGC的职能应用
      • AIGC与产品研发
      • AIGC与市场营销
      • AIGC与管理协作
    • AIGC的行业应用
      • AIGC咨询行业应用
      • AIGC影视行业应用
      • AIGC电商行业应用
      • AIGC教育行业应用
      • AIGC金融行业应用
      • AIGC医疗行业应用
      • AIGC自动驾驶行业应用
    • AIGC的产业地图
      • 上游:数据服务
      • 中游:算法模型
      • 下游:应用拓展
    • AIGC的未来

AIGC的意义

1、AIGC实现人工智能“内容”生成
2、AIGC的核心技术价值实现了“自然语言”与人工智能的融合
3、AIGC的绝对优势是其逻辑能力
4、AIGC实现了机器学习的集大成
5、AIGC开创了“模型”主导内容生成的时代
6、AIGC开放性创造力的重要来源是扩散diffusion模型
7、AIGC的进化是参数以几何级数扩展为基础
8、AIGC的算力需求呈现显著增长
9、AIGC和硬技术相辅相成
10、AIGC将为区块链、NFT、Web3.0和元宇宙带来深层改变
11、AIGC催生出全新的产业体系和商业化特征
12、AIGC的法律影响和监管
13、AIGC正在引领人类加速逼近“科技奇点”

AIGC底座及生态

其底座是Transformer基础模型
在这里插入图片描述
AIGC产业生态
在这里插入图片描述
AIGC产业规模生态分布
在这里插入图片描述
小结:
人工智能网络并没有直接模仿大脑,但最终看起来却像大脑一样,这在某种意义上表明,人工智能和自然之间似乎发生了某种趋同演化
——丹尼尔·亚明斯

数字时代:“代码即法律”
——劳伦斯·莱斯格

智能时代:向量和模型构成一切
——朱嘉明

AIGC赋能内容创作4大模态

AI文本生成

幻想一下AI生成文本的未来:
程序员、研究员、产品经理等涉及重复性工作的脑力劳动者可能都将被AI取代,这些职业可能都演变成了新的职业——提示词(Prompt)工程师,目的就是帮助人类更好地与AI互动。

AI音频生成

AI图像生成

针对AI与人类的辩题,Midjourney的创始人大卫·霍尔兹(David Holz)这样评价:“AI是水,而非老虎。水固然危险,但你可以学着游泳,可以造舟,可以造堤坝,还能借此发电;水固然危险,却是文明的驱动力,人类之所以进步,正是因为我们知道如何与水相处并利用好它,水给予更多的是机会

AI视频生成

AIGC的技术思想

人们总喜欢活在舒适区内,用粗暴的断言安慰自己,例如机器永远无法模仿人类的某些特性。但我给不了这样的安慰,因为我认为并不存在无法模仿的人类特性。
——艾伦·图灵

机器学习的概念:
机器学习是指“计算机程序能从经验E中学习,以解决某一任务T,并通过性能度量P,能够测定在解决T时机器在学习经验E后的表现提升
强化学习的概念:
强化学习是机器学习除监督学习与无监督学习之外的又一领域,也可以与深度学习结合进行深度强化学习。区别于监督学习和无监督学习,强化学习并不是要对数据本身进行学习,而是在给定的数据环境下,让智能体学习如何选择一系列行动,来达成长期累计收益最大化的目标。强化学习本质上学习的是一套决策系统而非数据本身。
在这里插入图片描述
在这里插入图片描述
因此,强化学习就是让人工智能通过不断的学习试错,找到合适的策略去选择一系列行动,来达成目标。在构建策略时,还有一个需要考虑的关键因素叫作价值(Value),它反映的是将来能够获得所有奖励的期望值。

AIGC的重要基建Transformer

参见本人博客:大模型干货解读
https://blog.csdn.net/weixin_48579885/article/details/131633219?spm=1001.2014.3001.5501

ChatGPT的训练过程示意图

在这里插入图片描述

ChatGPT的局限性包括

  • 有时会写出看似合理但不正确或荒谬的答案
  • 对输入措辞的调整或多次尝试相同的提示很敏感。例如,给定一个问题的措辞,模型可以声称不知道答案,但只要稍作改写,就可以正确回答
  • 回答通常过于冗长并过度使用某些短语
  • 对于模棱两可的问题,模型通常会猜测用户的意图,而非让用户澄清问题
  • 模型有时会响应有害的问题或表现出有偏见的行为
  • 在数学和物理等需要进行数字推理的任务中仍然会出现一些错误

AIGC的职能应用

有些人声称这种技术是人工智能,但实际上它强化的是人类自身。因此我认为,我们将增强人类的智能,而非“人工”的智能。
——吉尼·罗曼提

AIGC与产品研发

主要应用方式如下:

  • 通过辅助编程提高代码生产效率。
  • 生成应用直接将需求变成产品
  • 创建和维护文档注释,提高沟通效率。
  • 测试代码,纠正错误。
  • 根据不同种类的用户设备生成新的代码

AIGC与市场营销

使用AI生成创意营销内容并非市场中的新趋势,事实上,早在2015年淘宝“双十一”促销活动后,阿里巴巴开发出了一款叫作“鲁班”的产品,也被称为“千人千面”。
以鲁班为代表的AIGC创作工具还有另外一个优点:能够分析大量的数据,从而生成与目标受众更相关、更吸引人的内容。

AIGC与管理协作

国内使用最广泛的该类软件是字节跳动旗下的飞书妙记,它可以自动在线生成会议纪要,通过智能语音识别转化成文字,把会议交流沉淀为要点文档,从而让会议成员更专注,工作更高效
AIGC工具可以帮助企业整理各种类型的相关文件。在企业的各种项目中,常常会有不同格式的文档(Excel电子表格、 PDF文档、PowerPoint演示文稿等),它们可能被存储在不同的平台上(云盘、线上文档、电子邮件等)。通过AIGC工具,公司可以训练一个模型来自动地将这些数据组织成相关的类别,例如按部门、项目或主题分类

AIGC的行业应用

深入每个行业,你会发现人工智能正在改变工作的性质。
——丹妮拉·鲁斯(Daniela Rus)

AIGC咨询行业应用

在新闻资讯的生产环节,基于自然语言生成和自然语言处理技术,AI交出的结构化写作“答卷”已经逐步得到从业者和内容消费者的认可,因此已经涌现了一批成熟玩家。
在资讯内容的分发环节,AI 除了助力个性化内容推荐外,也开拓了全新的应用场景,即驱动虚拟人主播,以视频或直播的形式进行内容发放,打造沉浸式体验
缺点:
首先,AI撰写的文稿仍稍显呆板单调,模板化强,无法像人类记者一样根据具体报道的性质和语境调整叙述的策略,以达到更好的传播效果。同时,AI当前无法撰写深度报道,文字缺少温度和人文关怀等要素。
基于这些原因,AI写稿最初也是多被用于财经、体育、突发事件等垂直场景,跨领域迁移、适配以及产出的能力仍然不足。并且,过度依赖 AI进行信息抓取以及撰稿也可能导致信息茧房和回声室效应加剧,甚至带来伦理失范的问题。

AIGC影视行业应用

在剧本写作阶段,AI已经能够帮助影视人更好地释放创意,但从剧本上的文字到最终呈现给观众的视听盛宴,仍有一段漫长的旅程,而AI却能在这个想法落地的过程中继续保驾护航,帮助实现从“好创意”到“好表达”的跨越,帮助影视工作者化“不可能”为“可能”。
在迪士尼看来,FRAN是第一个“实用、全自动、可用于影视制作”的图像人脸重塑方案。随着此类技术的不断进步,使用成本和门槛将持续降低,可以预见未来AI年龄调整将在影视行业获得更加广泛的应用。
AI不仅能让“时光倒流”,甚至还可让逝者“复生”,在虚拟的彼岸再度和观众见面,甚至交互。这一技术在影视领域已经得到了许多应用,其中最知名的案例之一就是《速度与激情7》。
然而,死者形象复生这一愿景的出发点虽然美好,但也不可避免地带来了伦理相关的挑战。逝者本人生前是否接受使用技术手段让形象重活一次?最终呈现出来的形象,以及更关键的言行,是否足够客观、准确?商家有无权力利用逝者的信息和形象牟利?人们是否愿意接受这般形式的互动?这样的AIGC形式还值得人们更多的思考。

AIGC电商行业应用

阿里巴巴的每平每屋业务就利用AI视频建模等AIGC技术,实现了线上“商品放我家”的模拟展示效果。家居购物的一个痛点在于,用户非常容易在线上买到看起来好看,但是与整体家居风格并不匹配的商品,从而导致较高的退货率。而阿里巴巴的每平每屋业务,将AIGC的功能植入手机淘宝和每平每屋的App之中,用户可以通过拍摄扫描家居环境,以及家里与商品进行搭配布局的家居,让AI生成线上的3D模型,并与想要购买的商品3D模型进行组合,让用户在线预览整体的组合效果。

AIGC教育行业应用

德尔菲神庙的门廊上镌刻着苏格拉底的箴言: “认识你自己。
在“AI教师”的时刻护航下,学习者得以不断形成习得-评测-反馈的闭环,有效提升学习效果。微软就在该方向布局颇多,例如,微软亚洲研究院和华东师范大学合作研发的中文写作智能辅导系统“小花狮”,能够借助自然语言处理等技术,实时为学生作文结果评分,并能够分析其背后原因,从而帮助学生找到属于自己的发力点,实现进步。

AIGC金融行业应用

目前,AIGC技术已经取代了金融行业的大量客户服务人员和客户经理。例如在2017年4月,富国银行就开始试点一款基于Facebook Messenger平台的智慧客服项目。在该项目中,人工智能可以代替客服与客户交流,为客户提供账户信息查询、重置密码等基础服务。

AIGC医疗行业应用

AI预问诊就是一个最典型的应用场景,2021年,复旦大学附属眼耳鼻喉科医院与腾讯医疗健康签署了战略合作协议,将全面打造数字化医院建设新标杆、新范式,深度推动医院数字化转型,在“智能预问诊”等业务上已快速落地推进。
AIGC聊天机器人只是一个隔着屏幕的软件程序,用户不必担心自己被评判或者隐私被泄露。其次,相比于心理咨询师职业生涯的案例总数,AIGC聊天机器人有海量交流数据和知识模型支撑,可以在持续迭代更新的同时保持冷静和中立,提供一种可靠且可自己进化的心理咨询服务。
除了心理健康之外,AIGC在对听障、语障人士的支持领域也发挥着重要作用。获得科大讯飞战略投资的音书科技就是这样一家公司。音书科技不仅为听障、语障群体提供各种场景下的翻译字幕系统和手语系统,以支持他们的日常交流和信息获取,还提供了AI言语康复系统。根据音书科技官网显示的数据,目前音书科技已经对外提供数亿次辅助沟通服务,大大改善了听障、语障群体的沟通现状。

AIGC自动驾驶行业应用

其令人惊艳的**“对话聊天”能力**,成为提升智能座舱语音交互质量的重要工具
基于AIGC算法模型创建、生成合成数据迎来重大进展,有望解决自动驾驶发展应用过程中的数据限制。
是通过合成数据来改善基准测试数据的质量来实现数据增强和数据模拟,解决数据匮乏、数据质量等问题;
是利用合成数据训练AI模型可以有效避免用户隐私问题;
是合成数据可以自动创建、生成现实世界中难以或者无法采集的数据场景,能有效应对长尾、边缘案例,提高模型算法的准确性、可靠性;
是合成数据技术可以实现更廉价、高效地批量生产自动驾驶模型训练开发所需的海量数据,毕竟人工标注一张图片可能需要6美元,但人工合成的话只需要6美分
AIGC在自动驾驶场景中还扮演着智能安全辅助助手的角色。通过对传感器和周围环境的深度识别和判断,该技术能够及时发现并识别出行驶中的安全隐患,如行人、动物、障碍物等,并以最快速度预警驾驶员或操控自动驾驶系统采取避免碰撞的安全措施
AIGC还可以识别驾驶员的身份和情绪,并对其进行智能分析和判断。在检测到驾驶员疲劳、心情低落等异常情况时,系统会及时提醒或自动开启安全停车模式,保障司乘安全

AIGC的产业地图

总体来看,整个AIGC的产业地图可以分为三类:上游数据服务产业、中游算法模型产业、下游应用拓展产业
在这里插入图片描述

上游:数据服务

在这里插入图片描述
其中一家scale公司,主要受益于规模经济、客户粘性和资源垄断
数据标注服务本身很难建立起高度的客户黏性,而Scale之所以可以留住客户,得益于它在2020年4月推出的Scale Document。 Scale Document不仅为数据贴标签,还与客户合作建立定制模型。这使得客户切换服务商的成本变高,因为需要重新训练模型。
这里所说的资源垄断指的不是垄断数据而是垄断人才,数据的所有权是客户的,即使通过Scale来完成打标签过程,也不能把这些数据误认为是Scale的资产。但随着数据流过Scale平台,这些数据同样训练了Scale平台标注算法的模型能力,也沉淀了这个领域的众多人才,人才是这个领域的宝贵资源

中游:算法模型

在这里插入图片描述

下游:应用拓展

在这里插入图片描述

AIGC的未来

我从来不想未来,因为它来得太快。
——阿尔伯特·爱因斯坦(Albert Einstein)

人工智能的发展经历过多次春天与寒冬,每一次春天与寒冬的交织都与“通用化”和“专用化”的分歧息息相关。
大模型之“大”除了体现在参数规模上,同样也体现在数据量上

当人类想要打造人工智能时,一个非常直接的思路是去让机器模仿人来获取智能的学习方式。这种“仿人模式”一直都是人工智能新的算法模型的重要思路来源,也是技术发展的重要推动力。

目前,AIGC所产生的风险主要集中在版权问题、欺诈问题和违禁内容三个方面

白宫科技政策办公室颁布了10条关于人工智能法律法规的原则,为制定AIGC开发和使用的监管和非监管方法提供参考:

  • 建立公众对人工智能的信任
  • 鼓励公众参与并提高公众对人工智能标准和技术的认识
  • 将高标准的科学完整性和信息质量应用于AI和AI决策
  • 以跨学科的方式使用透明的风险评估和风险管理方法
  • 在考虑人工智能的开发和部署时评估全部社会成本、收益和其他外部因素
  • 追求基于性能的灵活方法,以适应人工智能快速变化的性质
  • 评估人工智能应用中的公平和非歧视问题
  • 确定适当的透明度和披露水平以增加公众信任
  • 保持控制以确保AI数据的机密性、完整性和可用性,从而使开发的AI安全可靠
  • 鼓励机构间协调,以帮助确保人工智能政策的一致性和可预测性

我们前进着,我们也思考着,直至抵达科技的彼岸。
正如尼克·博斯特罗姆(Nick Bostrom)说的:“机器智能是人类需要做出的最后一项发明。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/59214.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据分析报告撰写概览

前言 在做数据分析的日常工作中,对数据进行整理、分析并提炼要点、并将分析过程与结果写成一份通俗易懂的报告是必不可少的工作之一,也是一个优秀运营、产品、人力、数据等职场人的必备技能,是支持决策的依托。 数据分析报告是完成数据分析的…

如何撰写数据分析报告?

Step1:目标确定 这一步在工作中通常是由你的客户/上级/其他部门同事/合作方提出来的 第一次的数据报告需要自己来提出并确定目标,选择目标时,需要注意的点: 选择一个比较熟悉,或者比较感兴趣的领域/行业 选择一个范…

【研究院】一年了,再看看江湖中的达摩院

国内三大科技领头羊BAT,BT我们已经介绍过,今天随我一起揭开阿里巴巴技术背后的神秘面纱。 作者 | 臧小满 编辑 | 臧小满 01 达摩院的诞生 1.1 冠名与成立 2017年10月11日,第八届云栖大会在杭州拉开了帷幕,这次大会上&#xff0c…

阿里达摩院做AI这两年

整理 | Jane 出品 | AI科技大本营(ID:rgznai100) 2017 年 10 月的杭州云栖大会上,阿里巴巴正式宣布成立达摩院,未来三年将投入将超过 1000 亿人民币用于基础科学和颠覆式技术创新研究。达摩院官网正式上线后,我们看到达…

达摩院开源低成本大规模分类框架FFC CVPR论文深入解读

团队模型、论文、博文、直播合集,点击此处浏览 一、论文&代码 论文链接:An Efficient Training Approach for Very Large Scale Face Recognition 应用&代码: https://modelscope.cn/models/damo/cv_ir50_face-recognition_arcfac…

达摩院开源工业级说话人识别模型CAM++

近日,达摩院正式向公众开源工业级说话人识别通用模型CAM,兼顾准确率和计算效率,训练labels类别达20万,每类含20~200条梅尔频谱特征。当前该模型已上线Modelscope魔搭社区,后续将陆续开源针对各场景优化的工…

270亿参数、刷榜CLUE,阿里达摩院发布最大中文预训练语言模型PLUG(开放测试)...

转自:机器之心 经历「大炼模型」后,人工智能领域正进入「炼大模型」时代。自去年 OpenAI 发布英文领域超大规模预训练语言模型 GPT-3 后,中文领域同类模型的训练进程备受关注。今日,阿里达摩院发布了 270 亿参数、1TB 训练数据的…

国外大牛 Adam Fallon 十年软件开发的一些经验分享

经过了长达十年的编程生涯,我对于软件工程的理解和认识已经日趋成熟。在此,我想与大家分享一些对于编程的独到见解和心得体会,希望这些经验可以为你的编程之路提供一些参考。 首先,我发现有一个庞大而声音响亮的行业,致…

270亿参数的“中文版GPT-3”来了!阿里达摩院发布超大规模语言模型PLUG

自18年谷歌BERT横空出世以来,预训练语言模型一跃成为自然语言处理领域的研究热点,海量数据与大规模模型的预训练少量下游任务数据微调(Pre-training Fine-tune)也成为NLP任务的新范式。从在开源数据集上进行评测到业务实践中的价…

阿里达摩院TableQA技术让表格说话

作者:水德 在过去两年时间里,阿里达摩院对话智能团队(Conversational AI)围绕 TableQA 做了一系列探索,先后在四大国际权威榜单上取得第一名,并且开源了首个中文预训练表格模型。同时,把 Table…

阿里达摩院开源DAMO-YOLO:超越了一众YOLO系列方法

向AI转型的程序员都关注了这个号👇👇👇 1.简介 DAMO-YOLO是一个兼顾速度与精度的目标检测框架,其效果超越了目前的一众YOLO系列方法,在实现SOTA的同时,保持了很高的推理速度。DAMO-YOLO是在YOLO框架基础上引…

坐拥270亿参数!阿里达摩院发布超大规模语言模型PLUG,上能写诗词歌赋、下能对答如流...

作者 | 马超 出品 | CSDN(ID:CSDNnews) 日前,阿里达摩院发布了最新中文预训练语言模型 PLUG,在 PLUG 生成的各种诗歌与小说中,不时灵光闪现式的金句、妙语令人啧啧称奇。 但是以笔者从业多年的经验看&#…

如何在html中插入背景音乐

注:本方法是通过外链的方式插入背景音乐 1.搜索网易云音乐 2.选择一首音乐,也可以登录后查看自己喜欢的音乐 3.点击生成外链播放器 4.有的歌曲会有权限保护,无法生成外链,这是缺点,我们选择另一首歌 5.可以看到如下代码,不建议使用flash插件,毕竟谷歌浏览器禁用了,影响体验,默…

虚幻4为场景添加背景音乐的三种方法

根据官方文档介绍,虚幻在场景当中添加音乐有三种方法,我这里也不知道它到底支持哪些音频,反正导入mp3文件不好用,改成wav文件就没问题了,所以大家在导入文件的时候尽量使用wav文件,就不要使用其他的音频文件…

关于如何在html网页中插入可以自动播放的背景音乐

昨天想做一个带有自动播放背景音乐的html网页,频繁碰壁,最后终于找到问题所在: 一般大家会考虑到audio标签,然后在标签里使用autoplay。理论上是可以的,但是一定要注意浏览器的设置,浏览器一般会自动阻断背…

H5背景音乐解决方案

前言背景音乐播放 1 自动播放 1 微信问题2 Safari问题3 解决方案代码 2 点击播放 离开页面关闭音乐缓存状态 1 客户端存储数据方法2 示例 完整解决方案代码 1. 前言 很多H5的项目会用到背景音乐,虽然是很小的一个模块,但是有不少的坑。本文总结了背景音…

【向生活低头】如何在Gold Wave软件中为声音添加背景音乐

很奇怪,百度了很久,找到的方法都不可以用(都用的混响),但大家又都很统一,我感觉很奇怪。 最后,我找到了这个视频,(用的混音)这次终于可以了。 记录&#xff0…

告别枯燥,ppt背景音乐怎么设置?

大家用过ppt吗?在办公软件中,ppt最常用到的就是在于广告宣传这方面,因为ppt里面的各种元素都能让你的宣传更加灵动。ppt背景音乐怎么设置?在制作ppt的时候,当表面因素勾勒得差不多时,如果设置一个背景音乐可…

chatgpt赋能python:Python如何减慢输出速度

Python如何减慢输出速度 Python是一种高级编程语言,被广泛应用于数据分析、人工智能和Web开发中。在这里,我们将探讨一种方法,即如何减慢Python的输出速度,从而进行更有效的调试和优化。 什么是Python的输出速度? 在…

【观察】数据分析还能这样玩?《事业告急——月老KPI下降分析》的“制胜秘籍”...

谈起去年参加2022帆软数据分析大赛时,新希望集团BI项目经理林家喜仍然“记忆犹新”,凭借参赛作品《事业告急——月老KPI下降分析》,他带领的团队在193份参赛作品中“脱颖而出”,斩获了大赛的“最佳展现创意奖”。 事实上&#xff…