目录
- AIGC的意义
- AIGC底座及生态
- AIGC赋能内容创作4大模态
- AI文本生成
- AI音频生成
- AI图像生成
- AI视频生成
- AIGC的技术思想
- AIGC的重要基建Transformer
- ChatGPT的训练过程示意图
- ChatGPT的局限性包括
- AIGC的职能应用
- AIGC与产品研发
- AIGC与市场营销
- AIGC与管理协作
- AIGC的行业应用
- AIGC咨询行业应用
- AIGC影视行业应用
- AIGC电商行业应用
- AIGC教育行业应用
- AIGC金融行业应用
- AIGC医疗行业应用
- AIGC自动驾驶行业应用
- AIGC的产业地图
- 上游:数据服务
- 中游:算法模型
- 下游:应用拓展
- AIGC的未来
AIGC的意义
1、AIGC实现人工智能“内容”生成
2、AIGC的核心技术价值实现了“自然语言”与人工智能的融合
3、AIGC的绝对优势是其逻辑能力
4、AIGC实现了机器学习的集大成
5、AIGC开创了“模型”主导内容生成的时代
6、AIGC开放性创造力的重要来源是扩散diffusion模型
7、AIGC的进化是参数以几何级数扩展为基础
8、AIGC的算力需求呈现显著增长
9、AIGC和硬技术相辅相成
10、AIGC将为区块链、NFT、Web3.0和元宇宙带来深层改变
11、AIGC催生出全新的产业体系和商业化特征
12、AIGC的法律影响和监管
13、AIGC正在引领人类加速逼近“科技奇点”
AIGC底座及生态
其底座是Transformer基础模型
AIGC产业生态
AIGC产业规模生态分布
小结:
人工智能网络并没有直接模仿大脑,但最终看起来却像大脑一样,这在某种意义上表明,人工智能和自然之间似乎发生了某种趋同演化
——丹尼尔·亚明斯
数字时代:“代码即法律”
——劳伦斯·莱斯格
智能时代:向量和模型构成一切
——朱嘉明
AIGC赋能内容创作4大模态
AI文本生成
幻想一下AI生成文本的未来:
程序员、研究员、产品经理等涉及重复性工作的脑力劳动者可能都将被AI取代,这些职业可能都演变成了新的职业——提示词(Prompt)工程师,目的就是帮助人类更好地与AI互动。
AI音频生成
AI图像生成
针对AI与人类的辩题,Midjourney的创始人大卫·霍尔兹(David Holz)这样评价:“AI是水,而非老虎。水固然危险,但你可以学着游泳,可以造舟,可以造堤坝,还能借此发电;水固然危险,却是文明的驱动力,人类之所以进步,正是因为我们知道如何与水相处并利用好它,水给予更多的是机会
AI视频生成
AIGC的技术思想
人们总喜欢活在舒适区内,用粗暴的断言安慰自己,例如机器永远无法模仿人类的某些特性。但我给不了这样的安慰,因为我认为并不存在无法模仿的人类特性。
——艾伦·图灵
机器学习的概念:
机器学习是指“计算机程序能从经验E中学习,以解决某一任务T,并通过性能度量P,能够测定在解决T时机器在学习经验E后的表现提升
强化学习的概念:
强化学习是机器学习除监督学习与无监督学习之外的又一领域,也可以与深度学习结合进行深度强化学习。区别于监督学习和无监督学习,强化学习并不是要对数据本身进行学习,而是在给定的数据环境下,让智能体学习如何选择一系列行动,来达成长期累计收益最大化的目标。强化学习本质上学习的是一套决策系统而非数据本身。
因此,强化学习就是让人工智能通过不断的学习试错,找到合适的策略去选择一系列行动,来达成目标。在构建策略时,还有一个需要考虑的关键因素叫作价值(Value),它反映的是将来能够获得所有奖励的期望值。
AIGC的重要基建Transformer
参见本人博客:大模型干货解读
https://blog.csdn.net/weixin_48579885/article/details/131633219?spm=1001.2014.3001.5501
ChatGPT的训练过程示意图
ChatGPT的局限性包括
- 有时会写出看似合理但不正确或荒谬的答案
- 对输入措辞的调整或多次尝试相同的提示很敏感。例如,给定一个问题的措辞,模型可以声称不知道答案,但只要稍作改写,就可以正确回答
- 回答通常过于冗长并过度使用某些短语
- 对于模棱两可的问题,模型通常会猜测用户的意图,而非让用户澄清问题
- 模型有时会响应有害的问题或表现出有偏见的行为
- 在数学和物理等需要进行数字推理的任务中仍然会出现一些错误
AIGC的职能应用
有些人声称这种技术是人工智能,但实际上它强化的是人类自身。因此我认为,我们将增强人类的智能,而非“人工”的智能。
——吉尼·罗曼提
AIGC与产品研发
主要应用方式如下:
- 通过辅助编程提高代码生产效率。
- 生成应用直接将需求变成产品
- 创建和维护文档注释,提高沟通效率。
- 测试代码,纠正错误。
- 根据不同种类的用户设备生成新的代码
AIGC与市场营销
使用AI生成创意营销内容并非市场中的新趋势,事实上,早在2015年淘宝“双十一”促销活动后,阿里巴巴开发出了一款叫作“鲁班”的产品,也被称为“千人千面”。
以鲁班为代表的AIGC创作工具还有另外一个优点:能够分析大量的数据,从而生成与目标受众更相关、更吸引人的内容。
AIGC与管理协作
国内使用最广泛的该类软件是字节跳动旗下的飞书妙记,它可以自动在线生成会议纪要,通过智能语音识别转化成文字,把会议交流沉淀为要点文档,从而让会议成员更专注,工作更高效
AIGC工具可以帮助企业整理各种类型的相关文件。在企业的各种项目中,常常会有不同格式的文档(Excel电子表格、 PDF文档、PowerPoint演示文稿等),它们可能被存储在不同的平台上(云盘、线上文档、电子邮件等)。通过AIGC工具,公司可以训练一个模型来自动地将这些数据组织成相关的类别,例如按部门、项目或主题分类
AIGC的行业应用
深入每个行业,你会发现人工智能正在改变工作的性质。
——丹妮拉·鲁斯(Daniela Rus)
AIGC咨询行业应用
在新闻资讯的生产环节,基于自然语言生成和自然语言处理技术,AI交出的结构化写作“答卷”已经逐步得到从业者和内容消费者的认可,因此已经涌现了一批成熟玩家。
在资讯内容的分发环节,AI 除了助力个性化内容推荐外,也开拓了全新的应用场景,即驱动虚拟人主播,以视频或直播的形式进行内容发放,打造沉浸式体验
缺点:
首先,AI撰写的文稿仍稍显呆板单调,模板化强,无法像人类记者一样根据具体报道的性质和语境调整叙述的策略,以达到更好的传播效果。同时,AI当前无法撰写深度报道,文字缺少温度和人文关怀等要素。
基于这些原因,AI写稿最初也是多被用于财经、体育、突发事件等垂直场景,跨领域迁移、适配以及产出的能力仍然不足。并且,过度依赖 AI进行信息抓取以及撰稿也可能导致信息茧房和回声室效应加剧,甚至带来伦理失范的问题。
AIGC影视行业应用
在剧本写作阶段,AI已经能够帮助影视人更好地释放创意,但从剧本上的文字到最终呈现给观众的视听盛宴,仍有一段漫长的旅程,而AI却能在这个想法落地的过程中继续保驾护航,帮助实现从“好创意”到“好表达”的跨越,帮助影视工作者化“不可能”为“可能”。
在迪士尼看来,FRAN是第一个“实用、全自动、可用于影视制作”的图像人脸重塑方案。随着此类技术的不断进步,使用成本和门槛将持续降低,可以预见未来AI年龄调整将在影视行业获得更加广泛的应用。
AI不仅能让“时光倒流”,甚至还可让逝者“复生”,在虚拟的彼岸再度和观众见面,甚至交互。这一技术在影视领域已经得到了许多应用,其中最知名的案例之一就是《速度与激情7》。
然而,死者形象复生这一愿景的出发点虽然美好,但也不可避免地带来了伦理相关的挑战。逝者本人生前是否接受使用技术手段让形象重活一次?最终呈现出来的形象,以及更关键的言行,是否足够客观、准确?商家有无权力利用逝者的信息和形象牟利?人们是否愿意接受这般形式的互动?这样的AIGC形式还值得人们更多的思考。
AIGC电商行业应用
阿里巴巴的每平每屋业务就利用AI视频建模等AIGC技术,实现了线上“商品放我家”的模拟展示效果。家居购物的一个痛点在于,用户非常容易在线上买到看起来好看,但是与整体家居风格并不匹配的商品,从而导致较高的退货率。而阿里巴巴的每平每屋业务,将AIGC的功能植入手机淘宝和每平每屋的App之中,用户可以通过拍摄扫描家居环境,以及家里与商品进行搭配布局的家居,让AI生成线上的3D模型,并与想要购买的商品3D模型进行组合,让用户在线预览整体的组合效果。
AIGC教育行业应用
德尔菲神庙的门廊上镌刻着苏格拉底的箴言: “认识你自己。
在“AI教师”的时刻护航下,学习者得以不断形成习得-评测-反馈的闭环,有效提升学习效果。微软就在该方向布局颇多,例如,微软亚洲研究院和华东师范大学合作研发的中文写作智能辅导系统“小花狮”,能够借助自然语言处理等技术,实时为学生作文结果评分,并能够分析其背后原因,从而帮助学生找到属于自己的发力点,实现进步。
AIGC金融行业应用
目前,AIGC技术已经取代了金融行业的大量客户服务人员和客户经理。例如在2017年4月,富国银行就开始试点一款基于Facebook Messenger平台的智慧客服项目。在该项目中,人工智能可以代替客服与客户交流,为客户提供账户信息查询、重置密码等基础服务。
AIGC医疗行业应用
AI预问诊就是一个最典型的应用场景,2021年,复旦大学附属眼耳鼻喉科医院与腾讯医疗健康签署了战略合作协议,将全面打造数字化医院建设新标杆、新范式,深度推动医院数字化转型,在“智能预问诊”等业务上已快速落地推进。
AIGC聊天机器人只是一个隔着屏幕的软件程序,用户不必担心自己被评判或者隐私被泄露。其次,相比于心理咨询师职业生涯的案例总数,AIGC聊天机器人有海量交流数据和知识模型支撑,可以在持续迭代更新的同时保持冷静和中立,提供一种可靠且可自己进化的心理咨询服务。
除了心理健康之外,AIGC在对听障、语障人士的支持领域也发挥着重要作用。获得科大讯飞战略投资的音书科技就是这样一家公司。音书科技不仅为听障、语障群体提供各种场景下的翻译字幕系统和手语系统,以支持他们的日常交流和信息获取,还提供了AI言语康复系统。根据音书科技官网显示的数据,目前音书科技已经对外提供数亿次辅助沟通服务,大大改善了听障、语障群体的沟通现状。
AIGC自动驾驶行业应用
其令人惊艳的**“对话聊天”能力**,成为提升智能座舱语音交互质量的重要工具
基于AIGC算法模型创建、生成合成数据迎来重大进展,有望解决自动驾驶发展应用过程中的数据限制。
一是通过合成数据来改善基准测试数据的质量来实现数据增强和数据模拟,解决数据匮乏、数据质量等问题;
二是利用合成数据训练AI模型可以有效避免用户隐私问题;
三是合成数据可以自动创建、生成现实世界中难以或者无法采集的数据场景,能有效应对长尾、边缘案例,提高模型算法的准确性、可靠性;
四是合成数据技术可以实现更廉价、高效地批量生产自动驾驶模型训练开发所需的海量数据,毕竟人工标注一张图片可能需要6美元,但人工合成的话只需要6美分
AIGC在自动驾驶场景中还扮演着智能安全辅助助手的角色。通过对传感器和周围环境的深度识别和判断,该技术能够及时发现并识别出行驶中的安全隐患,如行人、动物、障碍物等,并以最快速度预警驾驶员或操控自动驾驶系统采取避免碰撞的安全措施
AIGC还可以识别驾驶员的身份和情绪,并对其进行智能分析和判断。在检测到驾驶员疲劳、心情低落等异常情况时,系统会及时提醒或自动开启安全停车模式,保障司乘安全
AIGC的产业地图
总体来看,整个AIGC的产业地图可以分为三类:上游数据服务产业、中游算法模型产业、下游应用拓展产业
上游:数据服务
其中一家scale公司,主要受益于规模经济、客户粘性和资源垄断
数据标注服务本身很难建立起高度的客户黏性,而Scale之所以可以留住客户,得益于它在2020年4月推出的Scale Document。 Scale Document不仅为数据贴标签,还与客户合作建立定制模型。这使得客户切换服务商的成本变高,因为需要重新训练模型。
这里所说的资源垄断指的不是垄断数据而是垄断人才,数据的所有权是客户的,即使通过Scale来完成打标签过程,也不能把这些数据误认为是Scale的资产。但随着数据流过Scale平台,这些数据同样训练了Scale平台标注算法的模型能力,也沉淀了这个领域的众多人才,人才是这个领域的宝贵资源
中游:算法模型
下游:应用拓展
AIGC的未来
我从来不想未来,因为它来得太快。
——阿尔伯特·爱因斯坦(Albert Einstein)
人工智能的发展经历过多次春天与寒冬,每一次春天与寒冬的交织都与“通用化”和“专用化”的分歧息息相关。
大模型之“大”除了体现在参数规模上,同样也体现在数据量上
当人类想要打造人工智能时,一个非常直接的思路是去让机器模仿人来获取智能的学习方式。这种“仿人模式”一直都是人工智能新的算法模型的重要思路来源,也是技术发展的重要推动力。
目前,AIGC所产生的风险主要集中在版权问题、欺诈问题和违禁内容三个方面
白宫科技政策办公室颁布了10条关于人工智能法律法规的原则,为制定AIGC开发和使用的监管和非监管方法提供参考:
- 建立公众对人工智能的信任
- 鼓励公众参与并提高公众对人工智能标准和技术的认识
- 将高标准的科学完整性和信息质量应用于AI和AI决策
- 以跨学科的方式使用透明的风险评估和风险管理方法
- 在考虑人工智能的开发和部署时评估全部社会成本、收益和其他外部因素
- 追求基于性能的灵活方法,以适应人工智能快速变化的性质
- 评估人工智能应用中的公平和非歧视问题
- 确定适当的透明度和披露水平以增加公众信任
- 保持控制以确保AI数据的机密性、完整性和可用性,从而使开发的AI安全可靠
- 鼓励机构间协调,以帮助确保人工智能政策的一致性和可预测性
我们前进着,我们也思考着,直至抵达科技的彼岸。
正如尼克·博斯特罗姆(Nick Bostrom)说的:“机器智能是人类需要做出的最后一项发明。”