AIGC是日烧百万的销金窟,但有应用场景的公司不在乎

梦晨 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

没想到,第一批AI绘画产品已经开始倒闭了……

StockAI,成立仅4个月,在2022年底因用户付费无法覆盖成本,遗憾宣布关闭平台、退款。

d35ca948719ee11adff08e91e8cd12f3.png

以3月的付费AI绘画平台Midjourney推出为标志,AI绘画开始被职业画师重视起来。到8月的Stable Diffusion开源,AI绘画正式出圈并开启一场全民狂欢,这一过程只用了不到半年

AIGC(利用AI技术生成内容)这一概念也被彻底带火,成为最热门的风口之一,刚刚过去的2022年也被形容为AIGC元年。

Stable Diffusion背后的公司StabilityAI融资1.01亿美元,AI文案生成公司Jasper融资1.25亿美元。

这一波热潮还没完全过去,ChatGPT横空出世,又把AIGC抬上了新高度。

人们开始认为它能抢走搜索引擎的生意,甚至谷歌自己都感受到了危机,在公司内部发布了“红色警报”。

以ChatGPT的火爆程度,从0到100万用户只用了不到5天

这是什么概念?作为对比,Twitter用了2年,Facebook用了300天,Instagram用了将近75天。

3a976f6cfff0316ef4c36948252ae564.png

据马里兰大学副教授Tom Goldstein粗略估计,如果100万用户平均每天只进行10次对话,Open AI就需要为ChatGPT每天烧掉10万美元(68万人民币)。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

AIGC太烧钱该如何持续?OpenAI为什么能先后引领AI绘画与对话系统两波浪潮?成了行业热议的话题。

量子位在这段时间里也和一些学者、从业者交流了这些问题,其中,京东集团副总裁、IEEE Fellow何晓冬博士的观点很有启发性:

利用AI拓展人类认知边界和AI商业化落地,是两个不同的逻辑

商业巨头很难搞出ChatGPT这样的项目

我们2017年就做了AI绘画

在AI技术圈,何晓冬是公认的大牛。

他本科毕业于清华大学,硕士毕业于中国科学院,后赴美国密苏里大学哥伦比亚分校获得博士学位,在微软全球八大研究院之首的雷德蒙研究院工作十余年,2018年回国加入京东,并于2019年当选IEEE Fellow。

他先后发表了200余篇学术论文, 谷歌学术统计引用数超4万次,其中单篇论文最高被引用近5000次,h-index达到70。

75bf76f159319eb595cb0f899843eed0.png

早在2017年,何晓冬就在微软研究过让AI根据文字生成图像的技术,当时的模型AttnGAN登上CVPR,生成的一张“一只红羽毛白肚子的短咀小鸟”现在看来也不算过时,这也是早期AIGC和多模态智能领域重要的进展。

88e5ac61b47395432aa929b09b458344.png

AttnGAN 按照 “一只红羽毛白肚子的短咀小鸟” 生成的图像

语言模型方面,像ChatGPT一样不再一味追求大参数、无监督学习的类似思路之前也不是没人想到过,只是没能做到极致。

那么其他人离做出DALL·E和ChatGPT这样的产品还差些什么?

何晓冬认为,不差在思路,也不差在资源,而是差在决心

两大独立AI研究机构,DeepMind和Open AI做的事,都是在拓展人类认知边界,并不能直接带来商业价值。

要下这样的决心,和技术负责人的品味、组织的使命和生存模式都离不开关系。

像谷歌虽然手里也有LaMDA这样的超强对话语言模型,却迟迟不面向公众大规模开放,甚至被内部员工吐槽是“起了个大早,赶了个晚集”。

0d612107ddf3a5948cc25a28250d24cd.gif谷歌LaMDA概念图

这其中的原因,有谷歌在AI伦理道德议题上不敢冒进,也有对自身现有商业模式颠覆的顾虑——广告是谷歌的核心收入来源之一,当人们不再用搜索引擎而改用AI对话时,广告是无处安放的。

要让AIGC产生商业价值,就要遵从一套完全不同的逻辑。

AIGC如何产生商业价值?

在微软开发的这个AI绘画技术当年终究是没能做成产品上线,但作为技术初心和拓展人类认知边界的一个尝试,AI画出的这只鸟一直被何晓冬当作手机壁纸。

不过,另一项技术“AI看图说话”就成功找到了自己的位置。

现在的Office里,插入一张图片就能自动生成一段描述文本(alt text),可由系统语音读出为视力障碍者提供方便。

技术结合场景,在产业真实落地,就能发挥更大的价值。

7951fadf319c60ce14db7d77b5c3efea.png

2018年,何晓冬离开工作了十余年的微软雷蒙德研究院,选择回国加盟京东,这之中也是有离场景更近方面的考量。

在京东,何晓冬带领团队打造了京东云言犀人工智能应用平台,服务京东5.8亿用户和17.8万商家,也将系列AI产品服务落地到了金融、政务、交通等各个领域。

仅在开放给第三方商家使用服务与导购产品的京小智上,就帮助商家带来了上千亿元GMV。

另一套商品文案生成系统,目前已覆盖3000+品类,累计“种草”30亿字,带来超过3亿的GMV。

92bed18a9c848cca6cfbf5bcbf9be8a5.gif

光是线上购物这一个场景,就支持了这么多种技术落地的可能性,而更大的发挥空间在背后的设计、生产、仓储、物流等供应链上下游场景。

这也是京东云产业AI的推进路线,一面保持对前沿技术的探索,一面依托自身的场景推进AI技术产业化、规模化落地。

经过反复迭代打磨后,再将技术以模块化、组件化、产品化的方式,基于言犀人工智能应用平台对外开放,成为产业上下游的超复杂协同的最佳“助手”,助力产业数智化升级。

相比于一些其他公司,京东的供应链场景丰富,更重要的是京东的“价值标准”,如同正品行货、物流配送一样,AI产品也必须满足客户的价格、产品、服务等方面的综合体验,又要满足京东在技术商业化过程中自身的成本与效率

深入产业AI,不可避免的会遇到更低频、长尾的复杂场景和产业大规模协同的需求。

这些场景的数据样本少、数据分布不均,研发成本更高,同时定制化程度高、难以复制。如此一来,就需要迁移成本低、基础数据样本丰富、灵活弹性、适用能力强的综合性AI系统。

对于AIGC这一具体方向来说,同样如此。

何晓冬拿智能客服场景来举例,用于京东自营时模型是高度定制化的,直接开放给几十万第三方卖家使用很难满足所有人需求,又很难靠人力去适配所有需求。

后来的解决办法是定义好产品的边界,预训练大模型提供基础能力,同时结合在京东沉淀的丰富领域知识图谱,把知识接口开放给卖家,无论是卖食品还是化妆品都可以把产品知识填进去,让AI能力方便的迁移到不同领域。

这个过程中模型免不了牺牲一些性能才能做到最终产品的标准化、开箱即用,因为产业AI到了这一步,很多用户都不是技术专家。

把AI能力组合成产品对传统行业客户太有挑战性了,直接提供开箱即用的AI产品和应用才能让不懂技术的客户也能快速组成解决方案,满足自己的需求。

在这套体系下,京东云还进行了AIGC的多方向探索,如联手中央美术学院的AI书法生成

a88ce6fcb87f22aff559f77762fcbca2.png

以及一键生成店铺专属数字人。在数字人领域,言犀平台上推出了2D真人、3D卡通、3D超写实等多种类型数字人,近期还上线了大姿态(侧脸、转头等)数字人。目前言犀平台已有100+形象,30+音色选择,为电商直播、金融、政务等领域提供媲美真人的服务体验。尤其是电商直播领域,百变的形象、专属的音色,智能脚本实时撰写,丰富的“知识体系”等同于一名金牌销售,推出后已为客户带来显著的GMV提升。

京东云言犀数字人演示

甚至对实体仓库、实体零售店做一个数字孪生。京东物流研发了京东物控 3D Scada 智能仓储数字孪生平台大大提升了仓库作业的效能,相比于传统人工作业的方式效率可以提高3~8倍;京东也在探索一种具有未来感的零售模式,构建柔性店铺,让店铺的功能随着消费者时间不同、需求不同而实时改变,革新线下零售的购物体验。

3c724993c5c3d8f3b95ae2e4c876d46f.jpeg

ffe1a40ce86b51514b94145f4afc51f9.jpeg

要说AIGC如此多的方向中,最有商业价值潜力的是哪个?

何晓冬还是最看好数字人,加入了视觉形象、人物表情,交互更自然,使用体验有很大提升。

而且他预测,2023年AIGC一个可能的技术突破方向也在这里。

AI绘画最常用的技术是扩散模型,有天马行空的创造力,但是容易失控。超写实数字人常用的是神经辐射场,可以根据物理特性重构三维环境。

如果两者能结合起来,可能把可控性和真实性再提高一个数量级,到时候应用场景也会进一步打开。

One More Thing

如何让AIGC产生更大价值,是全行业都在关注的热点,相关讨论层出不穷。

比如在量子位举办的MEET2023智能未来大会上,小冰公司CEO李笛分享了他对数字人的思考。‍‍

如数字员工会使toB和toC的界限变得模糊,比如银行的数字客户经理可能会与客户变成朋友。

未来数字人也将不再隶属于某一平台,人们在客服、手机、汽车场景上与同一个数字人交流,能获得更加无缝、24小时、持续连贯的服务。

OpenAI的CEO Sam Altman最近则发表了他对ChatGPT进一步发展的想法。

ChatGPT这样的技术,随着时间推移一定会造成一些重大的破坏……但是不让技术接触现实世界是无法获得改进办法的。

ac60b470e2ec404cc789f670bed9da91.png

探索人类认知边界与产生商业价值,2023年你更期待AI在哪方面的进展?

—  —

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16537.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

重磅消息!GPT Plus 暂停升级?刚刚恢复啦!

ChatGPT目前是最火的产品,很多同学都在用GPT帮助自己工作,学习,提高效率!尤其是GPT4,性能强GPT3.5很多倍! 一旦用上了GPT4你会发现,真的是离不开它!这个超强的人工智能,几…

自媒体大咖经验分享

👩🏼‍💼👩🏼‍💼2023下班后干什么? 💄💄做自媒体啊! 💋💋现在不卷,更待何时? ✍🏼✍&#x1f3fc…

个人电脑应用常识记录

查看当前电脑所连接WIFI 密码EE 知识参考CSDN markdown 导出成 wordCSDN markdown 实现页内跳转SSD 硬盘检测软件推荐CPU 检测工具CPU-Zios - SMB 配置(实测可用)Win 10 LTSC 安装 Microsoft StoreWin 10 LTSC 安装 Microsoft Store 方法二AD16 安装&…

Ubuntu20.04 -- 小白系列3 之小笔记(含ubuntu向日葵远程系统切换)

目录 1、4K高清壁纸 2、Ubuntu强制重启或关机,出现you are in emergency mode 3、提醒休息软件pomatez(下载deb文件) 4、如何设置开机启动选项的等待时间 5、福昕PDF下载 6、cmake..报错 7、 错误 由于没有公钥,无法验证下列签名 8、无法连接&am…

上知天文,下知地理,还能替人写脚本!人工智能的进阶ChatGPT

ChatGPT是OpenAI在11月30日推出的聊天机器人,于12月1日起对公众免费开放。 自从这东西出来之后,大家对此的讨论热情越发浓烈。ChatGPT具体可以干些什么? 帮你写论文、检讨书、情书,甚至情诗也能信手拈来。 以上都是网友测试它写…

ChatGPT,让程序员从一片黑暗森林奔向另一片黑暗森林!

几年前看过一个电影,叫做《隐藏人物》,主要讲三位女性在NASA工作时反抗“种族歧视”和“性别歧视”的故事,其中有个情节让我印象极其深刻: NASA计算部门有一群女生,她们的工作是计算飞船轨道,纯手工计算。 …

如何使用腾讯会议录屏?腾讯会议不允许录屏怎么办?这个方法教你解决

​近年来,线上活动越来越活跃,很多人都开始使用腾讯会议进行开会、网课教学等活动。很多人希望使用腾讯会议进行录屏。那么如何使用腾讯会议录屏?腾讯会议不允许录屏怎么办?这个方法教你解决! 一、如何使用腾讯会议录屏…

电脑怎么截图?怎么录屏?8种常见的截图和录屏方法!

电脑上怎么截取图片?电脑上怎么录制屏幕?很多小伙伴都知道一两种屏和截图的方法,但是使用起来却有点鸡肋。 其实电脑上有很多种截图方法以及录屏方法,操作简单,快捷,便利的也有很多,这里就给大家…

电脑如何录屏?分享4个屏幕录制的好方法,建议收藏

电脑录制画面是一件非常简单的事情,在电脑上打开相应软件就可以轻松的录制电脑屏幕上正在进行的操作了。但是很多朋友并不清楚如何录制电脑上各个窗口的内容,比如游戏、文档等等。那么电脑如何录屏?下面分享分享4个屏幕录制的好方法。 方法一…

被ChatGPT的刷屏了?别怕,推荐本AI科普丛书给大家

最近两个月互联网总算因为ChatGPT出了点动静,用美团老板王兴的话:”2016年已经进入了中国互联网的下半场",想想也是,从2016年共享单车大战以后,中国互联网因为进入存量竞争好像一直在走下坡路,校招生的…

chatgpt赋能python:Python图片裁剪:让您的图片变得更完美

Python 图片裁剪:让您的图片变得更完美 无论您是一名摄影师、设计师、或是一名开发者,一张完美的图片是至关重要的。然而,有时候您拍摄的图片或者设计的图形可能有一些缺陷,例如画面不够清晰、不需要的元素等等,这时候…

ChatGPT爆火背后的真相:学编程已经成为必选项!

这一阵最热门的话题,莫过于人工智能新选手——ChatGPT,在推出后只用了两个月就积累了1亿用户!它的出现在科技圈掀起了一阵“惊涛骇浪”,有人称ChatGPT的意义,堪比当年蒸汽机的出现,它足以爆发新一轮的“工业…

chatgpt赋能python:Python和OpenCV:优化图像和视频处理的最佳工具

Python 和 OpenCV:优化图像和视频处理的最佳工具 图像和视频的处理在机器学习和计算机视觉领域发挥着重要的作用。OpenCV 是一个流行的开源计算机视觉库,让处理和设计算法更加快速和简单。Python 是一种实现快速开发的语言,容易学习和使用。…

chatgpt赋能Python-python_moviepy

Python Moviepy - 媒体处理库的必备之选 介绍 Python Moviepy是一个用于视频编辑和媒体处理的Python库。它可以用来创建、编辑和处理视频和音频文件,支持各种格式,包括MP4、AVI、FLV等。这个库由Zulko创作,已经成为Python中媒体处理界最受欢…

chatgpt赋能Python-python_moviepy教程

Python Moviepy教程:轻松实现视频编辑 如果您正在寻找一个快速、灵活且易于使用的Python库来编辑视频,那么Moviepy就是您的解决方案。Moviepy是一个专门的Python库,可用于进行视频剪辑、调整大小、添加音频和创建动画。此外,Movi…

chatgpt赋能python:Python音频文件处理技术

Python音频文件处理技术 Python是一种强大的编程语言,具有开放源代码、可移植性和扩展性等优点。随着Python使用者的日益增长,越来越多的人开始使用它来处理音频文件。本文将介绍Python如何处理音频文件,包括需要的Python库以及基本代码。 …

ChatGPT 王炸更新,有点操作系统的雏形了....

来源:OSC开源社区(ID:oschina2013) OpenAI 宣布已经在 ChatGPT 中实现了对插件的初步支持。插件 (Plugins) 是专门为语言模型设计的工具,以安全为核心原则,可帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务。 这…

深度学习实战22(进阶版)-AI漫画视频生成模型,做自己的漫画视频

大家好,我是微学AI,今天给大家带来深度学习实战22(进阶版)-AI漫画视频生成模型。 回顾之前给大家介绍了《深度学习实战8-生活照片转化漫画照片应用》,今天我借助这篇文章的原理做一个AI漫画视频生成的功能,让我们进入AI生成视频的时代吧。 AI生成视频是利用人工智能技术生…

ChatGPT 实战:面试辅导助你轻松拿下Offer

经常保持与外界的交流,才能避免自己成为温水里的青蛙,但不一定每次都出去找公司锻炼,有了ChatGPT,他背后可不止一家公司一个面试官的经历,多对聊几次,相信你也会收获满满,对自己的职业成长会有极…

ChatGPT实战:家庭资产配置

后疫情时代,经济形势严峻,无论是家庭、企业还是政府,都需要时间建立现金流、修复负债表、制定新计划,来应对未来不确定的风险。家庭资产配置是为了实现财务目标、降低风险、提高回报,并最大限度地优化家庭的财务状况而…