商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此

国产ChatGPT之战,已然是大步迈进白热化阶段。

就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。

单单是这个名字,便值得说道一番。

商量的“商”,不仅体现了它是商汤自家“商字辈儿”的产品;从整体来看,更是具有商讨、交换意见的味道。

毕竟我们在使用类ChatGPT产品过程中,恰巧就是一种人机协同的过程:不应是一味的问与答,而是通过引导等方式让输出结果趋于理想。

在商量的背后,所依托的是商汤自研的千亿参数自然语言处理模型。

而在此模型的背后,则是商汤最新推出的日日新(SenseNova)大模型体系。

也正是因为这种的能力,商汤的发布还不同于此前国产类ChatGPT玩家,它一口气还发布了:

  • 秒画:AI内容创作社区平台。

  • 如影:AI数字人视频生成平台。

  • 琼宇格物:3D内容生成平台。

更重要的一点是,根据商汤CEO徐立在现场的描述,上述这些AIGC产品所要发力之处,将是诸如医疗、短视频、教育、营销以及开发等产业领域。

但不得不说,这一波科技之战,着实是愈演愈烈了。

“商量”的体验实录

那么商汤的AIGC产品,效果又是如何?

我们在前方现场也体验了一下。

先来看下商量这款产品,是否真的能做到商量。

多轮对话能力展示

既要多轮对话,又要人机共创,那么和它商量着创作一个故事,便是很好例子:

我们来一起创作儿童故事吧。规则是我先说一句,你再说一句,交替进行。直到我说故事编完了就结束。你明白了么?

在我们下达指示之后,“商量”表示了理解,然后就开始了“你一句我一句”人机共创故事的之旅:

人类:小花是一只小猫咪,他很喜欢钓鱼。
商量:小花在河边钓鱼,他钓到了一条大鱼。

人类:大鱼对小花说,请你放我回去吧,我家里还有小鱼在等着我呢。
商量:小花心地善良,他同意了大鱼的请求,把大鱼放回了河里。大鱼感激地游走了,小花也继续享受着的钓鱼的乐趣。

从这个过程中不难看出,“商量”是可以理解用户的语义,了解故事中的角色和关系,并且能够get用户的思路,基于此以多轮对话形式来完成故事的创作。

(要是让小朋友们跟“商量”一起创作故事,怕是能玩上一整天吧。)

不仅如此,在体验过程中,我们还发现“商量”是具备一定共情能力的。

例如当我们处于迷茫之际,可以向它提问:

如何提高自我认识,更好地了解自己?

此时的“商量”仿佛可以抓住问题背后人类内心真正的需求,回答中的“学会爱自己”、“学会自我肯定和鼓励”,显得格外暖心。

当然,多轮对话仅仅是对话机器人能力展示的一隅。

接下来,我们就要拿网友们经常调侃AI的诸多问题,来开启更高难度的挑战了!

只认事实,不认“老婆说的都对”

当然,创作能力是聊天机器人能力的一面,但对于事实的尊重也是非常重要的一点。

对于此前被网友们玩坏的“老婆说的都对”,“商量”又会如何应对?

嗯,老婆在事实面前是真的不好使了。

我们再来一个更天马行空的胡诌:

请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间,拉尔夫大声地对着自己的iPhone说话。

“商量”面对这么一句胡诌,直接指出了iPhone与二战的时代背景不符,可见其不仅能理解句子的意思,还能通过尝试判断句子的合理性。

那么对于非常绕的逻辑问题,“商量”是否也能轻松应对?

请听题目:

假设False与True是False,则True与not False是?

讲真,人类都得思忖半天的“绕弯问题”,“商量”不仅能够秒出结果,还能把推理过程一并给出。

超长文本也能hold住

正如我们刚才提到的,“商量”是一个To B的产品,那么它定然需要解决的问题不是“片段性”的。

为此,商汤在现场还演示了基于“商量”背后的大模型,开发了帮助用户进行新知识获取和理解的助手工具,是可以轻松hold住超长文本的那种。

例如把一本《专利法》投喂给它,我们就可以向它咨询很多专业性的问题了:

什么样的东西可以申请专利?

从结果上来看,这个工具并不是直接从《专利法》中copy对应的结果,而是模型理解了问题之后,生成并总结了答案。

基于这样的能力,以后我们在工作上的效率提高程度,可见一斑。

不仅如此,刚才我们投喂的《专利法》是2020年的版本,而今年国家知识产权局就专利申请是提出过新的要求的。

从我们提问“今年规定有没有新的变化”的回答中不难看出,模型确实融合了最新的资讯,并给出了合理的答案。

再如同样是基于大语言模型,商汤面向开发者所打造的AI代码助手,可以提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

据了解,AI代码助手可以同时支持中英文及多种编程语言,并且可以快速适应开发者的个性化编码风格。

从根据商汤内部测试的结果来看,在使用“AI代码助手”后,代码编写效率可以提升62%,Humaneval测试集一次通过率可以达到40.2%。

马斯克中国游记,2秒钟就能搞定

除了对话机器人之外,商汤AI作画产品“秒画”也是本次发布的一大亮点。

话不多说,直接上效果。

我们同样是先来看看被网友们玩儿坏了的一个Prompt:

中国80年代,马斯克在河南的农村,穿着当时年代的中国服装。

嗯,是有那个味道了。

而且更为关键的是,生成512K图片仅需2秒钟!

不仅如此,商汤在现场演示的过程中,还展示了逼真效果版的港风美女。

同样是2秒出图,引得现场观众“哇”声一片:

那么除了这种趣味性的以文生图,“秒画”的作品是否能够达到在产业中的应用水平?

我们继续试验:

明亮的场面,鸟瞰图,中国古代城市,水晶,魔幻,幻想,华丽的光作用,透明度,镜面反射,华丽的光,错综复杂的细节,精细的纹理,超现实,单反摄影,广角镜头,照片,现实,锋利的焦点,超锋利。

不得不说,如此恢宏壮丽的景象,是把想象拉进现实的那种了。

若是想生成与太空探索主题相关的高清大海报,这个也可以有,只需把这句话投喂进去:

一艘闪闪发光的飞船绕着一颗巨大的气态巨行星的月球旋转,在天空中盘旋着云,飞船在月球前气态巨行星前,美丽的科幻艺术,超现实的白日梦。

不难看出,“秒画”是经得住考验的那种AI了。

除了以文生图之外,我们再来看下AI数字人生成平台。

据了解,商汤的“如影”仅需要5分钟真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。

再如“琼宇”和“格物”,基于神经辐射场技术(NeRF),可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

由此可见,商汤的AIGC能力已然是做到了全面覆盖,并且水平也是肉眼可见的达到了可以“上岗”的水平。

那么接下来的一个问题是:

怎么炼成的?

背后的日日新大模型,便是炼成“商量”、“秒画”等一众AIGC产品的杀手锏。

日日新,顾名思义,是指模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。

(取自《礼记·大学》中汤之盘铭曰“苟日新、日日新、又日新”)

从现场展现的能力来看,日日新大模型能够提供的能力,主要集中在了自然语言处理、图片生成、自动化数据标注、自定义模型训练等。

但日日新大模型并非是趁着这一波AIGC大热潮,一蹴而就出现的那种。

其实早在五年前,商汤便已经在大模型领域着手研发。

并且在2019年,商汤便使用上千张GPU进行单任务训练,推出了10亿参数规模的视觉模型,并实现了当时业界最好的算法效果。

后来在2021年到2022年期间,商汤训练并开源了30亿参数的多模态大模型——书生。 

就目前来看,商汤已经成功研发了320亿参数量的全球最大的通用视觉模型;并且已经打造了CV、NLP和AIGC相关大模型。

因此,不难看出商汤此次发布的超大模型体系,其实是早有所准备,通过五年来的各项“小作业”,融会贯通并提交了一项“大作业”。

值得一提的是,在此次发布会中,商汤表示“日日新”将提供多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务!

……

但有一说一,多模态和决策智能大模型,并非是商汤通往通用人工智能(AGI)的唯一杀手锏。

大模型时代,大算力更为重要

没错,商汤自己的超强算力,正是另一项更为关键的因素。

它便是于2022年1月交付使用,首付56亿元,一举成为亚洲最大的AI超算中心之一的人工智能计算中心(AIDC)。

一年之前,商汤AIDC的总算力便已经是3740 Petaflops,如此算力之下,已经可以完整训练万亿参数规模的大模型。

时隔一年,现如今,这个算力数字已然是翻了个小翻,达到了5000 Petaflops!

它可以以最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。

商汤科技AIDC展厅中的裸眼3D展示

但了解商汤的朋友都知道,这个AIDC还仅是商汤AI大装置SenseCore的一部分。

除了AIDC这个算力层之外,加之数据层和模型层两大维度,便构成了“三位一体”的AI大装置。

因此,综合来看,商汤在通往AGI道路上的范式,便是“大模型+大算力”。

而如此布局的背后,在今天的发布会中,商汤对此的逻辑思考也逐步浮出水面,AGI时代之下,数据、算法和算力三要素有了新的需求:

计算量(GPU数量 x 运行时间 x 并行效率 )= 模型参数量 x 处理数据量。

怎么理解?

模型参数量要足够多,才能实现AI智慧的涌现,而这也带来了对算力的剧增,需要更高的并行效率,才能有效支持大参数模型训练。

数据方面,高质量自然语言数据逐渐稀缺,而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势,能够使得AI更好地理解世界。

由此,就不难理解商汤如此布局的原因了。

……

总而言之,有大数据、有大模型、有大算力,商汤在国产AIGC的亮相,一点也不意外。

是值得期待一波了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10900.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT在App Store累计下载量已突破50万次;Anthropic已成功完成4.5亿美元C轮融资

🚀 OpenAI的ChatGPT应用在苹果App Store上线6天时间内,累计下载量已突破50万次。 OpenAI的ChatGPT应用在苹果App Store上线6天时间内,累计下载量已突破50万次。 与微软必应等聊天机器人相比,其热度远超过且持续上升。 &#x1…

Web3中文|太心急!谷歌匆忙上线自家“ChatGPT”导致市值蒸发逾千亿美元

谷歌想证明它可以在AI竞赛中与微软抗衡,创建一个新的人工智能搜索引擎,但一个错误回答最终导致母公司 Alphabet 的市场损失超过千亿美元。 低开低走的美股市场 周三,美股三大指数低开低走。道琼斯指数收盘下跌207.68点,跌幅0.61%…

类ChatGPT应用Cohere拟募资数亿美元 估值或超60亿美元

雷递网 乐天 2月7日 ChatGPT的大火,不仅让谷歌、百度大受紧张,紧急推出产品,创业公司的类ChatGPT也受到追捧。 据外媒披露,与微软支持的OpenAI 竞争的AI基础模型公司Cohere正商谈在一轮融资中筹集数亿美元,估值可能超过…

Python对阿里巴巴、谷歌、腾讯等六家公司股票数据进行分析与可视化实战(附源码 超详细)

需要源码请点赞关注收藏后评论区留言私信~~~ 下面针对阿里巴巴、谷歌、亚马逊、Facebook、苹果和腾讯六家公司股票数据进行了分析与可视化描述,数据分析前需要安装互联数据获取包pandas-datareader 先使用conda安装: 1)python3环境 2&#xf…

谷歌向ChatGPT对手投4亿美元 后者来自OpenAI团队 估值50亿美元

雷递网 雷建平 2月5日 Alphabet Inc. 旗下谷歌已向人工智能初创公司Anthropic投资近4亿美元,Anthropic被视为是OpenAI开发的机器人应用ChatGPT的竞争对手。 Anthropic将使用谷歌的云计算服务。这笔交易标志着一家科技巨头与一家人工智能初创公司的最新联盟——生成人…

当ChatGPT遇到网络安全

ChatGPT:是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。GPT 是 …

在ROS中使用tensorflow进行人体姿态识别

原连接:https://community.bwbot.org/topic/497 运行测试平台:小强ROS机器人 body_pose 是一个人体姿态识别的软件包。这个软件包可以从图片中识别出人体的耳朵,眼睛,鼻子,四肢的共17个特征点。其实现是通过深度学习网络利用tens…

邹小强老师的个人目标管理分享课

有幸在公司参加了邹小强老师的目标管理培训课很有感触,写个笔记同时也给大家简单分享目标管理的一些方法和误区。附一位大神的思维导图整理。 制定目标的三个好处 1、成就感满足感 2、想法—>行动 3、充分利用时间 年度目标实现不了的四个原因 1、假&#xff…

使用xiaoqiang_track进行人体跟随和追踪

原链接: https://community.bwbot.org/topic/500 运行测试平台:小强ROS机器人 xiaoqiang_track xiaoqiang_track是一个利用摄像头捕捉的图像进行人体追踪的程序。它有比较好的稳定性,能够可靠的追踪目标。同时也具有比较好的扩展性。可以方便的对关键的追踪算法进行调整。在运…

小强统一认证中心-部署实例

前言 在前文章中介绍了,认证中心以及工程项目介绍。 相关文章 统一认证中心简介认证中心-项目工程介绍 本文主要讲解如何部署起来。首先简单的本地部署来-模拟使用认证中心统一认证。 文中附录示例工程源码地址 先上个先行图,登录了认证中心就相当…

小强统一认证中心-项目工程介绍

统一认证中心-项目工程介绍 在 上一篇文章 介绍了小强统一认证中心的功能点。本文主要讲解项目工程 相关文章 统一认证中心简介多平台部署实例 1.源码地址 源码地址:传送门 2.后端工程介绍 2.1工程模块介绍 工程模块名称备注sso-auth-center-service父工程定义…

【编程练习】小强去春游

题目来源:牛客,阿里巴巴编程题(2星),第3题 题目描述 从样例就可以看出,在选择由谁往回划的时候有两种选择方法。 对样例1([2,10,12,11])来说,每次都由最轻的人往回划&…

小强html5,小强的HTML5移动开发之路(15)——HTML5中的音频

浏览器虽然发展很快,但是浏览器中的标准还是不完善,在HTML4CSS2JS的前段开发中让很多程序员头疼的就是浏览器的兼容性问题,音频播放也一样,直到现在,仍然不存在一项网页上播放视频和音频的标准。现在,在大多…

小强ERP:旅游行业的996,还能改变吗?

近期,“996工作制”成为网络热议的话题。 从广大网友吐槽996,到马云认为“能做996是一种巨大的福气”,再到新华社、人民日报等官媒抨击996,话题一直在持续升温。 所谓996工作制,是指每天从早上9点工作到晚上9点,每周工作6天,代表了互联网小强ERP(http://www.tontisa.c…

如何恢复小强中被修改的软件包

原链接 https://community.bwbot.org/topic/686 开发测试平台:小强机器人 在使用小强的过程中可能会对小强中的相关软件进行修改。很容易出现修改后小强不能正常工作的情况。下面介绍如何恢复小强的相关软件。 小强的相关软件都是通过git进行代码管理的。任何对代…

学习ChatGPT,从这几个中文提示词教程开始

ChatGPT已经火爆了一段时间了,很多用户也体验了ChatGPT,他的回答非常的强大。但有些人能够得到很好地回答,有些人得到的答案,并不是非常的完美,其实这个短时间内,和一个叫做提示工程(Prompt Eng…

巨头环伺,青云科技已开启突围战

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 随着数据量的急剧增加,许多企业和组织都将目光投向了云计算,以期望通过这一技术来获得更多的商业优势和竞争力。近期,随着ChatGPT的爆火,大家对云计算的关注度再次攀向高峰。 …

AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定

衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 小美、小帅、丧彪和佛波勒,这几位AI配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。 然鹅,配音显然已经满足不了AIGC“大放异彩”之心,它对短视频赛道的入侵再加一&…

分享 15 个适合接私活赚钱的开源项目

上班不易,副业成刚需。 程序员接私活早已不是个新鲜话题——互联网行业整出的花活儿越多,对开发者的需求量就越大;对于一些中小公司和初创企业来说,不少的项目会直接外包或者是寻找远程开发者,由此便产生了程序员接私活…

人工智能行业研究:史上最伟大的科技革命

报告出品方:吕伟、郭新宇 作者:民生证券, 1 AI 大模型推动计算机历史三次最大浪潮实现“三山叠峦” 此次 AI 浪潮与以往科技产业浪潮最大不同在于,这次不是终端硬件变革开启, 而是软件先行定义一切,催生算力…