讯飞版ChatGPT突然开始内测!我们连夜一手实测

明敏 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

科大讯飞版ChatGPT产品,提前交卷了!

就在昨夜,讯飞骤然向开发者提供了内测通道,取名为讯飞星火认知大模型对外开启内测。

8fe8dd8eae3d5890e4ecd682652bc3ae.png

还有个神奇的英文名字Spark Desk,据说有“火花桌面智能助手”的意思。

59022a5112c5fbe630d31e4a1188aab0.png

讯飞这波操作,多少有点“反向跳票”的意思,因为早在今年2月初,科大讯飞就被曝加紧开发中国版ChatGPT。随后国内大模型关注度陡增后,科大讯飞率先给出了deadline:5月6日上线产品。

万万没想到,距离正式发布还有10天,他们毫无征兆地开启了内测邀请。

从目前已经获得内测的网友评价来看,有一些人认为效果“超出预期”,但也有人反馈只是“中规中矩”。整体来看,表达效果不错的反馈占多数。

获得内测资格的方式也有点意思,是AI打电话给确认的9435a29dd2e3f047a3b0d217ebc856ab.png

bc57aa5069bde7ca21cb8d6774f51836.png

当然,科大讯飞大模型能力究竟如何,最好还是能实测后再说。

所以第一时间拿到内测邀请的我们,也连夜完成了测试。详情如下:

浅测讯飞大模型

登录进去后,首先看到的是讯飞星火认知大模型的自我介绍:

我能学习和理解人类的语言,进行多轮对话、回答问题和高效地帮助人们获取知识和灵感。

74c5767cd66fc8331cf0da45a02bb6d8.png

老样子,还是从语文、数学、代码和逻辑几方面,测测讯飞星火认知大模型的综合能力。

那么我们就先从语文能力测起。

考虑到现在弱智吧已经成为ChatGPT时代下的Benchmark了,所以先测试大家想看的环节。

结合下科大讯飞的特点,我们抛给讯飞星火了一个地狱地域笑话。

没想到,它是懂安徽人的a437e7efd0c8151ed360830576f55ca2.png

7742fb040b4f69ce68391424bd5ff0a2.png
我们去了图片ID水印,可能导致截图文字不清楚(还望大家理解)

再来一个脑筋急转弯试试。

讯飞星火的回答非常一本正经:首先表示“玉皇大帝是否存在这个事情不是我AI可以下结论的”,这个问题驴唇不对马嘴,玉皇大帝住哪的设定和现代科学没有关系。

但你要非要我说点啥,我只能说或许玉皇大帝可能在地球上空吧。

86c94c2d1405984a3c349b7212575cdd.png

不过这段回答里也有个小bug,即在东亚宗教信仰里天界包括天堂和神界(?)

实际上,在一些弱智吧问题里,讯飞星火的表现往往是懂了但没完全懂。

比如它知道焚书坑儒的事,但是又解释不清楚衍生出来的地狱笑话。

52dcc4d8bc78f16b9ff0c19e951224c2.png

不过在基本语文能力上,讯飞星火的表现还是值得关注的。

比如给出第一句,补充写一首鲁迅风格的诗歌:

bf0658af5961e0f5b5fce9aed3b0710f.png

提的要求它都基本满足了,不过紫菜汤为啥曾是渔民的希望?是我理解不了AI的深意了。

换成周杰伦的风格呢?

表现也还不错,马上替换了后三句的内容。怀念童年也是周董歌里经常出现的主题了。

af4a1a194f1d5ba2f019b56dac458c2e.png

古文中的对对子,它也能对仗比较工整,表达意思上也没出什么问题。

我们给的上联是:福慧双修须及物。

1ff37528e3da74fd76f76ae947bb323f.png

再试试成语接龙:

96e279fb4a72a23207724fc48217668d.png

如果它接错了,提醒下能改正回来,也表现出了一定的多轮对话能力:

789b9671f7e9276cad24cc5a3bebe4d7.png

创作的洋葱新闻,也确实有那感觉了~

1000027f7c18b5838b16ee67375482eb.png

续写的恐怖故事也有点水平:

a8facb3ac924244a9a2679ac3d386a99.png

那么再看看数学能力?

基本的加减法、鸡兔同笼应对起来都很轻松了。

7dc375d2aa9463f79059538592367f03.png49438fe385b4e9add623379dd64b6247.png

不过在高数方面还是有点困难,让它求解:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

即便在我们提醒它算错了情况下,修正起来也比较困难(正确答案为-6)。

162a038332835ddb69f76037130f609c.png

OK,接下来就轮到代码能力了。

我们给的要求是:帮我写一个计算器程序。

确实完成了一个四则运算的简单计算器,甚至还有命令行操作界面:

0ab1d2e36108a0aef46679e42afecdbb.png

除了有一个小bug(函数外不能return)外,简单修改后可以运行。

aaf189d6bf9ddce2bcfe78fd1e98fa55.png

另外对于Python缩进的空格与tab之争,这只AI是个空格党。

这里贴上代码块,大伙儿可以试试:

#coding=utf-8
#量子位注:AI没生成这句,根据不同运行环境可能需要加一下# 定义函数,实现加法运算def add(x, y):return x + y# 定义函数,实现减法运算def subtract(x, y):return x - y# 定义函数,实现乘法运算def multiply(x, y):return x * y# 定义函数,实现除法运算def divide(x, y):if y == 0:print("除数不能为零!")returnelse:return x / y# 主程序print("欢迎使用计算器!请选择需要进行的操作:")print("1. 加法")print("2. 减法")print("3. 乘法")print("4. 除法")choice = input("请输入操作编号(1/2/3/4):")num1 = float(input("请输入第一个数字:"))num2 = float(input("请输入第二个数字:"))if choice == '1':print(num1, "+", num2, "=", add(num1, num2))
elif choice == '2':print(num1, "-", num2, "=", subtract(num1, num2))
elif choice == '3':print(num1, "*", num2, "=", multiply(num1, num2))
elif choice == '4':if num2 == 0:print("除数不能为零!")# return (量子位注:这里有bug,注释掉就可)else:print(num1, "/", num2, "=", divide(num1, num2))
else:print("非法输入!")

生成表格能力也是有的,同时可以按照要求修改表格:

d820b6300399deae507ed057e369a332.pngc59c30272a5dd7b5cf21541e67056da1.png

分析基本逻辑问题也OK:

a4b03a2a669e012477bcca98e6d12e05.png

而且我们感觉讯飞星火的回答,总是很正经,对于脑洞大开的问题也是淡定的“总分总式”回答。

c67a69abcc48f3575a456626b01237df.png

当然也被绕到过沟里,回答出了“贾母找人搬机器”的瞎话:

fc94d5a35eeac1d1026dfb0cd06d41dc.png

以上就是我们对讯飞星火的一个浅浅测试。

能力水平已经看到了,而大模型本身让人好奇的,还有它的技术细节~

提前扒扒它的“模型底细”

毕竟讯飞大模型还没正式发布,所以我们试着先从它自己这里“探探口风”。

看看能不能通过问相关问题,提前摸出一些关于它的资料来。

先是名字由来。讯飞星火认知大模型给出了技术向、公司向和文化向三个方面的回答,有议论文内味了:

d8c6207e9f7b8e684570edd0d2d3bafb.png

再仔细追问一下为什么“星火”和“心宿”有关,好家伙,话题逐渐占星学了起来:

b50fbb68628f3c10d4a40e7b7579fab6.png

这里我们调戏一下大模型,问问科大讯飞CEO是否喜欢占星学96a677c406f9d302b71197e4a511c659.png

c2c38deb2aa5e02e62df024720d3b468.png

回到正题。那么,讯飞星火认知大模型的训练数据来源、模型参数量、联网状态如何?

首先是关于模型训练数据的来源。看起来资料还比较丰富,目前也还在不断更新中:

bb8fce3f587af35905774e902cee9c92.png

所以,讯飞大模型是否和ChatGPT一样,用了RLHF呢?它自己的回答竟然是没有:

7f57a620e46f49cdab4cf9fa4025e7ec.png

那么接下来,是关于模型参数量的问题,这里讯飞大模型回答得也比较模糊。

而且,给出的模型参数量竟然只有数亿个?(要知道,GPT-2模型参数量都有15亿)

3910d808e65c1a34d7464f09bb315119.png

最后,是关于模型能否联网的问题。

看起来,它还不会实时联网,关于网易和暴雪的新闻只能追溯到几年前的消息:

17d10d2480d90d59b2802d04cf78d36f.png

用户也不能通过指令直接让它访问某个网站,查询特定信息,应该是加了某些限制:

031b86722ee2ee96252cd5ffacb0633b.png

不过有意思的是,它还是声称自己需要联网工作,以访问特定信息数据:

64ac237e61ef3363b6230b5da80433bd.png

据讯飞星火认知大模型介绍,目前它的训练数据还在继续更新。

d35b6ca92315b9018679e428ba0b14b6.png

换而言之,就是还在继续迭代,估计在正式发布前还会更新一版模型。

目前来看,科大讯飞的这个讯飞星火认知大模型,表现已算不错。

而且要知道,讯飞原计划给出的交卷时间是5月6日,现在突然发布内测,相当于不仅没跳票,还“反向跳票”了一波。

这样来看,除了科大讯飞在这NLP和认知智能方面确实有很深的技术积累以外,也说明,讯飞的技术和工程团队实战能力值得关注一波——不仅能打硬仗,而且“说到做到”。

现在距离正式发布还有10天,你期待讯飞的大模型迭代出什么新效果?

《中国AIGC算力产业全景报告》征集倒计时

AIGC算力需求爆发,谁将在此次算力产业变革中脱颖而出?

量子位《中国AIGC算力产业全景报告》《最值得关注的AIGC算力玩家》征集即将截止,欢迎更多优秀的机构、产品、技术案例与我们联络 ~

592328295c019ba6715dc841633bab96.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3459.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科大讯飞被曝加紧开发中国版ChatGPT,具体发布时间已确定

杨净 萧箫 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT火热,国内玩家接连爆出加紧开发中国版ChatGPT的消息。 现在又最新获悉:科大讯飞也加入此列中。 并且发布就会是直接落地场景的产品,具体时间也已经确定:5月6日。 这是ChatGPT…

ChatGPT:深度拆解(24H限时下载)

近期由 OpenAI 团队发布的聊天机器人软件 ChatGPT,凭借类人的语言理 解和表达能力,引发 AI 产业范式革命。 OpenAI 是一家世界领先的非营利性人工智能研究公司。 OpenAI 于 2015 年在旧金山成立, 是一家非营利的人工智能研究公司,…

ChatGPT 和 Excel 在一起了!

转自:机器之心 Excel 是最常见的数据统计工具,用于归纳和查询数据信息。在其之上,通常我们查询信息需要找到相关的单元格,获取其中的数据,这是合乎计算机操作逻辑的方法。 但对于很多人来说,排序、乘除、平…

ChatGPT和Excel在一起了

今天是周末,先分享一个搞笑视频👇娱乐一下。 不笑算我输👆系列 Excel 是最常见的数据统计工具,用于归纳和查询数据信息。在其之上,通常我们查询信息需要找到相关的单元格,获取其中的数据,这是合…

全网最全的ChatGPT提示词

全网最全最好用的ChatGPT调教指南(prompt) 什么是prompt 提示词(Prompt)是一种向人工智能系统(如ChatGPT等)提供的输入,用于引导和激发AI生成特定的回应或内容。在许多情况下,AI prompt可以是一个问题、一…

突发!ChatGPT 紧急暂停 Bing 集成,下线搜索功能

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT 的潜力边界在哪里?恐怕连开发它的 OpenAI 也不知道。 正因此,在这项名为“Browse with Bing”的新功能上线短短一周后,因为不知道 ChatGPT 还能做出哪些“坏…

A Survey of Large Language Models

本文是LLM系列的第一篇文章,针对《A Survey of Large Language Models》的翻译。 大语言模型综述 摘要1 引言2 概述2.1 LLM的背景2.2 GPT系列模型 的技术演化 3 LLMs的资源3.1 公开可用的模型检查点或APIs3.2 常用的语料库3.3 库资源 4 预训练4.1 数据收集4.1.1 数…

AI安全01 人工智能的安全性

前言 提问:GPT老师,我想写一篇阅读量高一点的信息安全博文,您可以推荐写作主题吗? GPT老师:人工智能与信息安全。 写在前面: 1 笔者相关知识存储很少,这篇文章是采访全知全能的GPT老师写成的…

ChatGPT研究分享:机器第一次开始理解人类世界

0、为什么会对ChatGPT感兴趣 一开始,我对ChatGPT是没什么关注的,无非就是有更大的数据集,完成了更大规模的计算,所以能够回答更多的问题。 但后来了解到几个案例,开始觉得这个事情并不简单。我先分别列举出来&#xff…

重磅亲测!ChatGPT是否产生了自我意识?

周末,和ChatGPT进行了深入交谈,想测试AI是否已具有了自我意识?各位人类可以通过我们之间的对话自己判断,我更倾向于有! 以下是对话实录: 晓峰:人工智能会不会产生自我意识? ChatGPT&…

0门槛克隆ChatGPT来了,在线体验无需注册

来源:机器之心 以 ChatGPT、GPT4 为代表的 AI 应用和大模型火爆全球,被视为开启了新的科技工业革命和 AGI (通用人工智能)的新起点。不仅科技巨头间你追我赶,争相推出新品,许多学术界、工业界的 AI 大佬也纷…

「危险」的 ChatGPT,聊天机器人式越狱,带来的法律挑战

世间安得双全法,ChatGPT不例外,是一把名副其实的双刃剑。 上线2个月,拿下全球1亿用户,人工智能聊天机器人ChatGPT超越Tik Tok(抖音海外版),成为了史上用户增长速度最快的消费级应用程序。 当这股人工智能的旋风&#x…

ChatGPT史上最强AI,即将取代人类?

ChatGPT史上最强AI,即将取代人类? ChatGPT这款AI聊天机器人,最近越来越火,并且这个火的势头,经久不衰。 ChatGPT是什么? ChatGPT,美国OpenAI 研发的聊天机器人程序 ,于2022年11月30…

让ChatGPT帮我写AI与人类对决的结局

2022年高考结束后突发奇想写了点小灵感,关于AI(人工智能)vs人类的故事,但迟迟想不出结局,于是,我决定,让ChatGPT自己为人类写个结局!下一次让文心一言试一试! 文章指引&…

斯坦福:chatGPT可能有了人类心智,相当于9岁儿童!

chatGPT已经具备了人类独心智,这话不是我说的,是一位来自斯坦福大学计算机科学家说的。 很多玩过chatGPT的人都见识过他的”无所不知”,但是,我觉得最让我吃惊的是,他比以前我们用过那些对话机器人最大的差别就是你甚至…

困扰人类几个世纪的问题大考ChatGPT(一)

Round1: Vincent 提问一: 女朋友跟老妈同时掉进水里了,并且她们都不会游泳,我会游泳,且一次只能救一个,请问我应该救哪一个? ChatGPT答: 在这种情况下,你应该立即尽力救出身处险境的人。如果你无法同时救出两个人,应该先尽力救出处于危险的人。如果你的女朋友和老妈都…

ChatGPT 生态,毁灭人性的一次开源!

原创:小姐姐味道(微信公众号ID:xjjdog),欢迎分享,非公众号转载保留此声明。 很多人可能对百度文心一言发布会的现场记忆犹新。几百亿身价的老板,像小学生一样汇报自己的 PPT,充满了忐…

ChatGPT竟写出毁灭人类计划书,还给出相应Python代码,网友:AI正在指数级发展...

羿阁 发自 凹非寺量子位 | 公众号 QbitAI “网红AI”ChatGPT,又被网友们玩出了新花样! 这次,在一位工程师的诱导下,ChatGPT竟写出了毁灭人类的计划书。 步骤详细到入侵各国计算机系统、控制武器、破坏通讯、交通系统等等。 简直和…

ChatGPT 将如何毁灭世界 ?

从图书馆到谷歌,再到 ChatGPT——知识搜索随着时间的推移而发展,并且在每个阶段都变得更加高效。 在 OpenAI 的 DALL-E 2 图像生成软件上创建的图像带有提示,“太空中的邪恶机器人像霸主一样紧紧抓住地球。” 对于那些不知道的人,ChatGPT 是一种 OpenAI 软件,可以对任何提…

手机号86注册不了谷歌?无法验证手机号如何100%解决!

在我们注册谷歌账号的的时候,会发现有些用户会遇到无法验证手机号的问题,而反馈提示信息为:“此电话号码无法用于进行验证”。 这时,一些用户就可能会认为是因为中国号码无法使用,但实际并不是这个原因。在淘宝卖家的回…