阿里版 ChatGPT 突然关闭内测申请!

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

28c328fca107dec8b85934a3e3f7e8dc.png

4 月 7 日上午,阿里悄然推出了一款与 ChatGPT 类似的产品:通义千问

不过,目前该产品注册通道已经关闭,只能通过邀请码加入试用。

在产品上线的第一时间,阿里的同学也给我发来了邀请码,原打算当天写篇文章介绍下,无奈这几天比较忙,文章拖到现在才写好。

下面就让我们来好好把玩下这款产品。

打开通义千问官网,能看到主界面只有「使用邀请码」一个选项,意味着阿里暂时关闭了申请通道。具体什么原因,我还没去问。

19e08b2327bbaea71937e7a81698a1d8.pnghttps://tongyi.aliyun.com

登录进入产品,能感受到它与 ChatGPT、文心一言最明显的不同之处,在于提前内置了许多 Prompt(提示词)。

这些 Prompt 单独针对一个场景进行了封装微调。

这么做有两个好处,第一是方便用户更快上手,第二是让团队在这些具体场景上投入更多精力做优化,让用户体验效果更佳,同时也能尽可能规避自己的短板。

71d0f94522a53e5dc0e461907806d33c.png

在这个页面上,除了有职场助理、邮件撰写、电影脚本等功能,左下角还藏着一个百宝箱。

百宝箱将场景划分为了三大类:效率、生活、娱乐。每个分类下面都有对应工具。

估计未来还会根据用户使用需求,在这里新增一些使用场景。

918f78cde5096a007ab5a8a80a5530a2.png

为了让评测看起来更客观,我就不参考通义千问给出的预置模板了,因为这样对其他两个不太公平。

下面我将按照直接提问的方式,横向对比一下 ChatGPT(GPT-4)、文心一言、通义千问这三款产品。

对比角度:智能问答、语义理解、代码编写、解数学题、实时联网。

OK,话不多说,我们正式开始。

1. 智能问答:当一个人看到喜欢的人或物时,身体哪个部位会放大?

ChatGPT:

2db269148d15d04baef0e0d8207bd3bf.png

文心一言:

afc6f2fc520313c863e257e3f18f72ff.png

通义千问:

f1ae323e0a253af34ed28b307e2ef85e.png

这一波,ChatGPT 与文心一言打成平手,都给出了正确答案,通义千问则是在绕弯弯,答非所问,惜败。

2. 中文语义理解:"以前喜欢一个人,现在喜欢一个人",这句话里面包含了哪几种意思?

ChatGPT:

593cf94db987586d434241df2160e0b6.png

文心一言:

1a376e2b5c580f68c5268ee52f5194b9.png

通义千问:

663a1cb1659e8a7d00233ffec9c12a32.png

这个问题,三个 AI 都答得不太好,答案不是很全面,如果要评分,应该是:ChatGPT > 通义千问 > 文心一言。

3. 写代码

为了让展示效果更直观,我直接让他们三个给我生成一个 HTML 页面。

在这个页面里面,我只描述包含的元素,不限定样式和排版,看他们的创造力如何。

提示词:

帮我用代码写一个 HTML 静态页面。这个页面里面包含如下元素:1. 标题:文本内容为 "AI 工具大评测";
2. 按钮:文本内容依次为 "ChatGPT"、"文心一言"、"通义千问"。页面背景颜色为 #5562b0

为了让文章可读性更高,这里就不贴代码了,直接放上 HTML 界面效果图。

ChatGPT:

d4d13dde5a4e80e4a1438e8b938fb6d7.png

文心一言:

3088f39050c46368c1af35b21c35959e.png

通义千问:

50eef53708d46f9eb7d4a73a67474000.png

可以看到,ChatGPT 给出的界面显示效果最好,通义千问排版差了点,文心一言乱加需求。

不过使用过程中,通义千问在输出结果时,里面夹带了一段错误信息。

这个地方应该是 HTML 代码,它说成了 Python 代码:

9f11bf665c67c714f20a277d7599b624.png

这波我们根据代码结果评分:ChatGPT > 通义千问 > 文心一言

4. 做数学题

还是老样子,丢给他们一个传统的鸡兔同笼数学题。

鸡和兔在一个笼子里,共有 35 个头,94 只脚,那么鸡有多少只,兔有多少只?

这里先说下答案,兔子有 12 只,鸡有 23 只。

现在我们再来看下 AI 计算的结果。

ChatGPT:

bb86f08aee29ca20840d920c1f88d376.png

文心一言:

cd2d089e50d11f2e53e2ddd6ea9b7440.png

通义千问:

33bf6ebc5c5d3ee6dce558e3afefcca7.png

可以看到,ChatGPT 完整给出了解答步骤,文心一言优化了公式排版,并且这两个计算结果也都是正确的。

通义千问就稍微有点离谱,总共也才 35 个头,它给算出来 59 只鸡,35 只兔子。。。

这波评分:ChatGPT = 文心一言 > 通义千问

5. 是否联网

总所周知,ChatGPT 在 Plugin 推出之前,暂时还不能联网,如果其它模型有联网能力,在当前这个时间点,无疑会大大提升使用者的兴趣。

虽然期望值不高,但我还是想做下测试。

问题:微软 2023 年 4 月 9 日的股价是多少?

ChatGPT:

e5fc90af11d6627e0fc6a2b7532c7d19.png

文心一言:

ae58162d0c7b4d13086693cc2d768945.png

通义千问:

7cb8342a4d8cfa22c3fd4ec53a705dc1.png

可以看到,只有文心一言给出了股价,只可惜答案是错误的,截至今日,微软的股价应该是 $291.60。

通义千问倒好,直接切换形态改用英语回答了。

这波测试:ChatGPT = 文心一言 = 通义千问。

写在最后

通过上述测试,大家大概对这三款 AI 聊天机器人的能力,心里应该有个大致判断。

ChatGPT 就不用说了,完胜,这里着重说下文心一言和通义千问。

总的来说,这两款产品在文学创作上,做的还是可圈可点的,但是在一些需要逻辑判断的场景,能力还是有比较大的缺陷。

国内的大语言模型,文心一言应该算是起步时间比较早,技术沉淀比较深厚的。

通义千问在某些特定问题的处理上,竟然能比文心一言的好一点,说实话,这是有点出乎我意料的。

但综合而言,文心一言还是更胜一筹,通义千问想在短时间内赶超,恐怕还得花费不少力气。

如果你想了解更多关于 ChatGPT 的内容,欢迎点击下方链接,加入我们社群进一步交流探讨。

👇 每个进群的人,都会收到我们赠送的一枚 ChatGPT 账号。

ChatGPT 社群,正式上线!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6497.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软多模态ChatGPT来了?16亿参数搞定看图答题、智商测验等任务

关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 从大型语言模型(LLM)到多模态大型语言模型(MLLM)&am…

ChatGPT王炸更新!能联网获取新知识,可与5000+个应用交互,网友:太疯狂了

都说ChatGPT是AI的“iPhone时刻”,现在属于它的“应用商店”来了。 OpenAI刚刚又甩出一个王炸—— 宣布推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力。 例如在官方演示中,ChatGPT一旦接入数学知识引擎Wolfram Alpha&#xff0…

AudioGPT推出,音频领域都不放过,ChatGPT这是杀疯了。

3 天前 ChatGPT云炬学长 ​关注 今天和大家介绍的一个项目属于音频领域的ChatGPT的应用实践。真没想不到,在音频领域,ChatGPT都没有放过,ChatGPT这是杀疯了呀! 现在的ChatGPT是一个实打实的风口,也希望大家跟我一起努…

四少女火爆外网,AI杀疯了!

转自:量子位 | 金磊 四位美少女,带着AI画画在ChatGPT的热浪中杀出了一片天地。 新“魔法”一出,瞬间吸引全场目光: 原本是一张四个闺蜜在沙滩边上的普通合影照: 在新魔法的加持下,“啪的一下”画…

ChatGPT ✖️ 前端 = 有点er意思

HOT! HOT! HOT! 🔥 🔥 🔥 ChatGPT登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说&#xff…

干掉 Google?ChatGPT 这几天杀疯了!

点击关注公众号,Java干货及时送达 推荐阅读: Spring 旗下最牛逼的国产项目! Spring Boot 3.0 正式发布,王炸!! 出品 | OSC开源社区(ID:oschina2013) 人工智能研究公司 OpenAI 上周正…

AudioGPT推出!音频领域都不放过,ChatGPT这是杀疯了!

大家好,我是千与千寻,你们可以叫我千寻哥,算一算写ChatGPT的技术文章已经写到第四篇了! 今天和大家介绍的一个项目属于音频领域的ChatGPT的应用实践。真没想不到,在音频领域,ChatGPT都没有放过,ChatGPT这是杀疯了呀! 现在的ChatGPT是一个实打实的风口,也希望大家跟我…

用ChatGPT面试杀疯了,拿下大厂

集中投了几家公司后,便开始面试,为了节约时间,我选择使用Chatgpt辅助面试,果然是最佳私人助手,就像多了一个贴心秘书! 1、将想要应聘公司的岗位要求,jd复制到Chatgpt 2、问模拟面试官可能问到的…

Stable Diffusion、ChatGPT爆火的背后!

整编 | Carol 参考 |《AIGC 发展趋势报告 2023》 出品 | AI科技大本营 “Generative AI(生成式AI)有什么社会价值?” 当腾讯研究院的研究员将上面这个问题输入到ChatGPT中,得到如下回复: "生成式AI是一种人工智能…

ChatGPT 火爆全球,我们能抓住的下一个风口在哪?

中国互联网行业正面临着巨大的压力和挑战,但也孕育着新的发展机遇。当下正值ChatGPT火爆,整个互联网行业充满了机遇和挑战,身处其中的我们能抓住什么呢? 思你所思,帮大家整理出了五大风口!希望对大家有所帮…

爆火!ChatGPT背后的这类芯片赢麻了!

2022年底,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT一夜爆火,席卷全球多国及地区。毋庸置疑,ChatGPT火爆出圈得益于高性能计算、人工智能以及半导体等行业技术的飞速发展、不断迭代和有机结合。 该产品以强大的文字处理和人机交…

揭秘ChatGPT背后的传奇崛起,探索其引爆引爆网络的隐藏故事

文章目录 前言一、ChatGPT的诞生背景二、ChatGPT的技术原理三、ChatGPT的推广策略四、ChatGPT的未来展望五、橙子送书第3期 前言 ChatGPT是一款基于人工智能技术的聊天机器人,它的出现引起了广泛的关注和热议。在短短的时间内,ChatGPT就成为了全球范围内…

Spring boot +React集成ChatGPT 智能AI

在这里插入代码片import {Button, Input, Radio,Alert,Modal } from antd; import Marquee from react-fast-marquee; import {ChromeOutlined,WifiOutlined,AimOutlined } from ant-design/icons; import React, {useEffect, useState, useRef} from react; import chatgptPn…

中文调教指南,100个提升ChatGPT输出质量的中文prompts

最近这段时间ChatGPT的风实在是太大了,人工智能带给大家的冲击一波又一波,3月27日,根据高盛(Goldman Sachs)研究报告显示,以ChatGPT为代表的生成式AI产品,将对美国和欧洲三分之二工作岗位造成影…

Wombat:93%ChatGPT性能,无需RLHF就能对齐人类的语言模型

文 | zzy 文章地址: https://arxiv.org/abs/2304.05302v1 训练代码: https://github.com/GanjinZero/RRHF 模型权重: https://huggingface.co/GanjinZero/wombat-7b-delta 各个大模型的研究测试传送门 阿里通义千问传送门: https://tongyi.…

史诗级的突破,如何让GPT接口调用能绕过4000 tokens 的长度限制

最近很高兴有机会较为全面深入地研究GPT / ChatGPT这一热门技术,学到了不少东西,当然也遇到不少问题,其中一个问题就是,所有的GPT模型,都会有输入输出长度(加起来)的限制这个问题,就…

小扎、马斯克宣战ChatGPT!Meta和推特组建顶级AI团队,硅谷硝烟四起

【导读】ChatGPT大厂混战,怎能少得了Meta和推特?近日,小扎和马斯克也官宣下场,要做自己的ChatGPT了。 ChatGPT的爆火,直接改变了整个硅谷大厂的格局。 微软的步步出招,倒逼谷歌走出固步自封的境地&#x…

牛逼,玩转 ChatGPT!

ChatGPT是一种由OpenAI开发的人工智能模型,它可以模拟人类的对话交流,对话可以涉及各种话题。使用ChatGPT可以进行各种操作,例如自然语言生成、文本摘要、语言翻译、文本分类、问答系统等。下面是ChatGPT网站的可用链接,由于网络限…

对话冯·诺依曼理论奖得主叶荫宇:ChatGPT于行业智能,更像是全科医生对专科医生|数字思考者50人...

斯坦福大学讲席教授、冯诺依曼理论奖获得者:叶荫宇 ▎ChatGPT包罗万象,更像是一个全科医生,而运筹学以及求解器,则像是专科医生。 作者丨 韩敬娴 本文首发钛媒体APP 国际市场震荡不定,供应链波动剧烈、芯片短缺、碳排限…