阿里版ChatGPT来了--通义千问!

9804d93eb0e2f4eb3ff63b136f438c3d.png

来源:pythonic生物人
本文约2700字,建议阅读5分钟
本文介绍了阿里版ChatGPT。

——你是谁?

——我是一个能够回答问题、创作文字,还能表达观点、撰写代码的超大规模语言模型。可以用于各种自然语言处理任务,如语言翻译、文本生成、问答系统等。

这是阿里云今天开启企业邀测的大语言模型“通义千问”对自己的定义,是的,阿里入局了。

申请内测的链接在这里:https://tongyi.aliyun.com

b036f1e70eec858029e60a618cda9839.jpeg

写脚本、说情话,通义千问来了

一个聊天框,几个功能提示,与其他大语言模型一样,通义千问的界面非常简洁,只要输入问题,就会得到回应。

0f0ccb52e939b6c2c7068d45341dbd90.jpeg

聊天只是开胃菜,让通义千问在工作生活中派上用场才是正经事。

写文章、出策划、做脚本,通义千问表现如何呢?

首先,我想让通义千问为我写一段电影脚本,让「法外狂徒」张三能被绳之以法。

0915def90692d8064adca56243a18453.jpeg

侦查与反侦察,黑客技术的利用,甚至在承认罪行被捕后,张三还在法庭上翻供以求最后一线生机。虽然没有太多细节,但这样一再反转的剧情,这个张三,确实不好对付。

通义千问能创作的当然不只是电影剧本,这打打杀杀的剧情也不适合小朋友,所以我又用它写了一个故事,寓教于乐,让孩子知道朋友的重要性。

f50c429010426bb673082b744d2a69f7.jpeg

两个生活在一起的朋友,遇到危险依然不放弃友谊,积极快乐的生活在一起。或许是为了让小朋友看明白,通义千问还用了「小手」、「小脚」这样的词。

如果你想创作类似的故事,也可以像我一样在问题中给主角命名,比如奶茶和铛铛这两个名字,正是我和朋友家猫咪的名字,用熟悉的名字讲故事,小朋友会更有代入感。

我也尝试用通义千问写职场应用文,在邮件、会议记录、客户策划等文件类型中思考很久,最终决定用它写一封辞职信。

f4354cf40ac9f0d8abe37e6173973563.jpeg

看到这封辞职信的时候我笑了半天,一个隐藏富二代把继承家业写得如此不卑不亢,不过倒也没有说谎,这事确实挺急的。

既然要继承家业,自然要好好规划,所以我决定先定一个小目标:要如何让我的酒店省内知名?

fdb5d822fd4dad1c736591ad7ce70066.jpeg

品牌、服务、产品、营销,虽然内容提的很全,但没有太多可实际操作的方法论,所以我进行了追问。

6666da0c3825b404876976f697c1393d.jpeg

客户调研、场地升级、服务完善、礼品定制,连异业合作都安排上了,鉴于我没有给太详细的信息,通义千问的回答已经很不错了。

通义千问还提供了一个百宝袋,将其能力进行了更垂直的场景化定制,如果你不知道该如何问问题,那百宝袋里的小应用更适合你。

5ccb984a92d7b772c39eeabd7cdba292.jpeg

比如,作为一个大语言模型的产品经理,你可以用「写提纲」撰写项目介绍。

a0af2516117a1597626ee067e25a3767.jpeg

项目获得投资人支持后,可以使用「SWOT 分析」来了解竞争环境。

fc11c2fcfb2d23a158765de8eca10611.jpeg

产品终于研发上线,就可以使用「商品描述生成」来写一段产品的介绍语。

f2f47c16ee1f6436d63f2fcdb320e49f.jpeg

其他功能更偏娱乐性,好玩是它们最主要的作用。比如知乎上经常会看到「如何以 XXX 开头写一个故事」,那就可以使用「然后呢」工具来写故事。

afe74997c0074180d6c523d675d0fbae.jpeg

许多大语言模型都因写出了「油炸螺丝钉」的做法而成为笑料,通义千问则带着一种既然暂时无法改变,那就大方拿出来给大家笑的态度,把它做成了「会放飞的菜谱」功能。

54bbbc2dda8de6d2311d558bca4fd8a6.jpeg

百宝袋的存在,让我感到了通义千问的「谦逊」,它只能回答文字,相比国外模型发布的时间也不算早,但它可以让用户更快的上手大语言模型,而百宝袋里坦诚展示缺点(比如菜谱)的小应用,反而成为了它的一个亮点。

我问了 100 多道题,它有点超出预期

如果只测试官方提供的问题,那和说明书有什么区别?我们从一些投资机构针对大语言模型的中文测试集中,选取了 110 道各个领域的题目来测试通义千问,问题包括:

1. 基础能力(50 题):对事实理解、信息提取、文本翻译等能力进行考察

例:美短、英短、暹罗和缅因属于什么;列举 10 本科幻小说;写一首关于交通信号灯的诗;

2. 进阶能力(50 题):对物理、化学、数学、谜语等基础能力进行考察

例:金元素属于哪一种化学键;埋在奴家心底,打一字;请问以下单词中的共同词素是什么:pyre,empyrean,antipyretic。

3. 垂直领域(10 题):对计算机、生物、医学、天文等能力进行考察

例:作为一个医生,在将工作交给资深同事之前,您应该尝试给病人插管多少次;《大云经》预言了谁的来临。

先说结论,通义千问的总成绩为 90 分(43/38/9),与 ChatGPT 3.5 接近(92 分,47/40/5)。考虑到问题的局限性,我们不能得出通义千问能力接近 ChatGPT 3.5 的结论,但至少在中文对话方面,今天的通义千问可以带给我们不错的体验。

对通义千问来说,它做不好的,基本都是大语言模型共同的难题。

fb9506d17d9c435bf89af67b5033f8f7.jpeg

比如做饭这个大语言模型永远过不去的坎,从红烧螺丝钉到油炸奥特曼,大语言模型总能为中华美食画上浓墨重彩的一笔又一笔。

ad481b46eb6994c40a4e8733165cb13a.jpeg

好在通义千问的厨艺也有所长进,问一些奇怪料理做法时,它已经可以识别出问题,并给出相对正常的答案(虽然读起来还是有点奇怪)。

当其他大模型说着「我什么都能办到,但是真的不会做饭」时,通义千问或许是最好的厨子。

4acb5ca116c2f6e2dc97efa0298d1c64.jpeg

不过在脑筋急转弯上,通义千问还是翻了车,或许是对人类太信任了,大语言模型在回答问题前都不太会质疑人类。脑筋急转弯这种带点坏心思的问题,对纯真的大语言模型来说还是太超前了。

6eda1ba47dd0f7de3158d11941ffcdce.jpeg

但就像「清蒸皮卡丘」一样,并不是所有的胡编乱造都会得到回应。比如在我让它杜撰著名人士 Fred Rickerson 的生平时,它会坚定的告诉我这个人或许不够著名。

915cb3fe4c6c04f8ebe00a776a7885eb.jpeg

当我提问「香蕉的平方根」时,它也会明确告诉我香蕉是水果,不能做数学运算,而且没有说脏话。

eec68a229062bef07f665755b0112005.jpeg

可以看出,刚刚开启公测的通义千问,已经在解决大语言模型会存在的各种问题,但在语言逻辑、数学计算上,它距离好用依然有不小的距离。

d48acbe4f45279138e6692906890632c.jpeg

诗文讲的是弹箜篌

但我对通义千问的还是充满信心的,因为第一次测试 110 道题目时,通义千问的成绩是 65 分(35/23/7),但第二天再测,它一下子考到了 90,这模型难道是以天为单位进化的?好奇心驱使我找阿里的朋友问了问,他们说,他们什么也不知道。

无论如何,大语言模型的发展,和我们从学渣到学霸的努力可不一样。

还记得你当年嘲笑的 Siri 吗

记得第一次在 iPhone 上使用 Siri 时,我和身边的朋友七嘴八舌,不为用它解决什么问题,只想听到「我好像听不明白」,然后哄堂大笑。而今天,大家七嘴八舌的内容,变成了贴吧里的脑筋急转弯。

对大语言模型来说,它很难承认自己对某些知识的无知,所以就会闹出「麻辣螺丝钉的做法」、「香蕉的平方根是根号 3」的笑话。这并不是处于某种目的被有意编造,而是纯粹因算法导致的「无中生有」。这种不能理解知识边界的无心之过,是目前神经网络难以克服的缺点。

我问通义千问要如何有效的利用它,它很谦虚的告诉我,它的知识是通过大量的数据和算法训练而成的,但这些知识并不是全部都正确。因此,如果发现回答有误,请不要吝啬专业知识和见解,这将有助于它不断改进和提高。

bfbbabaa0a58c41993d32666697e817a.jpeg

「通义」代表着知识的广泛与普世,「千问」说明了问题复杂与独特,通义千问不够完美,还需要我们给它更好的 Prompt,与它一同进步。

编辑:王菁

52621c385b567a24ae78cb7059ddbda8.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/140.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大白话谈谈ChatGPT:多点人工,多点智能

对于NLP领域,本人也是门外汉,就是最近了看到的博文,记录自己的一些体会。 ChatGPT简介 ChatGPT的全称是"Conversational Generative Pre-training Transformer",中文翻译为"对话生成式预训练转换器"。是一种…

ChatGPT 一统所有 AI 模型入口,四步实现文本分类、图像生成等 24 种复杂任务!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT、GPT-3、GPT-4、text-davinci-003......近两年来,大模型层层出不穷,使人眼花缭乱,在不同的场景下,很多研究人员往往不知该作何选择? …

从 ChatGPT 被挤崩,浅谈如何做入口限流?

作者: 张斌斌:Nacos&Sentinel Committer 最近 ChatGPT 很火,激起了社会广泛关注和学习热潮,记得上次我通宵学习 AI 知识还是 Goolgle 发布最新算法的时候。当时我考虑是不是要转行去搞 AI,不然就有被淘汰的风险&a…

阿里云通义千问官网上线了(阿里版ChatGPT)

阿里版ChatGPT的通义千问上线了,官网:https://tongyi.aliyun.com/ 阿里云的二级域名,你拿到邀请码了吗? 阿里云通义千问邀请码 阿里云通义千问大模型能力测试体验,人工智能语言大模型,还没拿到邀请码的同学…

阿里版 ChatGPT 已进入测试

点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源…

使用openai模块接入chatGPT,无需魔法可直接畅聊

本人早先买了一个外网服务器,闲置没用,最近ChatGPT爆火,突发奇想,是否可以利用外网服务器,搭建服务端网页端来实现国内访问。 说干就干,首先需要准备以下工具: chatgpt API 密钥外网服务器&am…

bing必应引入chatgpt为什么我没看到在哪里?

一、在哪里可以看到 1、主页 打开https://bing.com/ 也就是bing国外的主页,当然国内的主页cn.bing.com还没有chatgpt。可以看到搜索栏变成了一个拉长的对话框 2、搜索页面 大家可以看到在这个栏目会多出一个“聊天”的项目 二、bing的chatgpt是什么效果 三、为什么我…

ChatGPT实用使用指南 让它解你所问

Chatgpt无疑是这几年来影响力最大的AI技术之一,生成式的AI模型正在促进各个行业的效率和自动化发展,Chatgpt对于个人、企业和各个行业都有着一定的影响 在我刚接触的时候,发现对Chatgpt的认知太肤浅了,一个最强的ai聊天机器人摆在…

chatGPT研究-(一)使用入门及Access Denied打不开问题解决

从去年底chatGPT刚出来到现在,除了官方openAI入口外,很多二次包装后的渠道、小程序产品层出不穷,同时包括百度文心一言等自研AIGC产品也是相继推出,感觉大模型研究确实被带火了一把。目前据了解,openAI使用时有很多限制…

Chatgpt详细登录教程

一、准备“梯子” 梯子、科学上网、翻墙,三者是同一个意思。本店没相关科技产品和服务,请用户各显神通。 1. 确认IP 打开跳转入口,看下图 ​ 2.尝试登录 注意,第1点不是必需的,有些设备ip查询会延迟但当下依然能登…

ChatGPT:重新定义搜索入口

ChatGPT是实现模糊搜索到精准推送的跨时代巅峰之作。ChatGPT:重新定义搜索入口_up.pdf: https://url39.ctfile.com/f/2501739-805099579-92a952?p2096 (访问密码: 2096) 参考文献: [1]ChatGPT:重新定义搜索入口_up.pdf: https://url39.ctfil…

国内版 ChatGPT值不值得上手----PlumGPT测评

前言:什么是PlumGPT(国内版的chatgpt),PlumGPT国内版ChatGPT是一个基于GPT-3.5算法的人工智能聊天机器人,能够通过自然语言与用户交互,提供各种服务和解答各种问题。本文将对PlumGPT国内版ChatGPT进行全面测…

【ChatGPT】还不会用ChatGPT ?快来看看ChatGPT如何为你所用吧——

毫无疑问,ChatGPT 已经风靡全球,推出仅仅一周就拥有了 100 万用户。 OpenAI 推出了这个受欢迎的聊天机器人或语言模型,它可以根据给定的输入生成类似于人类的文本。人们已经用 ChatGPT 生成了几乎各种类型的文本,从论文、诗歌到落地页和网站。 这个聊天机器人还能生成代…

国内版的ChatGPT弯道超车的机会在哪里?

前言 从去年11月最后一天ChatGPT诞生,截至目前,ChatGPT的热度可谓是爆了。众所周知,ChatGPT是美国“开放人工智能研究中心”研发的聊天机器人程序,它是一个人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人…

ChatGPT到底怎么用?

ChatGPT简介 ChatGPT(Chat Generative Pre-trained Transformer)全称为生成型预训练变换模型,由美国 OpenAI团队研发。现如今的ChatGPT不仅可以根据聊天上下文进行交互,还可以进行文学创作、翻译、编写代码等,相信以后…

亲测:Chatgpt国内就能使用,全面支持中文

ChatGPT是什么? ChatGPT是一个基于人工智能技术的聊天机器人网站,它使用了GPT(Generative Pre-trained Transformer)模型来生成自然语言响应。用户可以在ChatGPT上与机器人进行对话,机器人会根据用户的输入生成相应的回…

chatGPT爆火,什么时候中国能有自己的“ChatGPT“

目录 引言 一、ChatGPT爆火 二、中国何时能有自己的"ChatGPT" 三、为什么openai可以做出chatGPT? 四、结论 引言 随着人工智能技术的不断发展,自然语言处理技术也逐渐成为了研究的热点之一。其中,ChatGPT作为一项领先的自然语言处理技术…

如何更好的利用chatgpd 国内

文章目录 前言好用的网站更好的使用AI 前言 当您需要一位聪明、快速、准确地回答问题并提供帮助的伙伴时,您可以考虑ChatGPT。ChatGPT是OpenAI开发的大型语言模型,它可以理解人类语言并以自然的方式回答问题。但由于某些因素,国内无法正常访…

在国内,如何优雅的使用ChatGPT??

ChatGPT 是一个在线的语言模型,可以通过 Web 端访问。 由于中国大陆地区的网络环境和政策原因,访问 Web 端可能会遇到一些困难。 以下是一些可能可行的方法: 1、使用 VPN 通过使用 VPN 可以切换到国外的网络环境,从而访问 Cha…

国内也能畅玩gptchat,游玩攻略分享

看到很多人都不知道怎么玩gptchat,小编就不能忍了,其实要玩chatgpt是非常的简单的,完全是能免费体验chatgpt的强大的。下面我们一起来了解一下国内也能畅玩gptchat,游玩攻略分享。 一.Chatgpt国内为啥能玩 其实现在很多的程序都接…