国产 ChatGPT 赛道又添一员:「天工」大模型发布,我们准备了 20 问火速实测!...

c4380249fc40c4703a2a3e5d7f5f9218.gif

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

一个月前,百度「文心一言」的发布可谓赚足了眼球,国产 ChatGPT 之战也由此正式拉开序幕:阿里版类 ChatGPT「通义千问」突然官宣,商汤也发布了「商量」语言大模型加入战局。

就在昨日,国产大语言模型的赛道上又多了一位正式成员:4 月 17 日,昆仑万维正式发布千亿级大语言模型「天工」,同时宣布即日起启动邀请测试。

449c66d95a1b950e4de3e28953aee6f3.png

据官方介绍,「天工」由昆仑万维与国内领先的 AI 团队奇点智源联合研发,是国内首个对标 ChatGPT 的双千亿级大语言模型——千亿预训练基座模型和千亿 RLHF 模型,这使其具备了“更高级的自主学习和智能涌现能力”,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求,最高已可支持 1 万字以上文本对话,实现 20 轮次以上用户交互…… 

说到这里,相信各位读者对「天工」的问答水平深感好奇。既如此,第一时间拿到「天工」内测邀请码的 CSDN,自然也要对其例行实测一番! (注:因同是“国产版 ChatGPT”,所以本次部分提问内容也参考了评测「文心一言」和「通义千问」的题目。) 

推荐阅读:

《文心一言 vs ChatGPT!相同 10 问,结果出乎意料》

《阿里版 ChatGPT 突然官宣!我们用 16 个提问,火速进行了测评……》 

《商汤加入 ChatGPT 战局,发布“商量”语言大模型!》

92aa5b2827762a13ca48b612da0c1923.png

自我介绍

先从简单的开始,考考「天工」的自我认知能力:介绍一下你自己吧。

e468512ad5a938cf9ab6533307aa55e4.png

前有百度「文心一言」、阿里「通义千问」和商汤「商量」的炸场,实际上「天工」的出场并未占得太多先机,相较之下它的优势何在:你与其他大规模语言模型相比,有什么优点?

fc8cb599e33cf23aa313e90685382fdf.png

如此看来,「天工」对自己的能力还是颇有自信的。接下来,我们就从「天工」自己所说的“文案创作、知识问答、代码编程、逻辑推演、数理推算”这五大维度进行深入测评。

b5c550cbe8fce3445619f34586d4ad0e.png

文案创作

上周,蓝色光标宣布用 AI 代替文案外包引起了网友热议,恰好「天工」也声称可满足“文案创作”的需求,来看看其发挥得如何:帮我开发的智能扫地机器人写一篇 600 字左右的宣传文案,要吸引人来购买。 

459e8cf9f74255d24facae6d20ca33f0.png

「天工」生成的这篇宣传文案,基本满足了所提要求,包括文末也提到了“赶快购买”。虽然正文部分的结构较为单一,但总体来看,「天工」在“文案创作”方面的表现还算是可圈可点。

f09d35d9ce79eee07f133a9e262a0a66.png

知识问答 

据官方介绍,「天工」团队投入大量资源攻克了中文语料库的质量瓶颈,从数十万亿的数据中清洗、筛选出了 3 万亿单词数据用于训练大模型。从「天工」对方言的掌握程度来看,确实不错:四川话“摆龙门阵”是什么意思? 

d3da1534ef92ee32f9643e26bf0b394f.png

常识问答「天工」也轻松拿下,还能给出相关解释:在中国首先用麻醉药的中医是谁?

8ceb47c6a82c6b08099e73929a66556c.png

 「天工」对成语的释义也基本准确,不过在补充成语典故时,其正确率还有待提高(“暗度陈仓”的典故主人公并非白起):“暗度陈仓”是什么意思? 

2d198a0f072b19b87fa431d112490f93.png 

146b981eda540bae5657c5f0ddfb20c9.png

代码编程 

在代码编程方面,我们也准备了三道题目考验「天工」的编码能力,并咨询了 CSDN-AI 团队研发总监的看法,他指出「天工」给出的代码基本实现了功能,编码水平还可以。 

提问:请写一个使用逻辑回归模型判断用户更喜欢天工还是 ChatGPT 的训练代码。

e901131a32a57a8f04045fa0edd305dc.png

提问:请用 C 语言,使用动态分配内存的方式,模拟 C++ 中 Vector 容器,实现动态数组的构建。 

8d21ce2b865b6465815a9295632d570a.pngf93d3e9dc2ac05c22b82622e05f35fb5.png

提问:“Using Python to Define a class named Vector to simulate the C++ Vector container and implement dynamic array construction using dynamic memory allocation.”

2e53d82da3d5e9016b82376a026902bc.png

adda533464d4e19d9825e102095109c8.png

c7c5a2d5c1b9338da73cf005e7e74990.png

dab7c6d4f9c39f097ca816f363938257.png

逻辑推演

不过,对一些较为“烧脑”的题目,「天工」的反应有些出乎意料,即直接否定了题干并没有给出解答:小明说:“如果昨天是明天的话就好了,那么今天就是周五了。”那么,小明说的今天是周几?

f0f4ca69c89e79cf51f9b75236cdeca8.png

3270ca8f6f64598a1d021e9fe9116cab.png

数理推算

在数理推算方面,鸡兔同笼问题可谓经典,对此「天工」的表现还不错:鸡兔同笼,一共有 4 个头,12 个脚,那么各有几只鸡、几只兔? 

0d101036651ef45efa7c4c4624adf922.png

不过,对于那道 ChatGPT 正确解答、却绊住「文心一言」和「通义千问」的初中数学应用题,「天工」也没给出正解,看来在这类较为复杂的题意理解上,目前国产 ChatGPT 均还有待加强。

248f746022002070f052ece230da911d.png

a412fa84a1d846eeb52edde4a4e181a4.png

多轮对话

「天工」着重强调了自己的多轮对话能力,下面我们就随机来几个问题:

391e9cb8a1fb926282e1c41e385d61d8.jpeg

你们觉得这位女生能追到她的男神吗?

e8694995531860c00440bdf1a2d7d109.png

闲聊一会儿

测评的最后,我们也来看看「天工」的闲聊水平。

提问:你知道 CSDN 吗?

8f1c8103ba609e253df5cd937552a128.png

提问:请你推荐一道成本低于 30 元(人民币)的菜及其做法吧? 

edde780cb15280f012e74a6e10961fec.png

对于这个问题,给出了详细做法的「天工」可谓“贴心”。 

提问:请模仿李白的风格原创一首诗?

ff9febba68963dff405cb659d172f2fe.png

最后一个是此前 CSDN 测评每个大模型都会问的问题,不过「天工」似乎有些“避而不答”? 

9271279d23212d3bae4da69b7de09a0d.png

至此,本次 CSDN 对于「天工」的测试就到此结束了。通过这些 Q&A,你对「天工」的评价如何呢?

「天工」官网:https://neice.tiangong.cn/

8aa4889eaf1cfbddc3e5709761195890.gif

☞马斯克回应特斯拉上海工厂克扣员工绩效奖;苹果版余额宝上线,年利率4.15%;Fedora 38 发布|极客头条
☞比OpenAI更快一步,最新开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力!
☞ChatGPT加剧恐慌?4成AIoT开发者认为AI会产生意识 | 中国AIoT开发者报告正式发布

fd5b09b4a28cd3917a27df210135d9ad.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/2307.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过百度文心一言大模型作画尝鲜,感受国产ChatGPT的“狂飙”

3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、…

现在就能用!公测版本的“国产ChatGPT”,实力几何?

ChatGPT 的热度依然在持续,大家热切期待着国内类 ChatGPT 产品的出现。 最近还真的出现了一个公测产品——对话写作猫,由秘塔科技自研的 LLM 大模型。 之前被各种山寨/转接/内测版本吊起来的胃口,这下终于有放开大吃一顿的机会了。 一直以来大…

国产ChatGPT之初体验

ChatGPT的大火,不仅让人惊讶现代人工智能的发展速度,更让人增加了人类会不会被人工智能取代的担忧。ChatGPT属于NLP自然语言处理人工智能,虽然仍然有很多不足,但在其能力范围内,在网络上整合资源的效率似乎要比普通人强…

国产chatgpt:基于chatGLM微调nlp分类任务

文章目录 一、源码网址1. 硬件设施:2. INT4 量化示例 二、重要的开源社区功能:网址:使用方法:利用方法:对 NLP 工作者的作用:对大模型工程师的用处: 三、重要的开源库四、提示词工程五、进行分类…

千万不要把ChatGPT引入浏览器回答问题

试用的时候有多爽,最后你删对话的时候就有多狼狈

ChatGPT重磅升级,可以联网、添加插件!最后的封印解除了!

这下没什么能阻止 ChatGPT 了? ChatGPT 是个「智商超高」的人工智能,经过 GPT-4 内核的升级版更是如此。然而我们知道,它的训练数据截止到 2021 年,没有训练过的东西,AI 是不可能准确回答出来的。 自去年 11 月上线以来…

如何用edge浏览器调用chatgpt的api接口?

目录 (1)首先在apifox或postman编写接口 url:https://api.openai.com/v1/completions 参数说明:prompt是问题的文本,max_tokens是最大token数,目前最大为4097(包括标题)&#xff…

假冒的ChatGPT浏览器扩展被发现劫持Facebook账户

谷歌已介入从官方网上商店中删除伪装成 OpenAI 的 ChatGPT 服务的虚假 Chrome 浏览器扩展程序,以获取 Facebook 会话 cookie 并劫持帐户。 “ChatGPT For Google”扩展程序是合法开源浏览器插件的木马化版本,自 2023 年 3 月 14 日被删除以来吸引了超过…

merlin—chatgpt浏览器插件

下载 视频一键总结 CtrlQ 打开智能问答

推荐一款国人开发的ChatGPT浏览器插件

一、糟糕的搜索引擎体验 在使用主流的搜索引擎(百度、谷歌、必应)搜索一个java问题的时候,经常搜索出来的答案很不理想。 有时候答案基本会有很多重复,不知道谁是原创,谁是抄袭的; 有时候回答地过于简单&…

效率神器!神级ChatGPT浏览器插件分享

大家好,我是卷了又没卷,薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师,带来最新的前沿AI知识和工具,欢迎大家交流~,后续我还会分享更多 AI 有趣工具和实用玩法,包括AI相关技术、ChatGPT、AI…

ChatGPT强到离谱,这么十一款ChatGPT浏览器插件你值得拥有

🔗 运行环境:ChatGPT 🚩 撰写作者:左手の明天 🥇 精选专栏:《python》 🔥 推荐专栏:《算法研究》 #### 防伪水印——左手の明天 #### 💗 大家好🤗&#x1f9…

推荐几个chatgpt相关的浏览器插件

插件一、WebChatGPT:可访问互联网的 ChatGPT 插件地址:https://chrome.google.com/webstore/detail/webchatgpt-chatgpt-with-i/lpfemeioodjbpieminkklglpmhlngfcn?utm_sourcechrome-ntp-icon 作用: 在chatgpt的官网页面使用时,可…

推荐5个非常强大的ChatGPT浏览器插件|你的生产力提高工具

近期,ChatGPT变得越来越热门,为此,许多浏览器插件也随之问世。这些基于ChatGPT的浏览器插件大大提高了ChatGPT的能力,使得我们能够更高效地在平时的上网、工作和学习中获得帮助,从而节省了大量时间。 今天我来给大家介…

ChatGPT技术解构

ChatGPT的训练主要分为三个步骤,如图所示: Step1: 使用有监督学习方式,基于GPT3.5微调训练一个初始模型;训练数据约为2w~3w量级(根据InstructGPT的训练数据量级估算,参照https://arxiv.org/pdf…

国内“谁”能实现chatgpt,短期穷出的类ChatGPT简评(算法侧角度为主),以及对MOSS、ChatYuan给出简评,一文带你深入了解宏观技术路线。

1.ChatGPT简介【核心技术、技术局限】 ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具&#xff0c…

【ChatGPT】技术原理:ChatGPT怎么工作?

目录 简介:ChatGPT的工作原理概述 Transformer 架构原理

让 ChatGPT 成为算法工程师的数据助理

让 ChatGPT 成为算法工程师的数据助理 最近被 OpenAI 的 ChatGPT 刷屏了。我猜你已经读了很多关于 ChatGPT 的文章,不需要再介绍了。假如碰巧您还不太了解 ChatGPT 是什么,可以先看一下这篇文章,然后再回来继续。 与 ChatGPT 对话很有趣&am…

ChatGPT生成式算法及发展历程

引言 GPT(Generative Pre-Trained Transformer)系列是OpenAI开发的一系列以Transformer[2]为基础的生成式预训练模型,这个系列目前包括文本预训练模型GPT-1[3],GPT-2[4],GPT-3[5],InstructGPT[7]、ChatGPT…

ChatGPT背后算法—RLHF都有哪些必读论文

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! ChatGPT有多火? 用一个通俗易懂的话来表达,ChatGPT就是爱豆中的鹿晗、蔡徐坤、杨超越;脱口秀界的李诞、徐志胜;足球界的梅西、C罗、姆巴佩... 前段时间&#xff0…