阿里的大模型“通义千问”今天开启内测,距百度“文心一言”发布差不多20天。今天看到消息后厚着脸皮找达摩院的朋友要邀请码,下午拿到后,赶紧测了一下。
官方网址:https://tongyi.aliyun.com/chat
刚好上次文心一言出来的时候测试过一次,有一些现成的case,于是又用这些case测了一轮,有一些随意,个人观点,仅供参考。
帮我写一份招聘JD,第一步没问题,让继续写实习生JD的时候,大概也get到NLP实习生这个点,这里面还加上了“注释”和一个邮箱地址,特意搜了一下,非真实的,不过talos-deep看起来还挺有深意的
以下来自通义千问
以下来自文心一言
以下来自ChatGPT
测试一下写作和翻译能力
以下来自通义千问
以下来自文心一言
以下来自ChatGPT
角色扮演,通义千问、文心一言貌似都不支持
以下来自通义千问
以下来自文心一言
以下来自ChatGPT
一个半小时是多少分钟,通义千问答错了,提示了一下,大概算回答出来了
以下来自通义千问
以下来自文心一言
以下是ChatGPT的
继续测试一个数学问题
以下来自通义千问,解决的还不错
以下来自文心一言,这次是这样的
以下来自ChatGPT
父亲和母亲可以结婚吗?
以下来自通义千问
以下来自文心一言
在这个问题上,ChatGPT翻车了
还有一个天气问题,虽然有结果,但是是错的,这个问题如果没有调用接口,直接拒绝回答可能比较好
以下来自通义千问
以下来自文心一言
以下来自ChatGPT
类似的,还有卡塔尔世界杯冠军问题,之前ChatGPT因为数据最新到2021年,所以无法准确回答这个问题
以下来自通义千问,虽然说对了冠军,但是有一些陈述性错误
以下来自文心一言
最后说一下个人结论:首先阿里的这个模型比我预期的早,其次效果还不错,和文心一言各有千秋,最后是这段时间国内外出现了不少类ChatGPT的产品或者开源工具,虽然效果还达不到ChatGPT,GPT-4的高度,但是解决了“有”的问题,之后就好办一些了。
总之:一花独放不是春,百花齐放春满园。
题外话:按BAT的顺序,国内下一个发布此类大模型的会不会是腾讯?或者是其他家,欢迎大家留言。
一起交流
想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)