前几天科大讯飞的星火认知大模型发布了,我刚好有朋友在科大讯飞工作,于是就第一时间体验了一波。
一番体验下来确实比我预想的效果要好,没想到国产模型的效果还不错,我试了很多方面,比如通用常识功能、写作功能、学习能力,当然作为一个程序员,我测试最多的还是代码功能。
首先我问了他一下,图灵是谁?有什么成就?
嗯,回答的很不错!
换一个问题,让他给我讲个笑话,其中要山有水有马
嗯,确实是有山有水还有马,笑话讲的很好,下回别讲了。
后来我就想恶搞一下,让他猜一个中国娱乐界的人物,提示语是 鸡你太美 篮球 rap
,结果很意外,居然猜对了
这个确实让我觉得意外,我测试了不少国内的大模型,能猜出来的不多。
作为一个程序员,我最关心的肯定还是互联网方面,于是我就测试了一些代码能力。
1、写个学习路线
首先我让他写了一个C++学习路线,确实给出来了,而且在回答文末也指明了这只是一个简单的学习路线,具体的学习内容和深度可以根据个人需求和实际情况进行调整,同时也给了我建议,建议我在学习过程中注重实践巩固所学知识。
2、做道算法题
帮我做一道算法题,使用C++编程语言实现,来道两数之和算法题试试。
让我没想到的是,它居然还给我写了注释!!!
它真的,我哭死!
作为一名程序员,我最不喜欢的就是在写代码过程中写注释,但我也最痛恨那些不写注释的程序员,因为我看起来太太太费劲了。。。
3、八股文问答
后来我又问了他一道八股文,OSI 的七层模型分别是?各自的功能是什么?
回答的确实不错!该有的都有,功能写的也很全!
总的一番体验下来感觉还不错,对于一些通用常见的问题回答的很快也很准确,使用起来也没有chatGPT的卡顿感觉!
后来我朋友发给我一个新闻链接,国内有个中文通用大模型综合性评测基准前几天刚发布,该基准测试了国内主要的问答大模型,其实就是测评一下国内市面上主流的中文 GPT 大模型的能力,将国内市面上主流的中文 GPT 大模型分出个三六九等。
链接:http://ah.anhuinews.com/kjyww/202305/t20230510_6850235.html
从上图排名中可以看出,GPT-4 一骑绝尘,不得不服,已经非常接近人类的能力,排名第一,国产大模型中讯飞科技研发的星火认知大模型总排名第三,国内排名第一,这点确实出乎我意料。
后来一想,科大讯飞这个公司在中文翻译领域深耕很久了,拥有相当多的中文语料库,能一骑绝尘也就不奇怪了。
据说,明天要上线一个“助手模式”功能,只需简单切换就可以帮用户更好的完成定向场景的任务,比如:
你使用PPT大纲助手,给出PPT主题,PPT大纲就会自动为你展现;
你使用周报小助理,只需要简单列出工作事项,就可以在很短时间里给你列出一份详细周报;
你使用中英文翻译官,输入需要翻译的文本,也可以实现双语内容轻松切换。
这个可真省了不少事了,以后写周报就不需要自己绞尽脑汁了哈哈
科大讯飞的大模型最近也是开始了内测阶段,可惜的是一般人也拿不到内测资格,我找朋友要了一些内测体验权,通过内测链接注册即可,名额有限,先到先得,各位感兴趣的可以试试。
这里可以直接扫码体验或者点击文末的阅读原文链接体验,我申请了一些名额,还够用。
讯飞这边非常重视用户体验,还建了体验交流群,有使用相关的问题都可以在群里反馈。
点此阅读原文直接体验