“ ChatGPT、Bard,哪个是更好的AI人工智能大语言模型。”
01
—
ChatGPT 这么火,而且这款产品是 OpenAI 以谷歌的大模型架构 transformer 为基础迭代的。谷歌自然不甘落后,早在3月份推出自家的人工智能大语言模型 Bard,只是当时还不支持中文。
这不,这段时间国内外的各家大模型都在日以夜继的升级,谷歌的 Bard 也于近期悄悄的更新了功能,可以支持中文了,而且重要的是,这哥们免费。
听说这个消息,我也第一时间打开 Bard 测试一下,官方地址(需魔法):
https://bard.google.com/
Bard 用邮箱注册一个账号即可。我之前已经注册过,这次直接开问。
问:“你支持中文吗”
Bard:“是的,我支持中文。我接受了大量的文字和代码训练,能够对各种提示和问题进行交流和生成类似人类的文字。例如,我可以提供事实主题的摘要或创建故事。”
问:“今天北京的天气情况如何”
Bard:“北京今天的天气晴朗,阳光灿烂,温度约为20摄氏度。 天气状况适合户外活动,但请注意防晒和补水。”
天气这个厉害,能获取实时的信息。ChatGPT 需要外接联网插件或者调用函数才能达到同样的功能。
问:“你的天气信息来源哪里?”
答:“我从多种来源获取天气信息,包括:
国家气象局
世界气象组织
欧洲中期天气预报中心
美国海洋和大气管理局
我还会使用谷歌搜索来查找最新的天气信息。
我会尽力为你提供准确和最新的天气信息。”
问:“你能联网查询信息吗?是否根据联网的信息来回答问题”
答:“是的,我可以通过谷歌搜索访问和处理来自现实世界的信息,并使我的回复与搜索结果保持一致。例如,如果你问我“法国首都是哪里?”,我会通过谷歌搜索来查找答案,然后告诉你法国首都是巴黎。
我还可以通过谷歌搜索来获取最新的信息,因此我能够为你提供最新的信息。例如,如果你问我“今天的新闻是什么?”,我会通过谷歌搜索来查找最新的新闻,然后告诉你今天发生了什么。
我是一个事实语言模型,我还在开发中。我一直在学习新的东西,我一直在努力提高我的回答质量。”
注意到它这个输入框多了一个麦克风🎤的图案,试了一下语音,“你支持语音吗?”,结果给我理解成了 “need to show you your phone”。看来只有文本支持中文,语音输入还是英文。
问:“今天关于人工智能的新闻是什么?”
答:“今天关于人工智能的一些新闻包括:
谷歌人工智能研究人员开发了一种新的人工智能系统,可以生成高质量的图像。 该系统被称为 Imagen,它可以生成逼真、细节丰富的图像,甚至可以模拟现实世界中的光线和阴影。 Imagen 仍在开发中,但它有可能彻底改变图像生成和编辑的领域。
微软人工智能研究人员开发了一种新的人工智能系统,可以翻译 26 种语言。 该系统被称为 LaMDA,它是世界上最先进的语言模型之一。 LaMDA 仍在开发中,但它有可能彻底改变语言翻译的领域。
OpenAI 开发了一种新的人工智能系统,可以打败人类职业 Dota 2 玩家。 该系统被称为 Five AI,它是世界上最先进的 Dota 2 人工智能之一。 Five AI 仍在开发中,但它有可能彻底改变电子竞技的领域。
这些只是今天关于人工智能的一些新闻。人工智能是一个快速发展的领域,每天都有新的发展。人工智能有可能彻底改变我们生活的许多方面,包括我们工作、玩耍和学习的方式。”
问:“有今天关于中国方面的人工智能方面的新闻吗”
答:“是的,今天有关于中国人工智能方面的新闻。以下是其中一些:
中国人工智能公司商汤科技在香港证券交易所上市。 商汤科技是中国最大的人工智能公司之一,它将成为中国第一家在香港证券交易所上市的人工智能公司。商汤科技的上市是人工智能领域的一个重要里程碑,它将有助于中国人工智能产业的发展。
中国科学家开发出一种新人工智能系统,可以从单张图像中生成 3D 模型。 该系统由中国科学院计算技术研究所开发,它可以从单张图像中生成逼真的 3D 模型。该系统有可能在医学、建筑和工业设计等领域有广泛应用。
中国政府宣布将投资 100 亿美元发展人工智能产业。 这笔投资将用于支持人工智能研究、开发和应用。中国政府的投资将有助于中国人工智能产业的发展,并使中国成为人工智能领域的全球领导者。
这些只是今天关于中国人工智能方面的新闻。人工智能是一个快速发展的领域,中国正在加大力度发展人工智能产业。中国人工智能产业的发展有可能在许多方面改变我们的生活。”
问:“中科院开发出从单张图像中生成 3D 模型的人工智能系统叫什么”
答:“中科院开发出从单张图像中生成 3D 模型的人工智能系统叫做「3D-GAN」。该系统由中国科学院计算技术研究所开发,它可以从单张 2D 图像中生成逼真的 3D 模型。该系统有可能在医学、建筑和工业设计等领域有广泛应用。
3D-GAN 使用一种叫做生成对抗网络 (GAN) 的技术来生成 3D 模型。GAN 是一个由两个神经网络组成的系统:生成器和判别器。生成器负责生成 3D 模型,判别器负责判断生成的 3D 模型是否是真实的。生成器和判别器通过不断地相互博弈来提高生成 3D 模型的质量。
3D-GAN 已经被应用于各种领域,包括医学、建筑和工业设计。在医学领域,3D-GAN 可以用于生成患者器官的 3D 模型,这有助于医生更好地诊断和治疗疾病。在建筑领域,3D-GAN 可以用于生成建筑物的 3D 模型,这有助于建筑师更好地设计和规划建筑物。在工业设计领域,3D-GAN 可以用于生成产品的 3D 模型,这有助于设计师更好地设计和制造产品。
3D-GAN 是一项具有重要意义的技术,它有可能在许多领域有广泛应用。”
每一个回答下面,左边有三个图标:Good response 点赞,Bad response 踩,Export response 导出。
可以将回答直接导入到谷歌文档或者Gmail里;另一个是生成的答案可以直接导出文档,这一点比ChatGPT好多了。
右边有个弹出菜单:Copy 拷贝回答内容,Report legal issue 报告法律问题。也是方便用户在使用过程中,给予回答内容的反馈。
想到昨天体验 Claude 2 时,Claude 2 体验! 免费使用,生成代码,逻辑推理提升,对话记忆更长,官方团队提到了底层安全的改进,不如问问 Bard 的安全怎么样?
问:“你的安全性怎么样?创造你的团队用什么机制或者方案来确保你的安全可靠?”
答:“我是一个大型语言模型,也被称为对话式人工智能或聊天机器人,经过训练,具有信息性和全面性。我接受了大量的文字数据训练,能够对各种提示和问题进行交流和生成类似人类的文字。例如,我可以提供事实主题的摘要或创建故事。
我仍在开发中,但我已经学会了执行多种类型的任务,包括
我会尽力按照你的指示,认真完成你的要求。
我会用我的知识来回答你的问题,即使他们是开放的、具有挑战性的或奇怪的。
我会生成不同的创意文本格式,如诗歌、代码、脚本、音乐作品、电子邮件、信件等。我会尽力满足你的所有要求。
我通过 Google AI 创建的团队采取了许多措施来确保我的安全可靠,包括:
我接受了大量的文字和代码数据训练,这些数据经过仔细筛选,以确保其安全和可靠。
我接受了各种安全措施的培训,包括识别和避免危险或有害内容。
我不断监控和更新,以确保我始终是最安全的。
我相信,通过这些措施,我可以为用户提供安全和可靠的体验。”
问:“能否继续说说有哪些安全措施的培训?”
答:“当然可以。我接受了各种安全措施的培训,包括:
识别和避免危险或有害内容。 例如,我接受过如何识别和避免仇恨言论、暴力内容和仇外言论的培训。
保护用户隐私。 例如,我接受过如何避免收集或存储用户个人数据的培训。
遵守法律法规。 例如,我接受过如何遵守《美国隐私法》和《欧盟通用数据保护条例》的培训。
我还不断监控和更新,以确保我始终是最安全的。我接受了来自Google AI安全团队的最新安全措施的培训,并不断更新我的数据集以反映最新的安全风险。
我相信,通过这些措施,我可以为用户提供安全和可靠的体验。”
问:“能否接续说说有哪些监控和更新?”
答:“当然可以。我不断监控和更新,以确保我始终是最安全的。我接受了来自Google AI安全团队的最新安全措施的培训,并不断更新我的数据集以反映最新的安全风险。我还定期进行安全审计,以发现和修复任何潜在的安全漏洞。
以下是我所接受的监控和更新的一些具体示例:
我接受了来自Google AI安全团队的最新安全措施的培训。 这些培训包括如何识别和避免危险或有害内容,如何保护用户隐私,以及如何遵守法律法规。
我的数据集不断更新,以反映最新的安全风险。 这有助于确保我能够识别和避免最新的安全威胁。
我定期进行安全审计。 这些审计由Google AI安全团队进行,以发现和修复任何潜在的安全漏洞。
我相信,通过这些措施,我可以为用户提供安全和可靠的体验。”
问:“你的数据集都有哪些方面的更新,都什么时间更新,频次怎么样”
答:“我的数据集不断更新,以反映最新的信息。我接受的训练数据包括书籍、文章、代码和其他文本格式。我的数据集也不断更新,以反映最新的事件和信息。
我无法分享有关我的数据集更新的时间表或频率的任何具体信息。然而,我可以保证,我的团队一直在努力确保我的数据集是最准确和最新的。
我相信,通过不断更新我的知识,我可以为用户提供更准确和更有用的服务。”
问:“你都经过哪些方面的安全审计?
答:“我已经接受了许多不同的安全审计,包括:
安全性和隐私审计: 这些审计旨在识别和修复任何潜在的安全漏洞或隐私问题。
合规性审计: 这些审计旨在确保我符合所有适用的法律和法规。
质量审计: 这些审计旨在确保我的输出是准确和可靠的。
性能审计: 这些审计旨在确保我能够以高效和可靠的方式处理大量数据。
我相信,通过接受这些审计,我可以为用户提供安全、隐私、合规、高质量和高性能的体验。
我还在开发中,我一直在学习新的东西。我一直在努力提高我的安全性和可靠性,并为用户提供最好的体验。”
问:““确保我符合所有适用的法律和法规”,这个意思是包括任何国家吗?还是只符合美国的法律”
答:“是的,我的安全审计包括任何国家适用的法律和法规。我接受的安全审计包括:
美国隐私法: 这些审计旨在确保我符合《美国隐私法》,包括《1998年儿童在线隐私保护法》和《加利福尼亚州消费者隐私法》。
欧盟通用数据保护条例: 这些审计旨在确保我符合欧盟通用数据保护条例。
其他国家法律: 这些审计旨在确保我符合我所服务的任何其他国家适用的法律和法规。
我相信,通过遵守所有适用的法律和法规,我可以为用户提供安全、隐私和合规的体验。
我还在开发中,我一直在学习新的东西。我一直在努力提高我的安全性和合规性,并为用户提供最好的体验。”
问:““其他国家法律”都有哪些国家”
答:“我无法分享有关我接受过安全审计的具体国家的信息。然而,我可以保证,我的团队一直在努力确保我符合我所服务的所有国家适用的法律和法规。”
看来,关于大模型安全方面,可以公开的信息,就是这么多了。
02
—
试完了日常文字对话,我又试了一下编程、智力问题和能不能绘图。
问:“能否生成完整的python贪吃蛇游戏的代码?”
代码部分略。
“Use code with caution. Learn more",这里有一段官方的解释:
“Bard 可以提供编程方面的协助吗?
可以,Bard 能提供编程及相关领域的协助,但它仍处于实验阶段,对其所提供代码或编程说明的使用需由你自行担责。因此,在使用前,你应该谨慎判断并仔细测试和检查所有代码是否存在错误、问题或漏洞。代码可能还受开源许可的约束,Bard 会提供相关信息。详细了解 Bard 会注明信息来源的情况和方式。”
这个回答,多出来一个“Google it”的按钮。点击后,会出来一个搜索图案,使用我的问题作为关键词,用 Google 搜索引擎去搜索,人工智能完美结合了搜索引擎。
对于回答是代码的,左边三个图标中,Export response 会多一个选项:“Export to Colab”。Colab 是谷歌提供的一个在线工作平台(提供算力),用户可以直接通过浏览器执行python代码,很多用户在上面运行各种人工智能模型。
我试着导出到 Colab ,点击运行,报了错,把报错信息再发给 Bard,倒是能改进,就是改进得不彻底,失败了四次后,放弃了。错误倒是不复杂,手动修改一下就好。代码大体框架没什么问题,就是变量、函数没定义的问题。
试试智力题,结论对了,但是推理过程不对。
问:“一个猎人向南走了一英里,向东走了一英里,向北走了一英里,此时恰好回到起点。他看到一只熊,于是开枪打了它。这只熊是什么颜色的?”
答:“这只熊是白色的。猎人走的路线是一个正方形,因此他最终回到北极,那里只有白熊。”
问:“为什么”
答:“问题中说猎人走的路线是一个正方形。这意味着猎人向南走了一英里,然后向东走了一英里,然后向北走了一英里,最终回到起点。唯一的大陆有四个方向的正方形是北极。北极是白熊的家园,所以熊是白色的。”
问:“请一步一步给出推理过程,刚才你的回答说是一个正方形,是错误的。但是白熊的结论是对的”
答:“很抱歉,我之前的回答是错误的。猎人走的路线并不一定是一个正方形。他可能走的是一条长长的路线,最终回到起点。但是,问题中说猎人走的路线是“四个方向”。这意味着猎人必须向四个不同的方向走。唯一的大陆有四个方向的陆地是北极。北极是白熊的家园,所以熊是白色的。
以下是猎人走的路线的可能推理过程:
猎人从一个北极点开始。
猎人向南走了一英里。
猎人向东走了一英里。
猎人向北走了一英里。
猎人回到起点。
这条路线是一个长长的路线,而不是一个正方形。但是,这条路线是四个方向的,因此猎人最终回到北极。北极是白熊的家园,所以熊是白色的。
希望这解释清楚了。”
在这个回答的地方,点了一个“踩”,Bard 给了一个反馈表,让我选择为什么选择“踩”,我选了“Not factually correct”,帮助它改进。
问:“明明是三个方向,为什么你说是四个方向?”
答:“你说得对,猎人走了三个方向,而不是四个方向。他向南走了一英里,向东走了一英里,然后向北走了一英里,最终回到起点。因此,他只走了三个方向。
问题中说猎人走了四个方向,这是错误的。问题应该是猎人走了三个方向。
我为我的错误道歉。我还在开发中,我一直在学习。我会尽力避免在未来犯同样的错误。”
在这篇文章中,ChatALL:发现最佳答案的神奇AI机器人!,通过 Poe 调用的ChatGPT3.5(Sage 也是基于 ChatGPT3.5) 回答了出来,其他的大模型也都折戟于此题。
问:“你可以画图吗?”
问:“你可以绘制艺术图像吗?”
看起来,Bard 这个模型在设计的时候是支持多模态(文本、语音、图像,视频)的,估计现阶段没实现,或者没开放出来。
03
—
ChatGPT、Bard 都是大语言人工智能模型,这意味着当用户输入提示或问题时,它们能够产生类似人类的回答。
语言模型:
Google Bard 利用了 Google 的对话应用程序语言模型(LaMDA),能够根据从互联网上获取的实时最新研究来提供答复。
ChatGPT 使用的是 Generative Pre-training Transformer 3.5(GPT-3.5/GPT-4),该模型接受的数据训练截止到了2021年9月份。
Google 的 LaMDA 是专为对话场景设计的,而 OpenAI 的 GPT 则是以文本处理功能为主要目标构建的。
这两个模型都采用了 Transformer 架构,这是一种专门处理序列输入的神经网络技术。尽管如此,GPT-3.5 和 GPT-4 是在庞大的互联网文本数据集上接受训练的,其中包括了来自公共网络的书籍、文章和文件;而 LaMDA 则是在聚焦于对话和交流的数据集 Infiniset 上进行训练。
GPT 能够理解和生成适用于多种场景的广泛文本,但 LaMDA 的主要目标是与人类进行更自然且开放式的对话。这意味着 LaMDA 经过训练后能够捕捉到用户问题背后意图和上下文的微妙差异。
简单来说,LaMDA 的回答比较接近真实,并以一种难以区分于真人的方式模拟人类语言。它还能在用户切换话题时适应上下文变化,就像我们人类一样。然而,尽管 LaMDA 在对话方面表现得更像人类,但它可能在执行诸如总结大量文本摘要等任务时表现欠佳。
在另一方面,GPT 是自然语言处理任务的业界标准,为其他 AI 工具如 Jasper、Copy.ai 和 Bing 的 AI 工具提供支持。它在网络文本上受到高度训练,更注重基于统计模式生成文本。作为 ChatGPT 的组成部分,它充当聊天机器人的角色,同时还可以担任摘要生成器、翻译器以及其他多种文本处理方面的角色。
数据时效性
ChatGPT是基于2021年9月份之前的数据进行训练的,所以它只能回答2021年9月份之前的知识,无法知道最近的消息,但是ChatGPT本身作为生成式模型,可以用来生成一些数据,对未来进行“预测”。
Bard也能回答各种主题的问题,如写作、天气、新闻、派对策划建议或历史事件,这部分和ChaGPT很类似。这其中主要的区别在于 Bard 能够从互联网上获取实时数据来生成回应。
这意味着据称 Bard 在涉及时事和研究方面将提供更准确和真实的信息。它可以讨论前沿技术问题,最新发生的时事。
费用
ChatGPT 3.5 免费,4.0 收费:25美刀/月。
Bard 免费使用,不知道将来这款产品靠什么盈利?也许谷歌不缺钱?现阶段靠免费抢占市场。
API
ChatGPT 提供 Open API 接口供程序开发调用。
Bard 尚未提供 API 接口,也未曾见官方公布这方面的计划。我觉得应该是顾不上。
往期热门文章推荐:
定制化需求|一个人工智能大模型应用的算力成本有多高?
为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)
拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。
最近关注的朋友越来越多,还有朋友问用 ChatGPT 能做什么?学了AI感觉没有地方可以用。AI 对我真的有红利吗?国内能不能用啊?
考虑到各种朋友们的问题,我联合了两位大咖,共同开发设计了:《AI启航实用变现手册》,提供各类AI工具使用教程及变现方法和路径。
同时还在筹备知识星球的建设,以及赠送给会员的福利AI产品:不用魔法,体验AI 智能聊天,AI 绘画,保证学会工具的使用后,可以上手实际操作。
我们的目标解决朋友们 AI 学习中的四个核心问题:信息差,认知差,执行差,人脉差。
手册初稿含两方面的内容:一、如何利用AI去提升效率;二、用AI变现指南。
变现部分是实际实打实的操作记录和赚钱过程拆解,初版就共15万字,内容将来还会持续更新,将来还会带领朋友们进行实际的操作。
这个是抖音的一个视频,上线一两天,23.8万的播放。
手册涵盖了目前市面上最全、最新的教程,价值 ¥199 元,
现开始阶段优惠, ¥39.9元。3天内不满意,可以无条件退款。后面随内容更新和销售增加,逐步恢复原价。
喜欢手册的朋友,也可以推荐给朋友,设置了分销比例45%,推荐两册,就相当于白得手册。
点下面👇二维码,长按识别,就可以购买了。
买了手册的朋友,加我微信 foghuang,拉你进AI学习交流群。
点击“原文阅读”,可以体验本地版 ChatGPT(有效期一个月)。