声明:本文是 Suzanne Ambiel 所著文章《Spot the Bot: Or Why We Shouldn’t “Hide the Human”》的中文译文。
原文链接:https://blogs.vmware.com/opensource/2023/02/09/spot-the-bot-generative-ai-open-source-community/?utm_source=rss&utm_medium=rss&utm_campaign=spot-the-bot-generative-ai-open-source-community
译者注:Spot the Bot(寻找机器人)是一款游戏,作者引用了这款游戏的名称作为本文的标题。
除非你不在办公室,不看电子邮件,或者不知为何不插电,否则你可能已经听说过并玩过许多生成性人工智能工具中的一个。ChatGPT、JasperAI、Merlin,以及来自谷歌的新加入者 Bard 和微软的人工智能版本 Bing。这些新的人工智能支持的聊天机器人承诺并提供随时可用于 README 文件、博客、电子邮件、培训模块、歌曲等的内容或文本。每天都有新的用例出现。不动产(房源)登记系统是聊天机器人的最新宠儿。
在 ChatGPT 开始的时候,人们的情绪很快就从窃笑变成了颤抖,又回到了窃笑。这显然是一个强大的工具,但这种力量的应用一开始是令人恐惧的。人工智能机器人通过法律考试、撰写大学论文和撰写审判判决书的故事比比皆是。与这些故事爆发的速度一样,可以检测和管理人工智能生成的内容的工具的故事和消息宣布也是如此。关于 ChatGPT 的激烈辩论浮现出一系列积极的结果,如彻底改变数字营销,以及对其失败的警告,即人工智能为我们做的写作越多,我们学习和练习这项技能的人就越少。该技术的早期将继续以动荡和意见的摇摆为特征,像秋千一样来回摆动。很明显,技能发展的下一阶段将是最开始时如何对聊天机器人做出正确的提示(没有好的问题,你就无法得到好的答案)和最后收尾的编辑工作。
虽然大多数聊天机器人不是开源的,但它们都是基于开源软件的。在人工智能/机器学习(AI/ML)领域,无论是 Python 或 PyTorch,或 TensorFlow、Python 等语言,还是 OpenML 等引擎,开源都发挥着突出的作用。我们可以在致力于人工智能/机器学习(AI/ML)的基金会 —— LF Data & AI 基金会,当然还有新成立的 PyTorch 基金会里找到更多更全面的开源项目。
VMware 开源管理办公室(OSPO)团队深入参与了各方面的开源项目。在 Diana Atanasova 和 Teodora Sechkova 的博客 “如何用开源构建可信赖的人工智能” 中,看一看对抗性人工智能、建模以及伦理和安全问题。VMware 首席技术官办公室的 Enrique Corro 在他的博客 “为什么你的组织需要一套人工智能的道德原则” 中探讨了人工智能和机器学习的道德原则,他说:“有偏见的数据集,不小心的滥用,以及坏的行为者很容易将人工智能变成一种武器,带来可怕的后果”。而 VMware 的研究和创新团队透过 “安全性与现代应用程序可观察性相结合的项目(Project Trinidad)” 持续推进机器学习,以及 Tanzu and cnvrg.io 项目(一个以开源为核心的人工智能操作系统,用以改变企业从研究到生产的管理、扩展和加速人工智能和数据科学发展的方式)赋能企业级 MLOps。
译者注 1:MLOps 就是机器学习时代的 DevOps。它的主要作用就是连接模型构建团队和业务,运维团队,建立起一个标准化的模型开发,部署与运维流程,使得企业组织能更好的利用机器学习的能力来促进业务增长。
旧瓶装新酒
但这些都不是真正的新东西。考虑一下 TensorFlow 和 PyTorch,这两个开创性的人工智能/机器学习开源项目已经存在了六年之久,而 “人工智能” 这个词早在 20 世纪 50 年代就由约翰 · 麦卡锡提出了。一些消息来源断言,人工智能早在 1940 年代的艾伦 · 图灵和 Enigma 的工作中就开始了。那么,如果人工智能/机器学习已经存在了一段时间,为什么创新的步伐突然加快,每天都有大量的新工具和想法浮出水面?是什么点燃了这个空间,使其发展如此迅速?我认为其实是开源社区的人们让我们走到了这里,并将使我们继续前进,而非那些恒常罹患错失恐惧症(FOMO)的巨头公司们(如谷歌、IBM、阿里巴巴......)。
译者注 2:错失恐惧症(FOMO:Fear of Missing Out),也称社群恐慌症。是指由自己的不在场所产生的不安与持续性焦虑。患者总感到自己不在时可能发生非常有意义的事。
为了搞笑,我让一个生成式人工智能聊天机器人创作一首关于开源的诗,我们的团队自愿提供了一些对联来添加到颂歌中。结果是这样的:
开源软件是给我们所有人的礼物,
一个响应科技界号召的解决方案。
思想的协作塑造了一个聪慧敞亮的社区,
带来创新的代码从而恰到好处。
不再有供应商的锁定,不再有高昂的费用,
为你和我赋予权力与能力的泉源。
一个磨练开发者技能的游乐场,
一个创造力的平台,科技心跳在此激动人心。
从 Linux 到 Python,从 Apache 到 Ruby,
一个充满可能性的世界,正等待着我们。
开源软件,是我们所有人的朋友,
她给予我们自由的承诺始终屹立不倒。
但要谨慎地使用和前进,
因为代码仓库不等同于完成。
这些代码只是一个开端 —— 一个正在形成的梦想。
它是由你来完成的 —— 它就在那里等着你着手进行。
但随后你将把它投入生产
各种摩合的埋怨,抱怨,牢骚随之而生。
安装很麻烦,文档乱糟糟......!
为什么这些开发者不遵守他们的服务水平协议(SLA)?
各种缺陷总暗藏在你的代码深处
如果你不关心,麻烦就在路上了。
所以你要上心并遵守规则,
否则它就会变成噩梦,快乐变成忧伤。
我们站在众人强大而持久的肩膀上
他们激励我们永远保持好奇心和学习精神。
教会我们包容和如何付出尊重,
如何以众人利益为名驯服我们的自我。
因此,向那些将自己的追求作为目标的程序员们致敬,
请为我们带来最好的体验,并让我们接受考验。
每一行代码,都可能带来一个更好的未来,
开源软件是一种礼尚往来的乐趣。
在一个作品里,你能找到由机器人创造的部分吗?你能找到由人类创造的部分吗?或者说,它完全是由人类或是完全由机器人创造的吗?(专业提示:当你发表由人工智能聊天机器人创造或协助创造的作品时,一定要事先声明你是原创者,还是借助了人工智能机器人的能力。注明正确和完整的作品归属权是人格诚信的关键。)
隐藏的超级力量:你
所有这些聊天机器人的一个弱点是缺乏人情味。对我这个自诩为 “词霸” 的人来说,这些答案有点空洞、浅薄,而且缺乏温情。有些回答和措辞相当令人费解。当然,通过练习他们会变得更好,但现在,我更喜欢 “人性” 。由人类创作的书面文字的超级力量是笔下的人提供了巧妙的转折,分配了声音和语调以及自然的节奏,并为捕捉瞬间和情绪量身定制了作品。机器人无法做到这一点 —— 现在还不行,也不应该期望它们能做到。
那么开源的超级力量是什么呢?不是代码,而是创造代码的人。这是一种不可否认的能量,一种协作和共同发现的快感。没有人,开源社区的概念就不存在了。即使是机器人也知道这一点。再看看 “开源软件颂” 中的这些句子:
思想的协作塑造了一个聪慧敞亮的社区,
带来创新的代码从而恰到好处。
因此,让我们庆祝人工智能/机器学习和新的聊天机器人的进步,无论是创造书面文字、歌词,甚至是基本的代码组件,它都可以帮助我们起步,但它应该只是第一步,而不是唯一的一步。要谨慎使用,睁大眼睛。让我们不要忽视那些带我们来到这里,留在这里,并为我们指明前进方向的人。权力仍应属于我们所有人!
注:感谢 ChatGPT、Tim Pepper、Suzanne Ambiel、Ivana Atanasova 和 Velichka Atanasova 联手贡献的 “ 开源软件颂 ” 。
第 1-3 节:由 ChatGPT 创作
第 4-7 节:由 VMware 开源管理办公室(OSPO)团队创作
第 8 节:由 ChatGPT 创作
Suzanne Ambiel
Suzanne 是 VMware 的开源营销和战略总监。她从 2011 年开始在 VMware 工作,经历了公司的发展历程:从 VMware View 到 vSAN,再到现在的......
开源雨林围绕 开源通识、开源使用、开源贡献三大方面构建知识体系,愿把长期积累的经验系统化分享给企业,在 团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。
开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。
欢迎关注“开源雨林”公众号,获取最新、最全的消息。