文 | BFT机器人
在这个数字的智能时代,大家对人工智能、机器学习和生成式人工智能这些名词字眼很熟悉,有些人或许对它们还有一些了解,但是当他们一起出现的时候,大家能够区别它们是什么意思吗?今天小编将带你们详细解读一下它们吧!
生成式AI是当今最热门的人工智能形式,它为ChatGPT、Ernie、LLaMA、Claude和Command等聊天机器人以及DALL-E2、Stable Diffusion、Adobe Firefly和Midjourney等图像生成器提供动力。
生成式人工智能是人工智能的一个分支,它使机器能够从大量数据集中学习模式,然后根据这些模式自主生成新内容。尽管生成式人工智能相当新,但已经有许多可以生成文本、图像、视频和音频的模型示例。
许多“基础模型”已经接受了足够的数据训练,能够胜任各种任务。例如,大型语言模型可以生成论文、计算机代码、食谱、蛋白质结构、笑话、医疗诊断建议等等。理论上它还可以生成制造炸弹或制造生物武器的指令,尽管安全措施应该可以防止此类滥用
人工智能、机器学习和生成式人工智能之间有什么区别?
人工智能 (AI) 是指模仿人类智能的各种计算方法。
人工智能是一个广义的概念,它旨在研究和开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。AI领域的研究包括语言识别、图像识别、自然语言处理等众多子领域,旨在使计算机具有像人类一样的思维和行为能力。人工智能的应用范围非常广泛,从简单的语音助手到复杂的机器人系统,都可以归入人工智能的范畴。
机器学习(ML) 是人工智能的一个子集;它专注于使系统能够从数据中学习并提高其性能的算法。在生成式人工智能出现之前,大多数机器学习模型都是从数据集中学习来执行分类或预测等任务。
生成式人工智能是机器学习的一种特殊类型,涉及执行生成新内容任务、进入创造力领域的模型。
机器学习:AI的具体实现
机器学习是人工智能的一个重要分支,它是通过计算机算法让机器从数据中自动学习规律和模式,并利用这些规律和模式对新的未知数据进行预测和分析的一种技术。机器学习的应用非常广泛,例如在金融领域的风险评估、医疗领域的疾病诊断、电商领域的推荐系统等。通过机器学习,我们可以让计算机自动地完成一些复杂的任务,而不需要人为地进行编程。
生成式人工智能模型使用哪些架构?
生成模型是使用各种神经网络架构构建的,本质上是定义模型如何组织以及信息如何流经模型的设计和结构。一些最著名的架构是变分自动编码器(VAE)、生成对抗网络(GAN)和变压器。正是Transformer架构(在Google2017年发表的这篇开创性论文中首次展示)为当今的大型语言模型提供了动力。然而,Transformer架构不太适合其他类型的生成人工智能,例如图像和音频生成。
自动编码器通过编码器-解码器框架学习数据的有效表示 。编码器将输入数据压缩到一个低维空间,称为潜在(或嵌入)空间,它保留了数据最基本的方面。然后,解码器可以使用该压缩表示来重建原始数据。一旦以这种方式训练了自动编码器,它就可以使用新颖的输入来生成它认为合适的输出。这些模型通常部署在图像生成工具中,并且还用于药物发现,可用于生成具有所需特性的新分子。
对于生成对抗网络(GAN),训练涉及可以被视为对手的生成器和判别器。生成器致力于创建真实的数据,而鉴别器旨在区分这些生成的输出和真正的“地面实况”输出。每次鉴别器捕获生成的输出时,生成器都会使用该反馈来尝试提高其输出的质量。
但鉴别器也会收到有关其性能的反馈。这种对抗性的相互作用导致了两个组成部分的完善,从而产生了越来越真实的内容。GAN以创建深度伪造品而闻名,但也可用于更良性的图像生成形式和许多其他应用。
Transformer可以说是生成式AI架构的卫冕冠军,因为它在当今强大的大型语言模型 (LLM) 中无处不在。它的优势在于它的注意力机制,使模型能够在进行预测时关注输入序列的不同部分。
在语言模型的情况下,输入由组成句子的单词字符串组成,转换器预测接下来会出现什么单词。此外,Transformer可以并行处理序列中的所有元素,而不是像早期类型的模型那样从头到尾遍历序列;这种并行化使得训练更快、更高效。当开发人员添加大量文本数据集供变压器模型学习时,今天卓越的聊天机器人就出现了。
生成式人工智能:机器学习的进阶
生成式人工智能是机器学习的一个进阶阶段,它利用深度学习等复杂的机器学习技术,让计算机能够生成全新的、真实的内容,例如文章、图像和音乐等。生成式AI的应用也非常广泛,例如在搜索引擎中的自动回答、在语音助手中的自由对话、在虚拟现实中的场景生成等。通过生成式AI,我们可以让计算机自动地创造出全新的内容,从而极大地拓展了AI的应用范围。
为什么生成式人工智能存在争议
生成式人工智能的争议来源之一是其训练数据的来源。大多数训练大型模型来生成文本、图像、视频和音频的人工智能公司对其训练数据集的内容并不透明。各种泄露和实验表明,这些数据集包括受版权保护的材料,例如书籍、报纸文章和电影。许多诉讼正在进行中,以确定使用受版权保护的材料来训练人工智能系统是否构成合理使用,或者人工智能公司是否需要向版权所有者支付使用其材料的费用 。
与此相关的是,许多人担心生成式人工智能的广泛使用将抢走从事艺术、音乐、书面作品等创作的创造性人类的工作。人们还担心它可能会抢走从事各种白领工作的人的工作,包括翻译、律师助理、客户服务代表和记者。已经发生了一些令人不安的裁员,但还很难说生成式人工智能对于大规模企业应用程序是否足够可靠。
最后,还有生成式人工智能被用来制造坏东西的危险。当然,理论上它可以用来做很多坏事。生成式人工智能可用于个性化诈骗和网络钓鱼攻击:例如,使用“语音克隆”,诈骗者可以复制特定人的声音,并致电该人的家人请求帮助。
所有格式的生成式人工智能——文本、音频、图像和视频——都可以用来通过创建看似可信的从未发生过的事情的表征来生成错误信息,这在选举方面是一种特别令人担忧的可能性。图像和视频生成工具可用于制作未经同意的色情内容,尽管主流公司制造的工具不允许此类使用。
理论上,聊天机器人可以引导潜在的恐怖分子完成制造炸弹、神经毒气和许多其他恐怖活动的步骤。尽管大型法学硕士有防止此类滥用的保障措施,但一些黑客乐于规避这些保障措施。更重要的是,开源法学硕士的“未经审查”版本已经存在。
尽管存在这些潜在的问题,许多人认为生成式人工智能也可以提高人们的生产力,并可以用作实现全新形式的创造力的工具。我们可能会看到灾难和创造性的繁荣,以及许多我们意想不到的事情。
但了解这些模型如何工作的基础知识对于当今精通技术的人来说越来越重要。因为无论这些系统变得多么复杂,人类的工作就是让它们保持运行,让下一个系统变得更好,如果幸运的话,也可以帮助人们摆脱困境。
三者之间的联系以及区别总结
人工智能、机器学习和生成式人工智能虽然有紧密的联系,但它们在应用范围和技术手段上存在着明显的区别。人工智能是一个广义的概念,涵盖了众多子领域和应用方向;机器学习是实现人工智能的一种具体技术手段,通过让计算机从数据中自动学习规律和模式来完成任务;而生成式人工智能则是机器学习的一个进阶阶段,利用深度学习等技术让计算机能够生成全新的内容。
在实际应用中,我们可以根据不同的需求选择合适的技术手段。例如,在金融风险评估中,我们可能使用传统的机器学习方法来预测股票价格;而在智能客服中,我们可能使用生成式AI来自动回复用户的提问。因此,了解这三者之间的联系与区别,有助于我们更好地选择和应用相关技术,推动人工智能的发展和应用。
结语:
总的来说,人工智能、机器学习和生成式人工智能三者形成了一个不断演进的技术体系,为人类社会的发展带来了巨大的机遇和挑战。随着技术的不断进步和应用领域的拓展,我们有理由相信,这三者将会在未来发挥更加重要的作用,推动人类社会迈向更加智能化的未来。
外文翻译 | 木木
若您对该文章内容有任何疑问,请与我们联系,将及时回应。