大语言模型

前言:

        Open AI推出Chat GPT后,风靡全球。AI的强大表现让人折服,带来的商业效应已经逐渐扩散开来。随着人工智能越来越强,未来人们的生活受到影响也会越来越广泛。

        继 OpenAI 推出 ChatGPT 后,微软迅速上线基于 GPT 模型的 New Bing、Microsoft 365 Copilot、GitHub Copilot X 等产品。

        谷歌也推出类似 ChatGPT 的 AI 应用,亚马逊、百度、阿里巴巴、腾讯、华为、京东、网易、科大讯飞等企业也积极表示要布局相关的研究、开发和应用。

        目前国产GPT有最先发布的百度文心一言,继而阿里的通义千问,商汤的商量,以及最近开放测试的科大讯飞星火认知大模型、360 GPT 大模型产品矩阵“360 智脑”,昆仑天工3.5,知乎知海图Ai,此外还有华为盘古大模型。

        背后,就是GPT这个大模型在发挥作用(Generative Pre-trained Transformer),翻译为“基于Transformer的生成式预训练模型”(引号里的中文值得逐字理解),通俗点讲,这个模型的目的就是理解用户所输入的文字,然后计算答案,然后用用户能懂的语言进行呈现。

术语

  • NLP:Natural Language Processing(自然语言处理)
  • LLM:Large Language Modle(大语言模型)
  • AGI:General Artificial Intelligence(通用人工智能)
  • AIGC:AI-generated content(人工智能生产内容,后续文章详解)

关键技术点

1.Transformer

        Transformer是一个利用注意力机制来提高模型训练速度的模型。

        可以简单理解为它是一个黑盒子,当在做文本翻译任务时,输入进去一个中文,经过这个黑盒子之后,输出来翻译过后的英文。

        也可以理解为一个特征提取器,中文语义:转换器,目的就是把给他的文本数据进行理解学习,形成他认为的人类语法。

        Transformer的核心是自注意力机制(self-attention),它可以让模型在处理序列数据时,将不同位置的信息加权组合起来,从而更好地理解输入序列的结构和含义。这其中的核心手段是编码和解码,即Encoder和Decoder。

        Encoder把输入文本编码成一系列向量,Decoder则将这些向量逐一解码成输出文本。在每一个Encoder和Decoder中,有多个自注意力层和前馈神经网络层组成。这些层通过不断传递信息和调整参数,最终将输入转化为一个意义准确的输出。

                                                                Transformer 模型架构

2. MLM(Masked Language Modeling)

        大多数现代的NLP系统都遵循一种非常标准的方法训练各种用例的新模型,即先训练后微调。在这里,预处理训练的目标是利用大量未标记的文本,在对各种特定的自然语言处理任务(如机器翻译、文本摘要等)进行微调之前,建立一个通用的语言理解模型。

        MLM(掩码语言模型)是 GPT 预训练中的一个关键技术点,其目的是通过对输入序列中的部分单词进行遮盖,使模型在预测下一个单词时能够学习到上下文的信息。

        在MLM中,模型会在输入的文本序列中随机选择一些单词,并将其替换为特殊的MASK标记。模型的任务是预测这些MASK标记所代表的单词是什么。因为模型只能观察到MASK标记周围的文本,因此它需要对上下文进行建模,以便正确地预测MASK标记所代表的单词。Transformer、MLM等等这些架构、算法和模型设计让GPT问世,而Prompt和Fine-tune可以让我们能更好地使用他。

3. Prompt

        中文语义:提问、提示语。在与ChatGPT对话时,输入即为prompt,想要让GPT更好地理解我们的意图,那prompt的精度就决定这个大模型能否高效理解我们的意图。

        Prompt是一种输入方式,它将人工智能模型的输入限制在一个特定的范围内,从而更好地控制模型的输出。在ChatGPT模型中,Prompting技术可用于对模型进行微调和优化,从而使其更适合某些特定的任务。

        例如,在生成一篇介绍人工智能的文章时,可以使用Prompt:

        “请根据以下内容介绍人工智能:人工智能是一种模拟人类智能的技术,它包括机器学习、自然语言处理、计算机视觉等领域。请在文章中简要介绍人工智能的定义、历史、应用场景和未来发展方向。”

        这个Prompt可以指导模型生成一篇简要介绍人工智能的文章,其中包括人工智能的定义、历史、应用场景和未来发展方向。

4. Fine-tune

        中文语义:微调。企业在应用AI能力时,GPT可以定义为一个理解自然语言的初始模型,为更好地应用在业务场景中,可以在GPT的基础上进行微调,理解为一个有监督学习的过程,输入业务数据或领域数据集,让它能读懂业务数据并按需输出。

前景

        在未来,随着大语言模型技术的不断发展和普及,它将为软件产品带来更加智能化、精准化和个性化的服务,并推动软件产品向更高水平的发展。

        同时,由于人们对隐私和数据安全的关注不断增加,如何在大语言模型的应用过程中保护用户隐私和数据安全,也将成为一个重要的话题和挑战。

        后续介绍具体的使用方式及业务场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27140.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 利用基于“一致性”的图像生成器超越扩散模型

图像生成领域发展迅速。 尽管 Midjourney 和 Stable Diffusion 等流行工具使用的扩散模型可能看起来是我们所拥有的最好的,但下一个东西总是会出现——OpenAI 可能会用“一致性模型”来解决它,它已经可以完成简单的任务和 数量级比 DALL-E 之类的快。 该…

扩散模型和Transformer梦幻联动!替换U-Net,一举拿下新SOTA!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>扩散模型微信技术交流群 转载自:量子位 “U-Net已死,Transformer成为扩散模型新SOTA了!” 就在ChatGPT占尽AI圈风头时,纽约大学…

扩散模型diffusion model用于图像恢复任务详细原理 (去雨,去雾等皆可),附实现代码

文章目录 1. 去噪扩散概率模型2. 前向扩散3. 反向采样3. 图像条件扩散模型4. 可以考虑改进的点5. 实现代码 话不多说,先上代码: 扩散模型diffusion model用于图像恢复完整可运行代码,附详细实验操作流程 令外一篇简化超分扩散模型SR3来实现图…

0基础学习diffusion_model扩散模型【易理解的公式推导】Denoising Diffusion Probabilistic Models

0基础学习diffusion_model扩散模型【易理解的公式推导】 一、概述二、扩散过程(已知X0求Xt)三、逆扩散过程(已知Xt求Xt-1)1。算法流程图四、结论五、损失函数六、心得体会(优缺点分析)一、概述 DDPM论文链接: Jonathan Ho_Denoising Diffusion Probabilistic Models(NeurIPS…

07.04.2023 日语笔记

貰『もら』える(可以……吗?) コーヒーをテイクアウトでもらえますか。(可以打包咖啡吗?) マグカップで、飲み物をもらえますか。(可以自带杯子吗?) マグカップ&#x…

红蓝宝书1000题 新日本语能力考试N1文字.词汇.文法 练习+详解

红蓝宝书1000题 新日本语能力考试N1文字.词汇.文法 练习详解pdf百度云免费下载 本书是继《新版中日交流标准日本语》初、中级后,由人民教育出版社与日本光村图书出版株式会社通力合作、精心编写的一套日语自学读本。 本书由知名的日本语学、汉学以及日语教育界的学者执笔,充分…

apple watch可以使用第三方表盘了,Apple Watch 更换第三方表盘需求

apple watch可以使用第三方表盘了,Apple Watch 更换第三方表盘需求 对于 Apple Watch 用户来说,表盘的选择太少而且过于单调。那么,自带的表盘看腻了如何更换第三方表盘呢? 前几代apple watch无法使用新表盘,想要实现更…

Applewatch6/ Applese价格曝光 苹果最新款手表参数区别对比

价格方面,Apple Watch Series 6GPS 版 3199 元起售,蜂窝网络版 3999 元起售。Apple Watch SE GPS 版 2199 元起售,蜂窝网络版 2499 元起售。 Apple Watch Series 6 新品活动 优惠空前机会不容错过 https://www.apple.com.cn/6 Apple Watch Se…

苹果手表计算机功能键,Apple Watch上的2个按键是这么玩的

原标题:Apple Watch上的2个按键是这么玩的 点评:苹果不说,但是你要知道的用法。 Apple Watch是苹果全新的产品,代表了苹果全新的设计理念,如此一来,操作和交互方式就与手机自然也有所不同。结果有的小伙伴把…

如何设置并将你的iWatch和iPhone配对

如何设置并将你的iWatch和iPhone配对 一旦你买到一个iWatch,拿回家并拆封,下面教你如何设置。 iWatch是这样一个装置,它被设计出来和你的iPhone一起使用。它可以说是一个iPhone配件,它们的关系非常亲密。这也是为什么设置iWatch感…

Apple Watch发售在即 苹果门店大变脸

本周五,苹果公司将正式发售人气如虹的智能手表Apple Watch,有意购买者将有机会尝试不同尺寸、表带款式和设定,并在4月24日正式铺货前先行预订。 苹果零售业务主管安吉拉阿伦茨(Angela Ahrendts)一直在和首席设计师乔尼…

android+wear+和iphone,Android Wear手表兼容iPhone:和苹果抢用户

原标题:Android Wear手表兼容iPhone:和苹果抢用户 北京时间9月1日早间消息,不愿使用Apple Watch智能手表的用户现在有了新选择:Android Wear设备。 Android Wear首席产品经理杰夫常(Jeff Chang)表示,Android Wear将通过…

如何更改Apple Watch 上的表盘?

我们在使用Apple Watch的时候,您可以为表盘选取不同的设计、调整颜色,以及添加复杂功能。您甚至可以将时间提前。那我们该如何操作呢?需要的朋友快和小编一起来看看吧! 如何在 Apple Watch 上切换表盘 1.在表盘上,从…

Apple Watch使用指南:所有Apple Watch图标和符号含义

Apple Watch是iPhone的缩影,具有“ n”个功能,苹果为它们制定了各种不同的图标和符号。这篇文章详细总结了所有Apple Watch图标和符号含义,还不了解的朋友快来学习一下吧! 雷电的力量 1、绿色闪电 我们大多数人都知道这个常见标…

watch的使用方法

1、 通过 watch 监听 data/computed 数据的变化。 2、通过 watch 监听 obj 数据的变化。(深度监听 deep) 因为修改是修改的对象里某个属性的值,监听不到user对象,所以要深度监听 网页打开 handler就执行一次 3.通过 watch 监听 data 数据的…

杰理-手表-AC701-watch-添加表盘

添加表盘 1.复制一个表盘,更改名称表盘6 2.修改表盘6路径下的copy_file.bat 3.修改表盘预览图资源名字 4.表盘文件夹重新命名 5.批处理添加表盘的资源打包处理,注意表盘资源的名字 6.添加背景图片,时分秒 保存编译 7.在模式界面…

苹果设计可变色Apple Watch表带,智能穿戴玩法多

苹果最新技术专利显示,苹果正在为 Apple Watch 设计一款可变色的表带,可以根据佩戴者所穿着的服装、所在的环境等自动改变颜色。据介绍,这款表带里的灯丝具有电致变色功能,可以通过施加不同的电压,来实现显示多种颜色或…

科研在线实用工具

————————————————————————————————————————— SCI文献查找: Sci-Hub: 将知识带给每个人Sci-Hub网站。免费获取学术期刊。免费下载来自ScienceDirect、IEEE、Wiley、Springer、Nature及其他的研究论文。https://sci-hub.s…

人工智能前沿——深度学习热门领域(确定选题及研究方向)

近年来,人工智能发展迅猛,其主要动力来自深度学习。深度学习的炙手可热源自于它对人工智能技术发展的整体促进和在广泛应用场景中的巨大应用价值。毫无疑问,深度学习仍旧是当今时代人工智能前沿技术的核心。 目录 一、计算机视觉(…

Sci-Hub和 Alexandra 的基本信息

作者: Alexandra 翻译:科大云炬 I decided to make a quick summary of facts about Sci-Hub and myself, because in our times you cannot fully trust articles published in media, Wikipedia pages. Well, they do present facts about Sci-Hub th…