那些在学习GPT的过程中学到的

1、大模型是什么

GPT横空出世之后,大模型火了,什么是大模型呐?

大模型通常指的是具有大规模参数和复杂结构的深度学习模型。它们的设计和结构可以因任务而异,但以下是一些常见的大模型结构:

  1. Transformer:Transformer 是一种用于处理序列数据的基础模型结构,由 Vaswani 等人在 2017 年提出。它广泛应用于自然语言处理任务,如机器翻译、文本生成和语言理解。Transformer 包括多个编码器和解码器层,每层由多头注意力机制和前馈神经网络组成。
  2. GPT(Generative Pre-trained Transformer):GPT 是一种基于 Transformer 结构的大模型,由 OpenAI 提出。GPT 使用了预训练-微调的方法,在大规模文本语料库上进行预训练,然后在特定任务上进行微调。它在自然语言处理任务中取得了很大的成功,例如问答、摘要和文本生成。
  3. BERT(Bidirectional Encoder Representations from Transformers):BERT 也是基于 Transformer 结构的大模型,由 Google 提出。它在预训练阶段使用了自编码器的方法,使模型能够学习上下文相关的词向量表示。BERT 在诸多自然语言处理任务中取得了重要突破,如命名实体识别、句子分类和语义相似度。
  4. CNN(Convolutional Neural Network):卷积神经网络在计算机视觉领域得到广泛应用。大规模的 CNN 模型,如 VGGNet、ResNet 和 InceptionNet,具有多个卷积层和池化层,能够有效地提取图像特征。这些模型经常在图像分类、目标检测和图像生成等任务中表现出色。

需要注意的是,大模型的结构不仅仅局限于上述提到的模型,还可以根据任务的需求进行定制。此外,大模型通常需要在高性能计算环境中进行训练和推断,因为它们的参数数量庞大,计算资源要求较高。

百度紧跟着发布的文心一言,拓展了图片生成,还记得鱼香肉丝的图片吗?

2、人工智能的方向有哪些

人工智能(Artificial Intelligence,AI)的方向非常广泛,涉及多个领域和应用。以下是一些常见的人工智能方向:

2.1机器学习(Machine Learning,简称ML):

机器学习是人工智能的核心领域之一。它关注如何设计和开发能够从数据中学习和改进的算法和模型。机器学习包括监督学习、无监督学习、半监督学习、强化学习等不同类型的学习方法。

2.2 深度学习(Deep Learning,简称DL)

深度学习是机器学习的一个分支,其基础是人工神经网络(Artificial Neural Networks)。深度学习通过构建具有多个隐层的神经网络,可以自动地从大规模数据中进行特征学习和表示学习,适用于图像识别、自然语言处理等领域。

2.3 计算机视觉(Computer Vision,简称CV):

计算机视觉涉及使用计算机和算法来解析、理解和处理图像和视频。这包括图像分类、目标检测、图像分割、人脸识别、姿态估计等任务。

2.4 自然语言处理(Natural Language Processing,NLP):

自然语言处理是处理和理解人类语言的领域。它包括文本分类、信息抽取、命名实体识别、语义分析、机器翻译等任务。

2.5 语音识别(Speech Recognition):

语音识别涉及将人类语音转化为文本或命令。它在语音助手、语音翻译、语音命令等应用中起着重要作用。

2.6 强化学习(Reinforcement Learning,简称RL):

强化学习关注智能体(agent)在与环境交互的过程中学习最优行为。通过奖励信号和策略优化,强化学习能够在复杂环境中自主学习并做出决策。

除了上述方向,人工智能还涉及知识图谱、推荐系统、智能交互、自动驾驶、机器人技术等众多应用领域。随着技术的不断发展,人工智能领域将继续扩展和演进。

3、一些热门的框架和工具

3.1 chatgpt

https://chat.openai.com/

不用说了,太火了

还有一些国内的大模型,百度文心一言、阿里通义千问到商汤、昆仑万维等推出大模型,到王小川的百川智能、王慧文的光年之外、李志飞的序列猴子等

3.2 midjourney

官网:Midjourney

Midjourney为用户提供了免费的绘画工具以及教授绘画技巧的平台。

用户可以在平台上自由选择品种丰富的工具,掌握各种不同的绘画技巧,快速的进行作品的创造。

同时,用户也可以通过软件学习到各种不同的绘画相关知识内容,与其他好友分享自己的绘画作品。

平台提供简单的步骤来进行操作,并且还提供了智能AI转化工具进行使用,让用户创作更加流畅,完美。

3.3 无界AI

官网:无界AI-人人都是艺术家

中国的图片生成,每天都可以免费生成一些图片

3.4 StableDiffusion

github 地址:GitHub - Stability-AI/stablediffusion: High-Resolution Image Synthesis with Latent Diffusion Models

Stable Diffusion是stability.ai开源的图像生成模型,可以说Stable Diffusion的发布将AI图像生成提高到了全新高度,其效果和影响不亚于Open AI发布ChatGPT。

3.5 DragGAN

github地址:GitHub - Zeqiang-Lai/DragGAN: Online Demo and Implementation of DragGAN - "Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold" (DragGAN 全功能实现,在线Demo,本地部署试用,代码、模型已全部开源,支持Windows, macOS, Linux)

DragGAN 类似于 Photoshop 中的扭曲变形(Warp)工具,但更加强大,因为它不是“挤压像素”,而是“重新生成物体”,甚至可以旋转三维图像。这种工具的潜力在于,从文本生成图像的人工智能并不总是能输出你想要的结果,所以你可以在生成图像之后再进行编辑,而不必重新生成一个新的图像


最后推荐一本AI的科普书籍

 一个 AI 的自白,以第一人称视角,通俗易懂地讲述 AI 的来龙去脉,生动活泼地表达 AI 的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT 的诞生,引发了奇点降临,点亮了 AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。 

 京东自营购买链接:https://item.jd.com/13737387.html#crumb-wrap

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/40945.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LangChain 介绍及相关组件使用总结

一、langChain LangChain 是一个由语言模型LLMs驱动的应用程序框架,它允许用户围绕大型语言模型快速构建应用程序和管道。 可以直接与 OpenAI 的 ChatGPT 模型以及 Hugging Face 集成。通过 langChain 可快速构建聊天机器人、生成式问答(GQA)、本文摘要等应用场景。…

第一代AIGC硬件悄然爆发

文 | 智能相对论 作者 | 叶远风 看起来,这可能是一副正常的黑框眼镜,你戴上去彬彬有礼、斯斯文文; 实际上,它里边还装了一个“小伙伴”,你随时可以与它交流,谈天说地或者提出各种问题接受它的帮助&#x…

chatgpt赋能python:小黑框:Python程序员必备利器

小黑框:Python程序员必备利器 如果您是一名Python程序员,小黑框(Terminal)一定不陌生。小黑框是一种基于文本的用户界面,通常用于执行命令行任务,编写或调试代码等。Python程序员可以通过小黑框完成许多任…

游戏开发中防外挂的那些事儿

对于一个要上线的游戏,防外挂是必须的,历史上因为外挂而造成大量玩家流失的游戏数不胜数。随着游戏研发技术的发展,对外挂的预防业内其实做的已经越来越好了。下面总结一下防外挂的基础知识,以及我们的移动模块为防外挂做了哪些工…

游戏反外挂技术原理讲解

永远在路上 没有破解不了的反外挂系统,反外挂是一个对抗过程,需要不断升级。我们反外挂小组会采取对抗方式提升防御,也会研究竞品来获取灵感。反外挂也是非常有意思的,可以学到很多很多底层知识。 善战者无赫赫之功 反外挂&#x…

各网游的外挂是如何做出来的?

每一个致力于学习黑客技术的人,最后都分为三种人。 第一种:入侵,各种入侵,玩的就是入侵的快感,或者恶作剧的喜感,或者那种有特殊“窥视”癖好的人……别误会,小编我是喜欢“恶作剧,…

干货!什么是游戏外挂,外挂的种类及实现原理

外挂,原指一切用来破坏游戏程序正常游戏数据和逻辑的工具或破解版。比如可以修改游戏内存数据的修改器,又比如可以修改网络数据包的抓包工具。这类外挂或多或少会影响游戏的内存数据、文件数据、网络数据,甚至代码逻辑。 但随着外挂市场的发…

游戏外挂怎么做?

文章目录 1.什么是游戏外挂2.外挂的分类及实现原理2.1 辅助类外挂2.2 专用插件类外挂2.3 通用工具2.4 内存修改器2.5 变速器2.6 按键精灵2.7 模拟器2.8 破解版 转载自:Anti-Cheat Expert 游戏安全专家 干货!什么是游戏外挂,外挂的种类及实现原…

哈夫曼树 例题

假设某棵二叉树有N个叶结点。给定这些叶结点的权值,求所有可能的二叉树中带权路径长度(WPL)的最小值。 注: 结点的带权路径长度(WPL):结点的权值乘以该结点的深度(假设根节点的深度…

svn更新/提交代码提示错误 , 进行清理下“破除写锁操作“

1.如果svn提交或者更新代码有--进行清理下"破除写锁操作"--此提示,一般情况下右键,然后选择进行确定就可以 2.如果还不行的话,在项目下的 .svn 文件夹里面新建文件夹,命名为tmp,然后重新更新,提交,就会发现问题解决了

2022年深圳杯数学建模A题代码思路-- 破除“尖叫效应”与“回声室效应”,走出“信息茧房”

问题重述: 在全新的信息传播格局下,如何破除“尖叫效应”与“回声室效应”,走出“信息茧房”,是当前迫切需要解决的现实问题,即如何从信息传输的顶层设计、推荐算法的公平性和广大网络用户的责任担当等方面&#xff0…

钉钉最新点赞破除限制方法(

我不是标题党! 首先,放图片((( 时间这里是录视频的时间,2021-8-27,不是标题党! 上方法! 主要原理:利用抓包抓到的点赞api端口,实现持续点击或…

亚马逊云科技 Build On -Serverless低代码平台初体验-快速完成vue前端订单小程序

文章目录 一、我所认识的低代码平台二、Serverless的使用场景三、拖拉跩实现build on 的Serverless1. 使用图像界面创作方法2. 拖拉跩模块实现搭建3. 实时测试流程是否正确4. 最终的设计和流程图 四、创建端到端的基于vue的前端图形化界面六、总结与活动链接 一、我所认识的低代…

一小段Python代码,破解加密zip文件的密码

Python 有一个内置模块 zipfile 可以解压 zip 压缩包。先来测试一波:创建一个测试文件,压缩,设置解压密码为123。 import zipfile# 创建文件句柄 file zipfile.ZipFile("测试.zip", r) # 提取压缩文件中的内容,注意密码…

开源治理工具选一个

随着开源技术在云计算、大数据、AI领域的不断运用,不断破除技术壁垒,让企业快速建立自身的应用,在开源软件基础一,自主研发部分代码,便可以推出企业自身品牌的产品,开源技术的应用极大的推动了云计算、大数…

机器人微控制器编程(CoCube)-破除定势

从课程到生活; 从书本到理想; 从程序到生态; 从个体到集群; 从特殊到一般; 从传统到现代; 从技术到科学; 从理论到工程; 从基础到高阶。 …… 课程归根结底,是为学生服务…

复制浏览器html代码吗,网页文字不能直接复制?只需简单几招即可轻松破除限制,想学吗?...

原标题:网页文字不能直接复制?只需简单几招即可轻松破除限制,想学吗? 想必大家在网上都遇到这样的问题,网页文字受到限制无法直接复制,这该如何是好呢? 既不想登录注册又想直接复制走内容&#…

LR低代码快速开发平台 高效调整企业组织架构

组织架构以及围绕组织架构的设计、实施和变革,是企业管理永恒的话题,它上承公司的业务战略和运营模式,下接业务流程和信息系统建设,重要性不言而喻。数字化变革浪潮之下,商业模式的颠覆、价值链的重塑都需要由相匹配的…

自己动手写编译器:通过语法编译构建语法树并实现中间代码生成

上一节我们手动构造了语法树,然后调用各个节点实现中间代码生成。语法树的构建由语法解析完成,本节我们要完成语法解析逻辑,在语法解析过程中构造语法树,然后再像上一节那样实现中间代码生成。 这里我们再次回顾一下左递归&#…

安卓原神QQ机器人搭建教程

1,下载安装Termux 下载地址:https://f-droid.org/packages/com.termux/ 滑到下面点击这个 2,打开Termux,安装Ubuntu 安装模拟权限git,python,执行下面命令 pkg install proot git python -y 3&#xff…