【综述阅读】A Comprehensive Survey on Pretrained Foundation Models: A History from BERT to ChatGPT

论文链接:https://arxiv.org/abs/2302.09419

该综述系统性的回顾了预训练基础模型(PFMs)在文本、图像、图和其他数据模态领域的近期前沿研究,以及当前、未来所面临的挑战与机遇。具体来说,作者首先回顾了自然语言处理、计算机视觉和图学习的基本组成部分和现有的预训练方案。然后,讨论了为其他数据模态设计的先进PFMs,并介绍了考虑数据质量和数量的统一PFMs。此外,作者还讨论了PFM基本原理的相关研究,包括模型的效率和压缩、安全性和隐私性。最后,列出了关键结论,未来的研究方向,挑战和开放的问题。

写在前面的话

笔者主要从事NLP相关方向,因此在阅读该综述时,重点归纳整理了NLP部分的内容,对于CV和GL的PFMs应用仅以了解为主,如有需要再查漏补缺。

目录

      • 写在前面的话
      • 1 Introduction
      • 2 Basic Component
        • 2.1 Transformer for PFMs
        • 2.2 Learning Mechanisms for PFMs
        • 2.3 Pretraining Tasks for PFMs
          • Pretraining Tasks for NLP
          • Pretraining Tasks for CV
          • Pretraining Tasks for GL
      • 3 PFMs for Natural Language Processing
        • 3.1 Word Representations Methods
        • 3.2 Model Architecture Designing Methods
        • 3.3 Masking Designing Methods
        • 3.4 Boosting Methods
        • 3.5 Instruction-Aligning Methods
      • 4 PFMs for Computer Vision
        • 4.1 Learning by Specific Pretext Task
        • 4.2 Learning by Frame Order
        • 4.3 Learning by Generation
        • 4.4 Learning by Reconstruction
        • 4.5 Learning by Memory Bank
        • 4.6 Learning by Sharing
        • 4.7 Learning by Clustering
        • 读后感
      • 5 PFMs for Graph Learning
        • 5.1 Learning by Graph Information Completion
        • 5.2 Learning by Graph Consistency Analysis
        • 5.3 Learning by Graph Property Prediction
        • 5.4 Learning by Masked Autoencoder
      • 6 PFMs for Other Data Modality
        • 6.1 PFMs for Speech
        • 6.2 PFMs for Video
        • 6.3 PFMs for Multimodal
        • 6.4 SOTA Unified PFMs
      • 7 Other Advanced Topics on PFMs
        • 7.1 Model Efficiency
        • 7.2 Model Compression
        • 7.3 Security and Privacy
      • 8 Future Research Challenges and Open Problems

1 Introduction

PFMs是通过大量的数据训练出一个通用模型,在使用时仅需微调就能应用于不同的下游任务。下图是PFMs的发展历程:
在这里插入图片描述

2 Basic Component

PFMs模型的一般架构如下图:
在这里插入图片描述PFMs的具体设计根据不同领域的数据形态和任务要求而有所不同。Transformer是PFMs在NLP和CV等许多领域的主流模型架构设计。训练大型模型需要有各种数据集进行模型预训练。在训练PFMs之后,需要对模型进行微调,以满足如效率和隐私等下游需求。

2.1 Transformer for PFMs

Transformer模型的原理大家应该都比较熟悉了。Transformer因能捕获输入序列数据中的长期依赖,且可扩展性强,能实现高度并行化而被广泛应用于PFMs。如NLP中的GPT-3、CV中的ViT和GL(图学习)中的GTN模型。

2.2 Learning Mechanisms for PFMs

  • 有监督学习
    用带标签的数据训练
  • 半监督学习
    数据集中既有带标签的样本,又有无标签的样本。需要根据有标签的样本设计辅助任务(如无监督和自监督),以生成无标签数据的伪标签。
  • 弱监督学习
    比如不完全监督、不确切监督和不精确监督。
  • 自监督学习
    比如对比学习,其主要思想是借助数据增强等各种方法来学习数据本身的先验知识分布。
  • 强化学习

2.3 Pretraining Tasks for PFMs

在预训练和微调的方案中,模型的参数是在预先设定的任务上训练的,以捕捉特定的属性、结构等信息。 预训练的特征可以帮助下游任务,提供足够的信息,并加速模型的收敛。

Pretraining Tasks for NLP
  • Mask Language Modeling (MLM)
    在输入序列中随机抹去一些词,然后在预训练中预测这些被抹去的词。在预训练中预测这些被删除的词。如BERT和SpanBERT。
  • Denoising AutoEncoder (DAE)
    向原始语料库添加噪声,并使用含有噪声的语料库重建原始输入。如BART
  • Replaced Token Detection (RTD)
    一项判别任务,确定LM是否已经替换了当前token。如ELECTRA
  • Next Sentence Prediction (NSP)
    该任务是为了使模型理解两个句子之间的相关性并捕捉句子层面的表征。从一个文档里面选取连续的两个句子作为正样本,从不同的文档选择两个句子作为负样本,判断两个句子是否连续。如BERT
  • Sentence Order Prediction (SOP)
    NSP任务的改进版,判断输入的两个句子是否调换了顺序,让模型更好的学习句子之间的关联性。如ALBERT
Pretraining Tasks for CV
  • Specific Pretext Task 特定的代理任务
    设计对目标任务有帮助的辅助任务,通常是自监督的。
  • Frame Order Learning Task
    视频帧序列验证,用于获得视觉的时间表征。
  • Data Generation Task
    利用生成对抗网络学习特征,如BiGANs
  • Data Reconstruction Task
    将image分割成多个patch,mask某些patch让模型预测。(CV这块没有具体了解过,可能就像MAE那样?)
Pretraining Tasks for GL
  • Graph Information Completion
    和MLM任务思想差不多,都是先mask再预测mask的部分
  • Graph Property Prediction
    挖掘输入图的潜在属性,以提供自监督信号。比如考虑节点属性、局部子结构和连通性信息,进行预测回归任务;或者通过聚类、结构密度、属性相似度等信息为节点分配伪标签,进行分类任务。
  • Graph Consistency Analysis
    其目标是最大化语义信息相似的样本在图嵌入中的一致性,最小化语义信息不相关的样本之间的一致性。

3 PFMs for Natural Language Processing

近年用于文本领域的PFMs汇总:
在这里插入图片描述

3.1 Word Representations Methods

  • Autoregressive Language Model 自回归语言模型
    自回归LM根据前面的词预测下一个可能的词。在特征提取时,仅基于前面的单词得到文本表征。该类模型在文本生成任务中表现较好。在这里插入图片描述
    代表自回归LM模型如GPT家族。
  • Contextual Language Model 上下文语言模型(也叫自编码语言模型)
    上下文LM是基于上下文词汇的,能真正利用到双向的语义信息,比如以transformer encoder为框架的BERT还有Roberta
    在这里插入图片描述
  • Permuted Language Model 排列语言模型
    自编码LM的明显缺陷是预训练阶段和微调阶段的不一致,导致在NLG任务上的表现不佳。LM旨在结合自回归LM和自编码器LM的优点,该模型在很大程度上改善了两种模型的缺陷,可作为未来预训练目标任务构建的基本思路。
    在这里插入图片描述
    这里,Z_N表示输入序列T的所有可能排列, zT =t and zT <t 分别表示第t个元素和从[1, 2, . . . ,t − 1]的元素的某一个排列 z ∈ ZN。
    排序语言模型的代表有XLNET、MPNet。

3.2 Model Architecture Designing Methods

ELMO:主体采用双向的LSTM,相比于词向量方法,ELMO引入了上下文信息,改善了一词多义问题,但ELMO提取语言特征的整体能力较弱。
BERT:基于fine-tuning的PFMs典型代表。BERT使用Transformer的双向encoder来预测哪些token被mask,并确定两个句子是否上下文相关。然而,对文档进行双向编码和独立预测缺失token,降低了模型的生成能力
GPT:基于zero/few-shot prompts的PFMs的典型代表。GPT使用自回归解码器作为特征提取器,根据前几个单词预测下一个单词,并使用微调解决下游任务,因此它更适合文本生成任务。然而,GPT仅利用前一个词进行预测,无法学习双向交互信息。
BART:使用encoder-decoder结构构成的降噪自编码器,预训练主要包括使用噪声破坏文本和使用seq2seq模型重建原始文本。具体见我的blog
在这里插入图片描述

3.3 Masking Designing Methods

在这里插入图片描述
SpanBERT:基于RoBERTA提出的预训练模型,采用动态mask和single segment pretraining。其结构如图4所示,SpanBERT提出了Span mask和Span Boundary Objective(SBO)策略去mask一定长度的单词。SBO的目标是通过mask的span的两端来重构被mask的span;训练阶段使用RoBERTa提出的动态掩码策略,而不是在数据预处理的时候进行掩码。与BERT不同的是,SpanBERT随机地掩盖了连续文本并添加了SBO训练目标。它使用最接近span边界的tokens来预测跨度,并取消了NSP预训练任务。
MASS:对句子随机屏蔽一个长度为k的连续片段,然后通过编码器-注意力-解码器模型预测生成该片段。
UniLM:输入两句。第一句采用BiLM的编码方式,第二句采用单向LM的方式。同时训练encoder(BiLM)decoder(Uni-LM)。处理输入时同样也是随机mask掉一些token。

3.4 Boosting Methods

  • Boosting on Model Performance
    大多数预训练模型都需要大量的预训练数据,这对硬件提出了巨大的要求,使得重新训练具有挑战性,只能对模型进行微调。因此需要对模型进行压缩,如ERNIE Tiny、ALBERT
  • Boosting for Multi-task Learning
    ERNIE:使用transformer encoder为骨架,提出了Knowledge Intergration策略,将mask分为Basic-level Masking、Entity-level Masking、Phrase-Level Masking三个部分,并增加了对话数据任务(DLM)来增强模型的语义表达能力。
    ERNIE2.0:引入多任务学习让模型有更好的词法、语法、语义的表征能力。ERNIE 2.0使用7个不同的预训练任务,涵盖单词级别、句子级别和语义级别三个方面。设计了连续多任务学习(Sequential Multi-task Learning)策略,利用持续学习,使前一次训练任务中的知识得以保留,使模型获得长距离记忆。它使用Transformer编码器并引入任务嵌入,使模型能够在持续学习过程中区分不同的任务。
    UniLM:上文说过了,此处略。
  • Boosting for Different Downstream Tasks
    比如Bert-WWM啥的
  • Boosting Examples: ChatGPT and Bard
    在这里插入图片描述
    ChatGPT是基于GPT-3.5微调得到的新版本模型,能够借助人类反馈的强化学习(RLHF)技术来指导模型训练。与InstructGPT相比,ChatGPT使用了不同的数据收集设置。首先,收集一个包含prompt和所需输出行为的大型数据集。该数据集用于监督学习对GPT-3.5进行微调。其次,给定微调后的模型和prompt,模型将生成一批候选文本,labeler根据生成数据的质量对这些生成内容进行排序,以组成用于训练奖励模型的数据集。最后,使用近端策略优化(PPO)RL算法对ChatGPT进行奖励模型优化。

3.5 Instruction-Aligning Methods

指示对齐方法的目的是让LM遵循人类的意图并产生有意义的输出。大致思路就是以有监督的方式得到高质量语料,去微调预训练LM。如:Supervised Fine-Tuning (SFT) 、Reinforcement Learning from Feedback、Chain-of-Thoughts (CoT)

4 PFMs for Computer Vision

在这里插入图片描述
在CV领域基本采用自监督学习(SSL)的方式来训练,如上图所示。CV中的预训练任务被称为代理任务(pretext task),代理任务的数据标签是根据数据的特定属性自动生成的,例如来自同一来源的图像块被标记为“正”,来自不同来源的图像块被标记为“负”。然后,通过监督学习方法训练编码器网络以解决代理任务;由于浅层提取边缘、角度和纹理等细粒度细节,而较深的层捕获与任务相关的高层特征,如语义信息或图像内容,在代理任务中学习到的编码器可以迁移到下游的监督任务。在此阶段,骨干网络的参数是固定的,只需要学习一个简单的分类器,如两层多层感知器(MLP)。下游任务的训练过程通常被称为微调。总之,在SSL预训练阶段学习到的表示可以在其他下游任务上重用,并取得不错结果。
近年用于CV领域的PFMs汇总
在这里插入图片描述

4.1 Learning by Specific Pretext Task

五花八门的pretext task设计,综述里写的比较琐碎,因此找了一些参考资料了解。
在这里插入图片描述

4.2 Learning by Frame Order

序列数据(如视频)的学习总是涉及到时间步的帧处理,因此可以设置能够学习视觉时间表示的代理任务。如Contrastive Predictive Coding (CPC)模型。
在这里插入图片描述
CPC模型的原理介绍

4.3 Learning by Generation

在这里插入图片描述
为GAN添加feature encoder以提升生成图像的质量。如BigBiGAN

4.4 Learning by Reconstruction

如ViT(视觉的Transformer)、BEiT(视觉的Bert)、MAE等等

4.5 Learning by Memory Bank

  • Memory Bank
    顾名思义,在开始训练之前,先将所有图片的表示计算好储存起来,叫做memory bank。Bank中的表示将作为负例的表示参与构建对比损失,每次迭代更新参数后,当前batch中样例对应的memory bank中的表示将会用更新后的参数更新,以这样的方式慢慢更新memory bank中的样例表示。这种方式就不需要对大量负样例做前馈和反向传播运算,大大降低了运算量。
    在这里插入图片描述
  • Non-Parametric Instance Discrimination (NPID)
    如上图,使用骨干 CNN 将每个图像编码为 128 维空间并进行 L2 归一化的特征向量。通过实例级判别器学习最佳特征嵌入,该判别器尝试将训练样本的特征最大程度地散布在 128 维的单位球上。
  • Pretext Invariant Representation Learning (PIRL),是一种不根据不同pretext task 中的图像变换而改变的语义表征自监督学习方法,该方法学到的图像表征具有invariance 特性,且语义质量更高。

4.6 Learning by Sharing

在这里插入图片描述
SSL倾向于使用两个编码器网络来进行不同的数据增强,然后通过最大化负对之间的距离或最小化正对之间的距离来预训练参数。从编码器共享参数的角度,可将SSL分为软共享和硬共享两类。
Soft Sharing. 软共享的两个编码器共享相似但不相同的参数,即fθ != f’ξ 。
如MoCo、BYOL、PCL
在这里插入图片描述
Hard Sharing. 硬共享的两个编码器具有相同的结构和参数,即fθ = f’ξ
如SimCLR、SwAV、SEER等

4.7 Learning by Clustering

将表征聚类到不同的簇中,并将这些簇标记为监督信号(伪标签),以预训练骨干网络的参数。如DeepCluster、SwAV、PCL
在这里插入图片描述

读后感

CV方向的PFMs之前都没太了解过,读完这个部分后,感觉几个核心关键词就是自监督学习、对比学习、正负样本对的构造这样的,其他的就是一些细节和针对特定下游任务的改进,很多模型的思想与NLP中的PFMs相似,如ViT、SimCLR等等。以后如果工作中碰到相关问题再去调研和学习一番吧。

5 PFMs for Graph Learning

近年来的研究开始关注图自身属性、拓扑结构、社区等内在信息,以增强节点自身所承载特征的有效性。
近期用于图学习的PFMs如下表所示:
在这里插入图片描述

5.1 Learning by Graph Information Completion

基于图信息补全的预训练(GIC)的本质动机是对输入图数据的部分信息进行掩码,并基于未掩码的图数据恢复掩码信息,从而对图嵌入进行预训练。
在这里插入图片描述
如GraphCompetion, AttributeMask,EdgeMask, PFM都用的SSL训练。

5.2 Learning by Graph Consistency Analysis

图的一致性分析(GCA)主要探索图中两个元素分布的一致性。具体来说,两个语义相似的元素的一致性应该显著强于两个语义不相关的元素,该特性可以用于图模型的预训练。对于一致性评估可分为以下三个方面:

  • Context Consistency
    基于早期的同质性假设,大量图模型倾向于将上下文中的节点映射到语义空间的相似位置。这种上下文在图中的一致性也被应用到预训练图模型中,它试图通过捕捉上下文中节点的分布特征来调整节点表示,如下图所示。

随机游走是获取图中节点的局部上下文信息的典型方法,通过设计多种游走策略,能捕捉上下文中不同方面的分布特征。因此也被应用于DeepWalk和node2vec中。
近期的方法如LINE直接考虑节点的k阶邻居分布(正例)和非相邻节点(负例)之间的关系,并以此来训练图模型;VGAE将输入图的邻接矩阵和节点的特征矩阵喂入编码器(图卷积网络)学习节点低维向量表示的均值和方差,然后用解码器(链路预测)生成图。

  • Self Consistency
    基于对原始图数据和增广图数据的互信息估计来维护数据本身的一致性,将来自同一原始样本的两个增广样本视为正样本对,来自不同原始样本的两个增广样本视为负样本对。比如针对节点级别任务的GCC和GCA,针对图级别任务的GraphCL。
  • Cross Scale Consistency
    不同尺度图数据中的对比元素也可以用于训练图模型,如节点-子图。大多数这类方法是基于最大化互信息的思想。具体而言,通常用readout函数获取图/子图的摘要,并使用Jensen-Shannon MI estimator 来估算互信息。如DGI,CMVRL和SUBG-CON。

5.3 Learning by Graph Property Prediction

将图的属性和结构信息作为信息补全的目标,学习图数据中的辅助属性来生成自监督信号,并将图属性预测任务作为图模型的预训练任务。根据代理任务的不同设置,可以大致分为属性回归和属性分类两类。

  • Property Regression (PR)
    属性回归主要是挖掘图中更广泛的数值结构与属性之间的关系。该方法在图数据中提取了更丰富的自监督信号,用于预训练图模型。如NodeProperty,其预训练任务是预测图中每个节点的辅助属性,如度、局部节点重要性、局部聚类系数等。
  • Property Classification (PC)
    属性分类任务通常会根据图数据中的某种分布(如结构密度、节点属性相似性、局部和全局分布差异等)生成伪标签,是一种典型的自监督方法。如M3S

5.4 Learning by Masked Autoencoder

如MAGE, GMAE, MaskGAE, HGMAE等等。

6 PFMs for Other Data Modality

这块就简单过一下了…

6.1 PFMs for Speech

Wav2vec, vq-wav2vec, SpeechBERT, SPLAT

6.2 PFMs for Video

O3N, IIC, TCP, SeCO

6.3 PFMs for Multimodal

文本和图像之间的多模态PFM可以分为单流模型和跨流模型两类。单流模型是指在模型一开始就整合文本信息和视觉信息;跨流模型是指分别由两个独立的编码模块编码的文本信息和视觉信息,然后利用互注意力机制融合不同模态信息。

  • Single-Stream Model
    VisualBERT:在结构上采用了堆叠的 Transformer,在一开始就将文字和图片信息通过 Transformer 的自注意力机制进行对齐融合。文字部分的输入为原始的 BERT文字输入(词向量+位置编码+片段编码)加上 Token/Image 编码来表示其是图片或文字,而图片部分的输入则是采用通过 Faster-RCNN 提取的图片区域特征加上相应的位置编码,片段编码和 Token/Image 编码。
    类似的还有Unicoder-VL,VL-BERT
  • Cross-Stream Model
    ViLBERT:在一开始并未直接对语言信息和图片信息进行融合,而是先各自经过 Transformer 的编码器进行编码。分流设计是基于这样一个假设,语言的理解本身比图像复杂,而且图像的输入本身就是经过 Faster-RCNN 提取的较高层次的特征,因此两者所需要的编码深度应该是不一样的。
    当两种模态各自进行编码后,其输出会经过一个共注意力机制模块。该模块也是基于 Transformer 的结构,只是在自注意力机制中每个模块都用自己的 Query 去和另一模块的 Value 和 Key 计算注意力,由此来融合不同模块间的信息。
    其他的跨流模型如DALL-E和DALL-E 2

6.4 SOTA Unified PFMs

多模态任务下的预训练模型。

  • Single transformer model
    如UNITER、Uni-Perceiver、Gato、OFA、UNIFIED-IO、BEiT-3
  • Multi-transformer Model
    FLAVA
  • Comb-transformer Model
    UNIMO

7 Other Advanced Topics on PFMs

从模型效率(model efficiency)和模型压缩(model compression)两方面,去化简模型参数和结构,在不影响任务完成度的情况下,降低预训练模型对内存和计算资源的消耗,提高计算效率。

7.1 Model Efficiency

比如ELECTRA,设置了Replaced Token Detection(RTD)任务让判别器预哪个token被替换过。这样ELECTRA就能训练到全部输入的token。

7.2 Model Compression

  • Parameter Compression
    包括参数剪枝、参数量化(如Q8BERT)、低秩分解、参数共享(如ALBERT)
  • Structure Compression
    包括网络压缩和知识蒸馏(如DistilBERT)

7.3 Security and Privacy

8 Future Research Challenges and Open Problems

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13514.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大型语言模型的推理演算

作者&#xff5c;kipply 翻译&#xff5c;杨婷、徐佳渝、贾川‍‍ 本文详细阐述了大型语言模型推理性能的几个基本原理&#xff0c;不含任何实验数据或复杂的数学公式&#xff0c;旨在加深读者对相关原理的理解。此外&#xff0c;作者还提出了一种极其简单的推理时延模型&#…

chatgpt赋能python:Python中颜色的使用及其SEO影响

Python中颜色的使用及其SEO影响 在Python编程中&#xff0c;使用颜色是一种常见而又实用的技巧。通过给代码添加颜色&#xff0c;可以让代码更加的清晰易懂&#xff0c;从而提高编写代码的效率和质量。但是&#xff0c;对于SEO优化来说&#xff0c;我们也需要关注颜色的使用是…

CV多模态和AIGC的原理解析:从CLIP、BLIP到Stable Diffusion、Midjourney

前言 终于开写本CV多模态系列的核心主题&#xff1a;stable diffusion相关的了&#xff0c;为何执着于想写这个stable diffusion呢&#xff0c;源于三点 去年stable diffusion和midjourney很火的时候&#xff0c;就想写&#xff0c;因为经常被刷屏&#xff0c;但那会时间错不…

chatgpt赋能Python-python_print彩色

Python print彩色&#xff1a;让你的输出更加生动活泼&#xff01; Python print是我们在学习和使用Python语言的过程中经常使用的一个功能。它可以帮助我们在程序运行时输出信息&#xff0c;方便我们了解程序的执行情况。但是&#xff0c;有时候我们需要更好的视觉提示&#…

详谈大模型训练和推理优化技术

详谈大模型训练和推理优化技术 作者&#xff1a;王嘉宁&#xff0c;转载请注明出处&#xff1a;https://wjn1996.blog.csdn.net/article/details/130764843 ChatGPT于2022年12月初发布&#xff0c;震惊轰动了全世界&#xff0c;发布后的这段时间里&#xff0c;一系列国内外的…

ChatGPT插件全宇宙爆炸级开放!无需排队,本周可用,GPT-4突然「紫」了

OpenAI 和谷歌&#xff0c;已经打得急红了眼&#xff0c;ChatGPT Plus 用户&#xff0c;本周就可以体验联网和插件功能&#xff0c;无需再排队。鲨疯了&#xff0c;真的鲨疯了&#xff01; ChatGPT&#xff0c;本周开始联网&#xff0c;并开放插件功能&#xff01; OpenAI Ch…

用GPT写的CSDN付费专栏被订阅——感谢ChatGPT带来的第一桶金

从大一就开始写CSDN&#xff0c;但是一直没有开付费专栏&#xff0c;直到两天前把用GPTchat写的一篇文章发到CSDN付费专栏&#xff0c;第三天就被订阅了。 这下得注意点文章质量了。。。 一个用户也是用户哈哈~~~ 这哥们既然放心订阅我高低得给你更新出来讲明白了&#xff01; …

为什么我选择订阅ChatGPT Plus计划?

自从ChatGPT诞生以来&#xff0c;它的强大功能和表现一直备受好评。作为一个长期使用者&#xff0c;我一直对其性能和智能感到惊叹。最近&#xff0c;我决定升级我的用户体验&#xff0c;订阅了ChatGPT Plus计划。在这篇博客中&#xff0c;我将向您详细介绍ChatGPT Plus的优势和…

5月有哪些值得传播人关注的企业新闻稿?

传播人如何紧跟时事&#xff1f; 向世界传递品牌故事的美通社&#xff0c;就是你的好途径。记得每天都来美通社官网逛一逛&#xff0c;这里总能发现你感兴趣的企业新闻。 美通社官网&#xff1a;www.prnaisa.com您还可按照行业、区域、上市公司等类别快速阅读兴趣新闻 比如这个…

保姆级教程:5分钟, AI 你自己

ChatGPT狂飙160天&#xff0c;世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 今天周末&#xff0c;新开一个系列&#xff0c;《从入门到精通 多媒体篇》 第一课 来点轻松的&#xff0c;AI 你自己 教你在短短…

脉脉风格网名自动生成器

今天突然需要自己起一个网名&#xff0c;而且要准备随时跑路的那种&#xff0c;不能带有明显的个人信息&#xff0c;因为自己在脉脉上的社区身份是平台自动生成的&#xff0c;我很喜欢&#xff0c;于是花了几分钟弄了一个脉脉风格的网名生成器。 网名格式 名词 “在” 地点 …

GPT-4国内有免费平替吗?

免费/平替永远是最贵的 就如同我们生活中买口红一样&#xff0c;总想找到平替&#xff0c;但永远比不上看中的那只&#xff01; 但在寻找平替过程中 花出去的时间、金钱成本都是翻倍的。 那么GPT-4呢&#xff1f; GPT-4优于GPT-3.5闪光点&#xff0c;想必大家都十分清楚 不…

学习笔记 | 基于大模型的优质 Prompt 开发课

文章目录 一、前言二、主要内容三、总结 &#x1f349; CSDN 叶庭云&#xff1a;https://yetingyun.blog.csdn.net/ 一、前言 手把手带你构建高质量 Prompt&#xff0c;掌握以文心一言为代表的大模型对话技巧与高级用法&#xff0c;与大模型高效交流从而释放大模型强大的生成能…

chatgpt赋能python:Python颜色检测:探索现代计算机视觉技术的基础

Python颜色检测&#xff1a;探索现代计算机视觉技术的基础 计算机视觉作为一门新兴的学科&#xff0c;正越来越受到人们的关注。在计算机视觉的众多应用中&#xff0c;颜色检测是一个非常重要的方面。Python作为一种高级编程语言&#xff0c;有很多强大的库可以用于颜色检测。…

玩小红书不会写文案?推荐文案生成法宝!

小红书越来越流行了&#xff0c;很多商家和个人都在上面搞运营推广~想要在这个平台众多的内容和用户中脱颖而出&#xff0c;就需要付出很多的时间和精力。你想知道如何快速写出爆款文案&#xff0c;吸引更多的用户浏览、点赞以及关注吗&#xff1f; 介绍一个好用而且很简单的方…

520 | ChatGPT会是一个完美情人吗?

A GENERATIVE AI EXPERIMENT 机器人能感受到爱吗&#xff1f;这个困扰了科学家们多年的未解之谜&#xff0c;如今随着ChatGPT的爆火再次回到人们的视线中。虽然我们尚未准备好为机器赋予情感&#xff0c;但机器已经可以借助生成式AI来帮助人类表达自己的情感。 自然情感表达 …

梁宁:为什么中国没有像 ChatGPT 和 Vision Pro 这样的创新产品?

6 月 10 日&#xff0c;产品战略专家梁宁和图灵联合创始人刘江围绕“ ChatGPT 真需求”主题进行直播对谈。 梁宁&#xff0c;产品战略专家&#xff0c;曾任湖畔大学产品模块学术主任&#xff0c;联想、腾讯高管&#xff0c;CNET集团副总裁。 工作经历横跨 BAT&#xff0c;与美团…

九龙证券|科技股竟成避风港!3月份恒生科技指数领跑全球

3月份欧美多家银行迅速关闭&#xff0c;引发了全球金融安稳性问题&#xff0c;却意外带来了全球科技股的狂欢。 据Wind数据统计&#xff0c;3月份&#xff0c;恒生科技指数再次成为全球金融商场的领先目标&#xff0c;涨幅到达9.65%&#xff0c;A股科创板50指数3月大涨9.19%&a…

夸张!昆仑万维「天工」尚未开悟,却陡增了300亿市值

4月17日下午&#xff0c;昆仑万维CEO方汉发布了公司的大语言模型——天工3.5。 这是国内继“文心一言”&#xff0c;“360智脑”等为数不多已进行内测的中文大语言模型。发布会现场&#xff0c;天工大模型分别展示了写周报、写招聘岗位、写代码&#xff0c;以及回答网友奇怪提问…

百度将凭借人工智能改变游戏规则并实现盈利?

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 稳健的财务业绩 在2022年第四季度&#xff0c;百度&#xff08;BIDU&#xff09;的收入为48亿美元(331亿人民币)&#xff0c;比分析师预测的高出了1.72亿美元&#xff0c;但同比下降了约8%。从细分业务来看&#xff0c;百度…