AIGC高频产品面试题（二）

什么叫大模型，人工智能大模型是什么？

之前，人工智能大多针对特定的场景应用进行训练，生成的模型难以迁移到其他场景，属于“小模型”的范畴。整个训练过程中，不仅手工调参工作量大，还需要给机器“投喂”海量的标注数据，这拉低了人工智能的研发效率，且成本较高。
大模型通常是在无标注的大数据集上，采用自监督学习的方法进行训练的。之后，在其他场景的应用中，开发者只需要对模型进行微调，或采用少量数据进行二次训练，就可以满足新应用场景的需要。
特别是OpenAI GPT 3大模型，它在翻译、问答、内容生成等领域的不俗表现，让业界看到了实现通用人工智能的希望。当前ChatGPT是基于GPT-3.5的，在GPT-3的基础之上进行了调优，能力进一步增强。

GPT对AIGC的重要性，它能做什么？

以ChatGPT为首的AIGC大潮的出现，则使得人工智能具备了大众化的基础，应该说，ChatGPT是人工智能大众化的里程碑。
最常用：文本生成、语言翻译、编程辅助
在这里插入图片描述

分析一下ChatGPT可能带来的效率提升

据OpenAI的官方网站，GPT-3.5中gpt-3.5-turbo模型的使用费用是每1000 tokens 0.002美元（token是用于自然语言处理的词的片段。对于英文文本，1个token大约是4个字符或0.75个单词），GPT-4的使用费用为每1000个prompt token（用于文本生成的特定文本片段或单词）0.03美元或每1000个completion token（语言模型基于prompt token生成的完整文本）0.06美元。1000个token大约相当于750个英文单词，CSDN上大批作者测算所得的相关数据如表：
在这里插入图片描述

假设英文译为中文，英文单词数与中文字数之比为1∶1.6，在使用GPT-4的情况下，若输出1500个汉字，收0.06美元，约人民币0.432元，也就是约每千字0.36元。因此1万个汉字提示词的价格为人民币3.6元。以用GPT-4为一个流量很大的自媒体公众号写一篇万字长文为案例展开分析。如上所述，一个提示词工程师（戏称“提示词魔法师”）用GPT-4 completion token输出一万个汉字，可以近似按照3.6元计算。如果在国内请一个经验丰富、熟稔爆红网文的写手，写一篇约一万字的高质量长文，可能要花费至少要一周时间，付出5000元，且对方还可能情有不甘。一个提示词魔法师微调GPT-4，输出万字长文，只需要1小时就能搞定。所以，两者的耗时比是40∶1。再计算价格。按照5000元/周来定时薪，一周的工作时长是40小时，平均每小时即125元，再加上调用token的费用，时薪大致是150元。那么两种工作方式的费用之比是5000∶150=100∶3。假定耗时与价格的乘积与效率成反比，那么GPT-4的效率和人的效率比为4000∶3，前者大约是后者的1333倍，我们称这个值为“AI/人”。
当然，这是理想情况，把很多因素给简化了，但是ChatGPT确实带来了惊人的效率提升。

ChatGPT的外貌和内涵是什么？

从物理上看，ChatGPT是一种基于深度学习算法的计算机程序，它由数以亿计的神经元和参数组成，运行在计算机的中央处理器或图形处理器上。它的输入是一个文本序列，输出则是根据该序列预测的单词或字符，它可以通过这种方式不断生成新的文本。
从代码上看，ChatGPT是一个Python程序，它使用了TensorFlow、PyTorch等深度学习框架，实现了基于Transformer架构的神经网络模型。
ChatGPT基于使用GPT的聊天机器人框架，以Python来实现。要搭建ChatGPT，首先需要安装OpenAI的Transformers库和GPT-3 API的Python客户端。其次，需要创建一个GPT-3模型实例，然后调用它的generate方法来生成文本。
ChatGPT的主要代码实现包括预处理输入数据、定义模型架构、训练模型，以及使用模型进行推理和生成文本等功能。ChatGPT的代码实现非常复杂，包括大量的数学运算和机器学习算法，需要有一定的编程和机器学习经验才能理解和修改它的代码。

跨模态与多模态分别是什么？

跨模态生成(cross-modal generation)和多模态生成(multimodal generation)不同，虽然都涉及处理多种类型的数据（如文本、图像、音频、视频等），但它们的含义和应用场景有所不同。

跨模态生成：通常指的是从一种模态的数据生成另一种模态的数据。例如，给定一段文本描述，生成对应的图像；或者给定一张图像，生成描述这张图像的文本。这种生成过程涉及从一种模态转换到另一种模态，因此被称为“跨模态生成”。
多模态生成：利用多种模态的数据共同生成新的内容。例如，给定一段音频和对应的文本，生成一个同步的动画。在这种情况下，生成过程需要同时考虑多种模态的数据，因此被称为“多模态生成”。
文本和音频生成音乐：给定一段歌词和一段旋律，生成一首歌曲。
文本和音频生成视频：给定一段文本和配套的音频，生成一个视频。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/382075.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！