高通面试01_2023.5.16

1. 64QAM与16QAM速率对比

64 = 2^6,6bit信息/符号;

16 = 2^4,4bit信息/符号;

6/4 = 1.5倍数

2. 人工智能热点关注(ChatGPT)

GPT “生成性预先训练转换器”(generative pretrained transformer)

百科:

        ChatGPT是一种由OpenAI训练的大型语言模型。它的原理是基于Transformer架构,通过预训练大量文本数据来学习如何生成人类可读的文本,然后通过接受输入并生成输出来实现对话。

ChatGPT的用途非常广泛,可以用于自然语言处理(NLP)任务,它拥有极强的自然语言处理能力,可以用于各种任务,如文本生成、文本分类、问答系统、语言翻译和对话系统等。

        如果你想使用ChatGPT,你可以用它来构建对话机器人,回答问题,生成文本等。它的应用非常广泛,可以用于各种场景,如客服、帮助提供者、教育机构等。

        1. 对话系统:它可以模拟人类对话,并根据上下文生成自然流畅的回答。

                ChatGPT可以被用来构建智能客服系统,与客户进行对话,回答他们的问题,解决他们

                的问题。同时,ChatGPT也可以被用来构建语音助手,如智能家居设备中的语音控制系

                统,以及手机中的智能助手,如Siri和Alexa。

        2. 自然语言生成:它可以生成各种类型的文本,如新闻报道、文章、电子邮件、广告等。

                可以生成高质量文本,可以帮助程序员生成代码完成开发。  

        3. 文本分类

                ChatGPT可以被用来将文本分类到不同的类别中,如垃圾邮件过滤、情感分析等。这些

                应用可以帮助人们更好地管理信息,提高工作效率。

        4. 问答系统:可以被用来构建问答系统,回答用户的问题,提供相关信息。

                ChatGPT可以被用来回答各种文本问题,如搜索、技术支持、咨询等。ChatGPT也可

                以被用来回答语音问题,从而帮助用户更快地获取信息。

        5. 语言翻译:可以被用来作语言翻译系统

        无监督预训练技术是ChatGPT实现对话生成的关键技术,它可以自动地从大量的无标注数据中学习到语言的规律和特征,从而提高模型的泛化能力和表现力。

Tranformer模型:

        规范化层作用:在一定层数后接规范化层进行数值的规范化,使其特征数值在合理范围内.

3. 解决AI模型的泛化能力

【深度学习/AI中的generalization问题,也就是泛化和正则化】

        机器学习方法训练出来一个模型,希望它不仅仅是对于已知的数据(训练集)性能表现良好,对于未知的数据(测试集)也应该表现良好,也就是具有良好的generalization能力,这就是泛化能力。测试集的误差,也被称为泛化误差

        在机器学习中,泛化能力的好坏,最直观表现出来的就是模型的过拟合(overfitting)与欠拟合(underfitting)。

        减缓过拟合:正则化。正则化,它的目标就是要同时让经验风险和模型复杂度较小正则化的最终目标: 让网络学的不要太死,否则变成僵硬的书呆子。

        一个机器学习系统,学习的是从输入到输出的关系,只要一个模型足够复杂,它是不是可以记住所有的训练集合样本之间的映射,代价就是模型复杂,带来的副作用就是没见过的只是略有不同的样本可能表现地就很差,就像下面这张图,只是更改了一个像素,预测就从Dog变成了Cat。

        正则化方法:

                1.经验正则化:提前终止 / 模型集成

                提前终止:训练曲线随着不断迭代训练误差不断减少,但是泛化误差减少后开始增长。

                                  假如我们在泛化误差指标不再提升后,提前结束训练,也是一种正则化方

                                  法,这大概是最简单的方法了。

                模型集成:模型集成(ensemable),也就是通过训练多个模型来完成该任务,它可以是不

                                  同网络结构,不同的初始化方法,不同的数据集训练的模型,也可以是用不

                                  同的测试图片处理方法,总之,采用多个模型进行投票的策略。

                                Dropout一种重要方法:它在训练过程中,随机的丢弃一部分输入,此时丢弃

                                                                        部分对应的参数不会更新。

                                        因为dropout降低了模型的性能,所以对于原本需要容量为N的网络才能

                                        解决的问题,现在需要N/p,p就是保留该节点的概率,这个概率通常在

                                        0.5~0.9之间,p=1就是普通的网络了。

                                        因为dropout相当于增加了噪声,造成梯度的损失,所以需要使用更大的

                                        学习率和动量项。与此同时,对权重进行max-norm等权重约束方法,使

                                        其不超过某个值。

                2. 参数正则化方法:

        数据增强:归一化batch normalization

                现在一般采用批梯度下降方法对深度学习进行优化,这种方法把数据分为若干组,按组来更新参数,一组中的数据共同决定了本次梯度的方向,下降时减少了随机性。另一方面因为批的样本数与整个数据集相比小了很多,计算量也下降了很多。

        Batch Normalization(简称BN)中的batch就是批量数据,即每一次优化时的样本数目,通常BN网络层用在卷积层后,用于重新调整数据分布。假设神经网络某层一个batch的输入为X=[x1,x2,...,xn],其中xi代表一个样本,n为batch size。

        Batch Normalization归一化优势:

                (1) 减轻了对参数初始化的依赖,这是利于调参的朋友们的。

                (2) 训练更快,可以使用更高的学习率。

                (3) BN一定程度上增加了泛化能力,dropout等技术可以去掉。

两种提高泛化能力的思路:

        第一,在不同的环境中采集多组数据重新模型训练,以此提高模型的泛化能力;第二,不用换环境采集新数据,而是对现有的训练数据合理去噪(或称滤波),用去噪后的强特征数据重新训练模型,以此提高模型的泛化能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23146.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

某平台百万阅读博主,去面试阿里P7,遭面试官狂喷:根本不懂技术,闭关60天,吊打曾经面试官,史上最强

某平台百万阅读博主,去面试阿里P7,遭面试官狂喷:根本不懂技术 一气之下回家硬肝60天,再战阿里又遇到当初面试官!轻松拿下阿里P7后说出实情,竟只是凭借这个文档! 首先声明: 本书覆盖了近3年程序员面试笔试中超过98%Java高频知识点当你细细品读完本书后,各类企业的of…

Hadoop常见面试题

目录 什么是hdfs 原理 包含哪些部分 hdfs 的读取过程 hdfs 的写过程 NN 和 2NN 工作机制 (元数据持久化机制) (一)第一阶段: NameNode 启动 (二)第二阶段: Secondary NameNode 工作 datanode的工作机制 小文件处理方案 yarn 的运行原理 任务提交…

重磅消息!微软将把聊天机器人技术植入Office办公软件

微软(Microsoft)是一家美国跨国科技企业,1975年4月4日创立。2021财年微软营收为1681亿美元, 净利润为613亿美元,公司总部设立在华盛顿州雷德蒙德(Redmond,邻近西雅图),以…

刚刚,谷歌翻车了。。。

大家好,我是微笑。 最近微软出品的 ChatGPT 确实引起很大的关注,这不,谷歌就紧跟发布了谷歌版 ChatGPT - Bard,结果很。。。 源自:机器之心 原文:https://mp.weixin.qq.com/s/1mkAlJbtYCmQcz_mV9cdoA 如今的…

LangChain:基于ChatGPT对话私有数据

一、架构图: 二、思路: 通过embbeding获得文本的语义,通过向量数据库获得近似记录,通过chatGPT得到问答内容将文件拆分并embbeding后存入向量数据库将用户问题embbeding后从向量数据库中找近似的文档数据作为prompt上下文 三、核…

【ChatGPT】万字长文揭秘 GPT 背后:为何“大模型” 就一下子成为了引领人工智能 AI2.0时代热门技术?

GPT (Generative Pre-trained Transformer) ,生成式预训练Transformer: 是一种基于深度学习的自然语言处理模型,GPT 由 OpenAI 开发。 GPT 是一种基于 Transformer 模型的语言模型,可以通过大量的文本数据进行训练,从而学习到语言的规律和模式,进而生成自然流畅的语言文本…

网站接入QQ登录功能的实现

来源 | https://github.com/Dream4ever/Knowledge-Base/issues/76 说明 本文中所说的QQ登录功能,是采用官方的OAuth2.0来实现的,这样有更多的自主权。另一种较为简单的js-SDK开发方式,虽然非常简便,但自主性不够,所以没…

Android QQ 登录接入详细介绍

/ 今日科技快讯 / 近日,百度地图发布2022春节出行大数据。迁徙大数据显示,2022年春运迁徙规模较去年农历同期有明显上升。春节期间全国人口迁徙规模日均值为去年农历同期的近两倍。春节前的迁徙规模峰值出现在1月29日(腊月廿七&#xff0…

工具使用-QQ/TIM(1)QQ/TIM客户端聊天窗口输入/自动变成表情 - 解决方案

问题: 我们在使用QQ/TIM客户端(电脑端)时,输入英文字符/时,会自动变成表情,且无法取消,无法避免。如下图所示: 解决: 打开QQ/TIM客户端,并打开一个聊天窗口。在聊天窗口中点击表情图…

chatgpt赋能python:Python软件图标的SEO

Python软件图标的SEO 介绍 Python是一种高级编程语言,具有易读性、可维护性和可扩展性等优点,因此在许多应用程序中广泛使用。Python软件的图标是这些应用程序中一个非常重要的视觉元素。图标的质量和吸引力可以决定用户下载和使用该应用程序的意愿。因…

漫谈高数

漫谈高数 (一) 泰勒级数的物理意义 高等数学干吗要研究级数问题? 是为了把简单的问题弄复杂来表明自己的高深? No,是为了把各种简单的问题/复杂的问题,他们的求解过程用一种通用的方法来表示。 提一个问题,99*99等于多少? 相信我们不会傻到…

《高等数学A》课堂笔记——高分必过

《高等数学》上下学期的课堂笔记 ——郑州大学 文章目录 一、函数与极限1.1 映射与函数1.2 数列的极限1.3 函数的极限1.4 无穷小与无穷大1.5 极限运算法则1.6 极限存在准则及两个重要极限1.7 无穷小的比较1.8 函数的连续性与间断性问题…

高等数学【合集2】

文章目录 积分计算递推重点补充 积分计算 求导 ⇄ 积分 求导 \rightleftarrows 积分 求导⇄积分 求导积分 ( t ) ′ 1 \large (t)1 (t)′1 ∫ t d t 1 2 t 2 c \large\int tdt\frac{1}{2}t^2c ∫tdt21​t2c ( 1 x ) ′ − 1 x 2 \large(\frac{1}{x})-\frac{1}{x^2} (x1​)…

高等数学【合集】

文章目录 极限计算求导计算积分计算 极限计算 第一步 : 先看 x → v a l u e 确定类型 第一步:先看x \rightarrow value确定类型 第一步:先看x→value确定类型 7 种未定型 : ∞ ∞ , 0 0 , 1 ∞ , 0 ∞ , ∞ 0 , 0 0 , ∞ − ∞ 7种未定型: \frac{\infty}{\infty},\frac{0}{0}…

一、浙江专升本高等数学考点-函数

1.连续函数的性质 考点分析 函数的连续性主要考察函数的奇偶性、有界性、单调性、周期性。 例题 判断函数的奇偶性 的有界区间为() A.(-1,0) B(0,1) C(1,2) D(2,3) 2.闭区间上连续函数的性质 考点分析 闭区间上连续函数的性质主要考察函数的最大最小值…

超过ChatGPT3达到ChatGPT4%90性能的小羊驼来了-Vicuna(校招社招必备,chatgpt风口来了赶紧学起来吧)

达到GPT4百分之90性能的小羊驼Vicuna 文章目录 达到GPT4百分之90性能的小羊驼Vicuna一、小羊驼Vicuna介绍二、使用效果测评三、小羊驼Vicuna安装webui linux部署教程总结踩坑经验 随着chatgpt大火,很多人都开始学习chatgpt相关知识,本文就介绍一下最近很…

highcharts去水印方法

highcharts去水印方法 在和title同级的地方,输入 credits: { enabled:false, }, 即可去水印,亲测有效。 highcharts的商用版是需要收费的,在个人网站、学校网站及非盈利机构中使用 Highcharts 完全不需要经过许可,直接可以任意使…

分享一个去水印接口,完全免费,早点下手啊

上传到任意空间或者服务器,访问即可用。 目前支持很多平台:抖音|快手|皮皮虾|西瓜|红书|微视|最右|哔哩哔哩,皮皮搞笑等常见平台. 而且还是免费的。 该接口测试,完全免费,如果那天收费了,大家可以直接放弃…

如何批量去除图片水印?批量去水印方法

地址:如何批量去除图片水印https://www.shuiyinyun.com/inpaint-image.html步骤: 在平台当中可以直接把自己要去水印的图片依次添加进去,然后用工具选择去水印区域,可多选,图片全部都选择好后,点击批量处理…

如何去水印而不损图片?码住这三个方法学会图片怎么去水印

当我们在网上“冲浪”时,会看到一些喜欢的图片,想要保存当做壁纸或头像,但是保存下来后却发现带有水印,导致画面被遮挡,影响美观,放弃又舍不得,这个时候可以使用一些软件去除图片上的水印&#…