各大AI研究院共35场NLP算法岗面经奉上

本文涵盖了腾讯微信事业群模式识别中心,PCG和TEG事业群,阿里达摩院,蚂蚁金服,百度研究院,京东研究院,头条AI Lab,滴滴AI Lab,微软亚洲研究院,微软工程院以及联想研究院等等多个公司NLP算法岗面试内容,其实面试内容都大差不差,从大的来说就包含四块内容,下面我也就这四块做一个简要的说明:
1、简历中项目以及提到的相关算法

2、传统机器学习相关算法原理及使用细节

3、深度学习算法相关算法原理及使用细节

4、手动Coding,数据结构的考察

首先也是重重之中,就是要准备好一份漂亮的简历,简历的重要程度不用多说,我想大家首先给自己心理设下这样一个标准,我这份简历前后修改了有20个版本了没有。

简历投出去之后就是自我的准备工作,对于传统机器学习算法,我列举一些如:

K-近邻,K-Means,朴素贝叶斯,决策树(ID3, C4.5, CART, GBDT, Xgboost, Lightgbm, 随机森林等),逻辑回归,最大熵模型,支持向量机SVM,EM算法,隐马尔科夫模型,条件随机场等,这些传统机器学习算法在面试中经常会被问到原理,或者直接让你公式推导,推荐阅读的书籍如:李航-统计机器学习,周志华-西瓜书,刘铁岩-分布式机器学习等

 

除了传统机器学习就是深度学习算法的复习,深度学习模型的考察通常会结合实际的项目场景进行考察,那掌握模型的原理便是基础,常考查的深度学习模型如

1、CNN,RNN/GRU/LSTM,Transformer(NLP特征提取)

2、Word2Vec,Glove,FastText,Elmo,Bert,Flair(预训练词向量)

3、CNN,RNN,RCNN,DPCNN,FastText,HAN,Bert(NLP分类模型)

4、GNN,GCN,SGCN(图模型)

深度学习算法复习推荐书籍如:花书-深度学习,python神经网络编程等

 

最后一个便是面试都少不了的coding,如果现场面试基本都会准备一张纸一支笔然后手动Coding,像今年远程面试那就都是线上coding,像头条或部分公司就会使用牛客网在线编程环境,线上coding其实相对于手动coding还是有好处的,因此平时就是在线上写代码,但如果是手动coding大家需要注意一些问题,不要以为线上会coding,纸上也能完整的写下来,需要提前在纸上写一写,因为线上coding是有可自动补全的编程环境,会让你舒服很多。手动Coding的能力不是短时间可以练出来的,因此平时大家要多练习,这个大家倒不用买什么书籍,就可以在Leetcode网站,牛客网站上进行练习。

 

接下来就给大家奉上将近20家公司NLP算法岗的面经,供大家参考,我把面经分为了暑期实习面试篇和日常实习面试篇,其实暑期实习和日常实习面试的内容没有太大的区别,只是在流程上暑期实习面试的流程很长,在招聘上公司也会更加的谨慎。 当然只要大家对上面提到的四项内容全都掌握,那么面经倒也没有太大意义了,如果大家想沟通面试经验或者某些公司组别的相关情况可以关注公众号后获取我的联系方式,希望和大家一起交流学习。

暑期实习面试篇

阿里蚂蚁金服-人工智能部

一、阿里一面(两小时)

1、两道算法题(50分钟)

(1) Leetcode139 单词拆分

(2) 对算数表达式求值,如给定字符串'1+((2+3)*4+(4+2))-5*(2+1)',求算数表达式结果

2、聊简历(40分钟)

3、算法常识(30分钟)

(1) 偏差和方差的区别

(2) 介绍一些传统机器学习的分类体系

(3) Bert和Elmo在工程中存在的一些Trick

 

二、阿里二面(四十分钟)

1、聊简历(40分钟)

 

三、阿里三面(三十分钟)

1、聊简历(30分钟)

 

四、阿里HR面(二十分钟)

1、简单介绍一下实习项目

2、以往实习经历的体验和收获

3、自己性格的优缺点

4、对工作地点和入职时间的确认

 

阿里面试体验:根据很多同学交流反馈的不完全统计,阿里面试一面难度最大,之后的面试好多都是只聊简历项目。阿里的HR权利很大,即使面到了最后一面HR面还是有很大可能会被挂掉,一句话夸张的概括一下阿里HR的存在吧,#阿里技术部的面试官是在给HR部门招人,而不是HR再给技术部招人#。而且阿里的流程走的是真的慢,很多同学都是在HR面后超过半个月才会收到offer意向书,所以面了阿里就得放平心态耐心等着吧。

 

腾讯WXG-模式识别中心

一、腾讯WXG一面

1、聊简历

2、结合简历询问相关模型细节及工程细节

3、算法题

(1) 不用Python自带的包实现INT转为STR

(2) 反转链表,剑指offer原题/Leetcode206

(3) 给定一段文本Text,对文本做各种数据统计

 

二、WXG二面

1、聊简历

 

三、WXG三面

1、聊简历

2、算法题

(1) 字典树的最大正向匹配算法实现

(2) Leetcode146-LRU缓存机制

腾讯TEG-AI平台事业部

一、腾讯TEG一面(两小时)

1、算法常识(50分钟)

(1) 介绍过拟合的方法,L1和L2正则的区别,L1正则为什么产生稀疏解

(2) dropout方法如何防止过拟合,直接简化网络和dropout的区别

(3) 介绍深度模型中的优化函数以及优缺点,介绍实际工程中如何判定过拟合

(4) 给房屋面积/房间个数/是否有电梯/是否南北通透/楼层数以及房屋价格,描述解决思路

2、聊简历(40分钟)

3、算法题(30分钟)

(1) 实现dropout函数

(2) 长度N的整数数组,只用乘法不用除法,求任意N-1个数乘积最大一组

(3) 二叉树中的所有和为Target路径,Leetcode113-路径总和2

 

二、TEG二面(四十分钟)

1、问的都是工程方面开放性问题

(1) 多层次分类如何处理

(2) 分类文本中如果含有一些关键词扰乱分类结果如何处理,举例

(3) 分类文本中如果出现一些新词无法识别导致分类错误如何处理

(4) 分词多个分类模型的优缺点如CNN,RNN,FastText以及应用场景

(5) 开放题: 农夫山泉公司对水资源的开采是否会造成水资源的枯竭,如何看待

 

三、TEG-HR面(十五分钟)

1、聊简历项目十分钟

2、给了五分钟问问题

 

腾讯面试体验:暑期实习在流程上腾讯和阿里比也快不到哪里,但是腾讯有一个特别好且可以利用来加快面试速度的小方法,那就是基本每个人都可以直接接触到腾讯的HR,在面试进度被卡时,可以通过联系腾讯HR来直接推进面试进度,HR小姐姐一般都很乐意帮忙。还有就是腾讯HR面完之后基本就挺稳了,这点和阿里也差别很大。

 

头条AI Lab

一、一面(一个小时)

1、聊项目

2、基础知识

3、算法题:字符串s只包含字母‘a’和‘b’,请问同时满足以下条件的字符串s’的最大长度(1)s’是s的连续子字符串,(2)s’里‘a’和 ‘b’数目相等 ,(3) o(n)的时间复杂度

 

二、二面(一个小时)

1、聊项目

2、基础知识

(1) python中的装饰器、值传递和索引传递

(2) word2vec和FastText模型以及二者的区别,FastText算法N-gram作用

3、算法题:实现K-Means算法

 

三、HR面(十五分钟)

HR面试相对轻松,就是问了以前实习有没有什么收获以及之后的职业规划,还有HR介绍了一波头条的AI Lab

 

头条面试体验:头条给人的感觉就是严谨,无论从HR或者到面试官,首先头条的HR还是真的专业,在面试前都有HR先和你沟通面试时间,有什么问题都可以和HR沟通。谈到这点我就特想说,阿里的面试很多都是突然某个午休时铃声响起就这么突然地被面试了(基本都是用公用电话打,也不给你任何联系他们的机会,神秘的组织啊),至于HR嘛只有在HR面的时候你才能听到他的声音,但他还有决定你去留的强大权利。头条的面试官严谨怎么说呢,就是头条的每次面试基本都是一个小时左右,不少不多。但阿里和腾讯那就看面试官心情了。

 

 

日常实习面试篇

阿里达摩院

一、一面(一个小时)

1、聊简历项目

2、算法知识

(1)CNN 模型中池化层的作用,Max Pooling 是如何反向传递梯度的。
(2)机器学习中正则化做什么的?约束模型参数,防止过拟合。
(3)正则化有 L1 和 L2 正则化区别是什么

(4)Transformer 模型架构, Transformer 和 BERT 的位置编码有什么区别
(5)Dropout 有什么作用

3、算法题:给定一个未排序的整数数组,找出最长连续序列的长度,o(n)时间复杂度,leetcode128原题

 

二、二面(一个小时)

1、聊简历项目

2、简历上设计的相关算法原理介绍

3、算法题:寻找两个有序数组的中位数,o(log(n))时间复杂度,leetcode4原题

 

新东方研究院

1、聊项目(一个小时)

2、算法题:array=[1, 3, 7, 9, 12, 15, 21], target=21, 找出数组中所有和(n个数,n=1,2,…)目标数的数集合,leetcode39、leetcode40组合总和问题

 

联想研究院知识图谱

1、聊项目(半个小时)

2、算法题

(1)寻找二叉树中任意两个节点的公共父节点,无指向父节点的指针且不准添加

(2)两个list1,list2保存了电话信息,电话都是字符串且都有数字组成长短不一,查询list2中电话在list1中出现的情况:如果完全匹配返回电话,如果只是前缀且仅是一个电话前缀返回电话,若是多个电话前缀则返回空,如果完全不匹配返回空

 

美团知识图谱核心组

一、一面(一个小时)

1、聊简历项目,介绍BERT、Attention、Transformer原理

2、场景题:对于分类问题中的多标签问题/或者多级字标签问题如何解决

3、算法题1:二叉树的层次遍历,leetcode102,leetcode107原题

二、二面(一个半小时)

1、聊简历项目

2、场景题:对于分类中为什么要采用数据不同比例

3、写出交叉熵公式并解释为什么要使用交叉熵作为损失函数去评估误差

3、算法题1:leetcode15三数之和

4、算法题2:链表的归并排序和链表的快速排序

 

腾讯自然语言处理组

一、一面(一个小时)

1、聊简历项目

2、介绍Bert、XLNet、Attention、CNN的原理,

3、探讨了rule激活函数如果不加在卷积层之后而是加在最大池化层之后有什么影响

4、算法题:快速排序

二、二面(一个小时)

1、聊简历项目

2、python中字典和集合的实现结构

3、算法题1:使用Tensorflow实现Softmax函数

4、算法题2:给了一个文档集合,计算每篇文档中每个单词的TF-IDF值

5、算法题3:二维平面有很多点,判断二维平面中是否存在平行线

三、三面(一个小时)

1、聊简历项目

2、简历上提到的所有算法原理过了一遍

 

百度研究院

1、聊简历项目

2、传统机器学习:L1/L2正则化及对损失函数造成影响的区别、逻辑回归、GBDT原理以及残差实现细节、GBDT和Xgboost对比、高斯过程原理、吉布斯采样原理

3、算法题1:求一个整数的平方根

4、算法题2:给定两个整数数组,对第一个数组进行排序,整数顺序由其在第二个数组中的位置决定,对于没有出现在第二个数组中的整数,应排在末尾,其之间顺序无限制。这里整数的取值范围是[0, 2^32-1],例如第一个数组为5 1 6 2 1 2 3, 第二个整数数组为2 1 3, 则排序结果为2 2 1 1 3 6 5或2 2 1 1 3 5 6

 

 

京东AI研究院

1、聊简历项目,面试超水,聊完简历项目直接要了

 

滴滴AI Lab

1、聊简历项目

2、word2vec原理、如何得到词向量,fasttext原理

3、GDBT梯度决策提升树、xgboost、lightgbm原理及区别

4、算法题:给定数组例如[A,B,C,D,E,F],给定目标数C, 得到数组[D,E,F,C,A,B]

香侬科技

一、一面(一个小时)

1、聊简历项目

2、算法题:两数之和,从数组array中找出两数之和为target

3、算法题:在一个坐标系中给定(0,0)、(a,b)点,从(0,0)点出发,每次只能向右走一步或者向左走一步,到达目标点(a,b)点一共需要走多少步

4、GBDT和xgboost的原理,为什么常说xgboost可以并行的,GBDT和xgboost有什么区别

5、L1正则化和L2正则化的区别,L1正则为什么产生大量稀疏解

二、二面(一个小时)

1、聊简历项目

2、算法题:反转链表

3、算法题:将多个排序好的链表合并成一个有序链表

4、一对夫妻有两个孩子,第一个是女孩,问第二个是男孩的概率

5、CNN,RNN,LSTM,BERT全称都是是什么

 

 

百度知识图谱

一、一面(一个小时)

1、聊简历上的项目

2、激活函数有哪些以及激活函数如何选用

3、操作系统中进程和线程有什么区别,通信方式

4、算法题:LCS、二分查找

 

二、二面(一个小时)

1、聊简历项目

2、介绍Bert、Transformer、Attention原理

3、手推SVM

4、算法题:在二叉树中同层的节点之间添加左孩子到右孩子的指针

 

微软工程院Bing搜索

1、聊简历上的项目

2、算法题:树中任意两个节点的最近公共父节点,面试官让使用两种递归的方式实现,并且又要求使用迭代形式实现,迭代实现树的中序遍历

3、深度学习相关知识:CNN架构理解,梯度消失和梯度爆炸,L1正则和L2正则,损失函数

 

微软小冰核心对话组

一、一面(一个半小时)

1、聊简历项目

2、算法题:LCS迭代实现、递归实现、LCS序列打印、算法优化,LCS和最长公共子串区别

3、手推Bayes公式

4、手推CBOW和Skip-gram公式

5、许多开放性试题如:维护一个项目上线最主要的是什么,NLP领域都有哪些任务,词向量预训练发展整个过程等等

 

二、二面(一个小时)

1、聊简历上的项目

2、介绍HAN模型原理,Attention机制原理

3、算法题1:判断一个序列是否是二叉搜索树的后序遍历序列

4、开放算法题2:在牛市实时数据,不断的有数字型数据流进入,如何在每次进入时得到当前所有数据的中位数

 

三、三面(一个半小时)

1、求公选课人数的平均数(不知道每个公选课的选课人数)

2、给出QA中的Question和Answer,你能做些什么

3、word2vec中cbow\skip-gram滑动窗口设定大小有何影响

4、有事笔记本电脑跑程序出现内存不够用,但是打开任务管理器发现还有空余内存为什么

5、算法题:编辑距离

6、算法题:任意两个树节点的最近公共父节点

 

微软机器学习组

一、一面(一个小时)

1、聊简历上的项目

2、手推逻辑回归

3、CNN和RNN中反向梯度传播过程,为什么会出现梯度消失或梯度爆炸

4、算法题:用前序序列和中序序列重构二叉树

二、二面(一个小时)

1、聊简历上的项目

2、算法题:设计一个游戏角色在地图中从起始位置到目标位置是否有可行路径,如果有记录下来

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14439.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DeFi会带来牛市吗?

作者:蒙特卡洛 一、Defi的火爆 区块链市场平淡很久了,最近才找到一丝丝火热的气息,这个火热的气息是由Defi带来的。 借助于“借贷即挖矿”,Compound的代币COMP在短短一个月时间之内,价格翻了20多倍,一跃成为…

bluetooth射频已关闭请打开bluetooth射频_投资笔记:5G之射频研究

文/牛市市长 微信公众号:晓烽投资 因为工作关系,今年断断续续的梳理了很多投资笔记,一直想把这篇《5G之射频前端》部分汇总篇文章推送到前台,一直没有时间。这篇文章推送了晚了点,文中的很多判断可能是基于当时的市场做出的结论,不一定适合于当下,请关注的朋友注意。 科技…

这次可能不是你所期待的牛市

6月底,市场还在激烈地讨论3000点是否已经被焊牢;7月伊始,上证综指便以迅雷不及掩耳之势放量突破3150,非银金融和房地产板块翩翩起舞,券商更是集体上演涨停潮。 这似曾相识的行情,让市场嗅到了牛市初期的味道…

无人再谈“永恒牛市”

(图片来源于网络) 请问3月份比特币6万刀的时候是什么市?站在今天回顾过去很多人肯定说是牛市。那么今天比特币3万3是什么市?这个问题就有分歧了。有人说是牛市中的回调,有人说是熊市的途中。从来都是如此,回顾过往人人皆赛诸葛孔明…

牛市因子和熊市因子

来源:Chihiro Quantitative Research ,作者:刀疤连 未经授权严禁转载! 1.前言 因子化投资近年来越来越火热,是量化投资领域的主流方向[1]。因子投资指在某个资产内部,使用一个或多个具有风险溢价的因子…

牛市看涨期权套利

牛市看涨期权套利 操作组合:买低卖高,方向相同 使用场合:对后市谨慎看多 损益图: 参数说明:较低执行价K1的权利金为Q1,较高执行价K2的权利金为Q2 净权利金: Q1-Q2 (也是最大损失)…

牛市价差组合

既可以用看涨期权构造,也可以用看跌期权构造 看涨期权组合 总体看好的情况下 看跌牛市价差

牛市的三个阶段

(图片来源于网络) 早在2/21文章《牛市已进入中场》[链接]中就说,“比特币站稳5万刀、市值破万亿之后,这一轮牛市就进入中场了。”那么,通常而言,牛市有以下三个阶段衔接构成: 第一阶段,上半场。远见者相信牛…

烽火通信C语言笔试题:牛市区间问题

小明最近在研究股市,他拿了某只股票连续n天的股市变化数据,天数编号1到n,对于第i天,该股票的涨跌程度用一个整数啊【i】来表示。小明觉得对于某一段日期区间【li,ri】,如果这段区间内该股票总涨幅不小于K&a…

SpringBoot集成ChartGpt

SpringBoot集成ChartGpt 文章目录 SpringBoot集成ChartGpt[TOC] 前言一、ChatGpt集成组件二、OpenAi连接配置三、查询接口调用1、代码实现2、结果展示 三、获取文本向量接口1、代码实现2、结果展示 四、代理设置总结 前言 ChatGPT(Chatbot Generative Pre-trained …

python预测体彩大乐透

从网上抄了个机器训练的代码,另外自己改了几个数学预测方法 唯一不方便的就是每次要更新数据源然后由于配置太差,每次买之前要提前执行一个钟多,如果间隔时间长的话,手动更新数据也比较繁琐。 这段时间趁着空闲对整个程序修改了一…

ChatGPT结合Excel公式办公 —— ChatGPT统计富豪信息

💧 C h a t G P T 统计富豪信息 \color{#FF1493}{ChatGPT统计富豪信息} ChatGPT统计富豪信息💧 🌷 仰望天空,妳我亦是行人.✨ 🦄 个人主页——微风撞见云的博客🎐 🐳 《数据结构与算法…

ChatgGPT生成Excel统计公式

需求背景 编写excel公式,提取下图中符号之前的内容并填充到“修改后的内容”这一列 流程思路 借助ChatGPT完成Excel公式的大致流程如下: 确定要解决的问题:明确你需要在Excel中实现的具体任务或计算需求。例如,求和、平均值、…

利用ChatGPT编写Excel公式,对比讯飞星火与ChatGPT对Excel公式的回答

系列文章目录 借助国内ChatGPT平替MindShow,飞速制作PPT 借助国内ChatGPT平替markmap/Xmind飞速生成思维导图 借助国内ChatGPT平替剪映/百度AIGC平台快速制作短视频 文章目录 系列文章目录前言一、利用ChatGPT编写Excel公式1.描述我们想实现的Excel公式&#xff…

如何简单的将文档上传到ChatGPT的5种方法详解《收藏》

OpenAI 一直在为 ChatGPT 添加有意义的功能,包括对网页浏览和插件的支持。但是,仍然没有办法本地上传文档并根据其上下文提出问题。不过,有些用户可以在他们的数据上训练 AI 聊天机器人,但并不是每个人都了解如何设置工具和库。如果您正在寻找一种将文档上传到 ChatGPT 的简…

ChatGPT城市积水内涝研究

正常注册的ChatGPT是可以使用的,我正在做城市内涝研究,想看看chatgpt有什么想法。 ChatGPT提供的答案挺全面,文字逻辑性很好。如果是写文档的话,很有用处,但是具体实现还需要仔细研究。城市积水内涝 遥感怎么实现城市积…

上传vip专享资源,瓜分奖金池

VIP专享资源上传活动,每月持续上传,则每月均可获得奖金哦,敬请期待~~ 一、活动时间及任务 第一期:2022.10.12-2022.11.12 (第一期活动结果已出炉,戳此查看) 第二期:2022.11.18-2022.12.18 &…

车企数字人“猛烈地来,猛烈地去”

技术战、产品战、价格战、营销战,高度成熟的汽车市场,精细地将战场划分成一块块。过去,越是卷入新车战事,车企们越需要营销带动舆论、增加市场砝码。去年,数字人在内的元宇宙场景是砝码之一。 然而,进入20…

基于台达PLC的水箱液位PID控制(matlab处理数据)

1.实验目的 (1)掌握过程控制的方法; (2)熟练掌握台达编程技巧; (3)熟悉实验室水箱系统、变频器的接线方法; (4)学会用文件寄存器来读取数据并…

【天津科技大学-智能科学与先进制造实验班】1-LED篇-关于手焊STM8S208MB开发板的测试与学习

一、引言 首先感谢天津科技大学董舰老师以及创驿社各位学长们对我们22级智能科学与先进制造实验班的培养与帮助,能给我们一个非常珍贵的实践机会来学习STM8单片机,本篇将以零基础手把手教会大家如何通过点亮LED,从而测试自己手焊STM8开发板是…