三大部门七场面试,终拿字节AI NLP 算法offer

作者 | Maxxiel 

编辑 | NewBeeNLP

面试锦囊之面经分享系列,持续更新中 

后台回复面试』加入讨论组交流噢 

写在前面

背景美本cs+英硕ai在读,无paper无实习无研究无比赛。方向是深度学习、nlp,项目主要是情感分析 和模型蒸馏。leetcode 刷了大概二三十道的样子。

今年在项目组同学的建议下准备一起找个暑期实习,几个认识的人能去一个厂实习最好。前后投了循环智能、阿里、字节、百度、腾讯、快手六个厂。其中快手简历投了以后就没回复了。目前拿到了字节的offer,百度和阿里还在面试流程中。全程只有百度做了笔试,其他公司都是HR直接捞简历开始面试。(项目组里四个人,我去了字节,一个去了腾讯,一个去了阿里,还有一个读phd,大家都有光明的未来。)

循环智能

循环智能是春招拿到的第一个面试,一面就挂了。感触比较深的是这个公司的面试一直在问一些基础概念和api的东西,基本上不会参考你的简历之类的。主要问到了

  • 动量优化

  • adam优化

  • bert调参

  • bias和variance的区别

  • svm为什么要用核函数

  • transformer多头的意义是什么

之类的基本概念。面试一小时,基本上都是问答式的轰炸,忘了最后有没有让手撕代码了,反正挂了。

字节跳动

其实字节的面试经历比较复杂,先是投的搜索部门的nlp实习,两轮技术面一轮hr面通过后等了大半个月,应该是没有hc了,被拒。

之后hr给我主动转岗到商业变现部门,面了一面,发现方向不对,这个部门的岗位是做机器学习的。

然后又被转岗到data部门,面了一下推荐算法实习,方向依旧是深度学习和nlp,两轮技术面,一轮hr面,拿到offer。

其实搜索部门的面试体验非常好,两位技术面的面试官都很友善,技术力也很足,甚至对于我手上做的项目给了很多优化的建议。但是整个部门的面试流程效率特别低,面试结束后等了三周才给出拒绝的结果,非常搞人心态+影响后续岗位的面试流程。

搜索部门第一轮技术面:1小时

前半小时面简历,主要问了下我项目过程中提到的模型,实现的时候遇到的问题,优化方案之类的。

  • 让我手写了下交叉熵的公式

  • 问了下模型蒸馏的损失函数

  • T之类的调参

  • 后半小时手撕代码,好像让写了个两个字符串的最大重复的字符串,写个简单的dp就行了。

搜索部门第二轮技术面:1小时

前半小时面简历,因为第一面已经面过了蒸馏的项目,第二面开始面我word2vec相关的项目。

  • word2vec的模型、训练目标

  • 损失函数

  • 优化方案

  • word2vec跟其他预训练模型的区别

  • 后半小时手撕代码,找数组中第K大的值。先写了个sort的暴力解法,然后写了个维护一个长度为K的栈的解法,然后写了一个分治+剪枝的解法。比较好玩的事情是面试官没直接问我复杂度,反而是他自己在那里看了半天看不出来,才让我跟他讲讲这个复杂度的。

之后转岗到商业变现部门,其实没什么好说的,面试官好像不太懂模型蒸馏和深度学习,基本上都是我自己在那里自说自话。

商业变现第一轮技术面:1小时

前半小时聊了聊简历,然后面试官问了些问题

  • GBDT的大概算法

  • KNN的大概算法

  • word2vec的优化,包括层级softmax的复杂度

  • 推荐算法比如itemCF,userCF

  • 后半小时手撕代码,先问了一道算法题,问一个体育馆每次可以让10个人比赛赛跑,而且只能记录排名顺序不能记录时间。现在有150个人,问怎么样才能找到跑得最快的五个人。之后让写了个edit distance。太简单我就不说了。

然后转岗到data部门,岗位是推荐算法,一开始我有点担心是不是跟前一个岗位一样会出现方向不符合的问题,跟面试官聊了一下,面试官说会有深度学习和nlp的工作。整个面试流程非常效率,从面试官到HR都非常配合主动,5月6号周四开始面试,5月10号周一就已经拿到了offer。总的来说感觉部门行动力很强,面试的过程也很专业。

data部门第一轮技术面:1小时

依旧是先聊了半小时的简历。集中在蒸馏的项目,同时也问了一些transformer和seq2seq的问题。

  • 不同损失函数之间的差异以及取舍问题

  • 对不同的bert蒸馏模型的理解

  • Bert预训练任务有哪些?为什么要这么做?你觉得哪些任务可以如何优化?

  • LSTM的结构,优缺点

  • 我的蒸馏模型如何进一步提升?有哪些考虑的方向

  • 对于其他Bert模型的了解,都做了哪些优化

  • 量化、剪枝、参数共享等模型压缩手段

  • 后半小时手撕代码,第一道题是计算10进制数转换成2进制之后字符串里1的数量。第二道题是给两个递增的有序数组,第一个数组代表index,第二个数组代表light,问light的半径最小要多少才能覆盖所有index。我用dp做的,时间复杂度比较小,但是空间复杂度会大一点。

data部门第二轮技术面:1小时

还是聊简历上的项目,同时也问了点毕设和有没有在做的paper相关的问题。问的问题比第一面更深,感觉第一面主要考察解决问题的思维逻辑,第二面会抠项目相关的细节。

  • 数据集不平衡的处理方法

  • 用了哪些数据增强的方法

  • 剪枝的原理,为什么多头attention剪枝有用

  • Bert,elmo,word2vec等词向量的区别

  • transformer的并行,encoder decoder的细节结构

  • 后半小时手撕代码,面试官说你在字节面了这么多面了,估计该问的都问过了,就给我随便出了道螺旋矩阵的题。主要看看我debug之类的能力。

之后拿到offer,没什么好说的了。

尾巴

鹅厂、驴厂、百度因为整个流程还没结束,面经之后会继续补充。这一个月的面试流程下来,感触比较深的就是小厂更多的考察你搬砖的能力,面试流程比较像快问快答,会考察很多跟你方向不相关的东西。大厂会比较在意你的整个逻辑思维和项目思路,在此之外考察工作和项目相关的知识。然后手撕代码都不太难,都是很基础的题,我个人认为做nlp算法这个方向的不需要投入太多精力在leetcode上,好好弄项目理解概念多看论文才是重中之重。

另外一个要提醒大家的是春招一定要趁早,最好三月就开始投简历,不要像我一样磨磨蹭蹭到四月五月,很多公司已经没有hc了。

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),关注公众号回复『入群』加入吧!

END -



模型增强 | 利用 NLG 增强 QA 任务性能

2021-05-17

炼丹宝典 |  Deep Learning 调参 tricks

2021-05-14

阿里、腾讯 | 算法岗面试复盘

2021-05-10

建议收藏!早期人类驯服『图神经网络』的珍贵资料

2021-05-05

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/60598.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【论文阅读】空间圆形拟合检测新方法

目录 1、空间圆拟合模型1.1、空间平面拟合1.2、空间圆拟合 2、参考文献3、算法伪码4、算法结果 摘 要 根据空间圆中任意两条弦所对应的中垂面与空间圆所处的平面必然相交且交点即为圆心这一空间圆特性,利用空间向量按照最小二乘法推导出圆心计算方程,按照…

海外硕士苏明哲回国后哀叹:我美本英硕,找不到工作很难受

推荐阅读: 欢迎加入我们的架构师社群 阿里跳槽拼多多,80万年薪涨到160万,值不值得去? 一名海外留学生回国后找工作,却屡受打击,感慨自己美本英硕,却找不到工作,内心真的很难受&#…

玩转AI绘图 电脑配置怎么选?

大家好,我是网媒智星,很多小伙伴留言想了解一下AI绘图相关知识,那么,想要玩转AI绘图,电脑配置该怎么选呢? 首先我们了解一下什么叫AI绘图? AI绘图指的是利用人工智能技术实现的自动绘图&#x…

chatgpt赋能python:Python做图:一个强大而灵活的工具

Python做图:一个强大而灵活的工具 Python是一个流行的编程语言, 越来越多的人开始使用它进行数据分析和可视化。 Python做图的功能非常强大,使得它成为许多人的首选工具。在这篇文章中, 我们将讨论 Python做图及其SEO优化。 Python做图的优势 Python做…

人工智能基础部分19-强化学习的原理和简单应用,一看就懂

大家好,我是微学AI,今天给大家介绍一下人工智能基础部分19-强化学习的原理和简单应用,随着人工智能的不断发展,各种新兴技术不断涌现。作为人工智能的一个重要分支,强化学习近年来受到了广泛关注。本文将介绍强化学习的…

TT语音:游戏社交乱象难平

游戏在人们生活中占据的时间越来越多,用户对游戏内的体验也愈发的丰富,有时候和朋友三五结队打几把王者荣耀,但大部分玩家是处于一个人玩游戏的状态,而这种状态也影射了当前Z世代的孤独状态。 人在孤独后会产生强烈的社交需求&am…

Android(仿QQ登入+网易新闻)

文章目录 场景内容:效果参考 场景 提示:基于期末作业开发(自增轮播图) 自评:效果蛮丑的,功能都在,仅供参考! 内容: 一,引导页 1,设计引导页Log…

运维有趣项目:搭建个人博客安全版(Appache2.4防盗链与防泄漏,防盗链httpd.conf无Load,include版)

这次算是呕心沥血了,网上的防盗链文章简直一个模子的,全部都是采用httpd.conf修改LoadModule rewrite_module modules/mod_rewrite.so或是httpd-default.conf,可是我用阿里云自动搭建的apache环境压根就没有啊,如果有相同经历的,可以看这篇文章,希望留下评论,给个鼓励不,QAQ,域…

chatgpt赋能python:Python打包成手机可执行文件指南

Python 打包成手机可执行文件指南 作为一名有着10年Python编程经验的工程师,我认为将Python打包成手机可执行文件是一项非常有用的技能。在这篇文章中,我将介绍Python打包成手机可执行文件的重要性,以及如何使用PyInstaller工具轻松打包Pyth…

优酷“首月1元”会员引争议:取消续费却被扣24元;马斯克欲在推特建立支付系统,并包含加密货币功能;Deno 1.3发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

chatgpt赋能python:Python多个%d在SEO中的应用

Python多个%d在SEO中的应用 在当今的互联网时代,搜索引擎优化(SEO)已经成为了每个网站的重要任务之一。而在Python编程中,有一个非常常见的占位符%d,用来替代一个整数。在本文中,我们将介绍Python中多个%d…

38年来,NBA最有价值球员|数据分析

使用工具:Ipython notebook/Anacoda-Spyder 使用的库:Pandas,Matplotlib,Seaborn Python版本:Py3.6 1 数据来源 1).本次用到的数据 来源于https://www.basketball-reference.com/awards/mvp.html,其中可以选择多种形式,我选的是CSV格式,方便后面的数据分析,(文末会分享…

kaggle:谁是NBA最佳防守球员?(二)

接着前几天发的关于kaggle中NBA球员投篮数据探索性数据分析和可视化分析之后,小编本打算对这13万的投篮数据跑几个机器学习模型预测一下投篮的,可是电脑内存不给力,试了几次之后便作罢了。还打算第一次试一下kaggle上被传的神乎其技的大杀器x…

篮球中各个位置的名称及介绍…

正规篮球比赛是5对5,赛场上分布着五个篮球位置,分别是:中锋(C)、大前锋(PF)、小前锋(SF)、得分后卫(SG)、控球后卫(PG) 来…

几行代码,GPT-3变ChatGPT!吴恩达高徒、华人CEO震撼发布Lamini引擎

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【计算机视觉】微信技术交流群 转载自:新智元 | 编辑:Aeneas 好困 【导读】这个全新发布的Lamini引擎,大大拉低了模型训练的门槛&#xff…

抖音小店无货源是怎么做的?开店需要我们准备什么?经验分享

大家好,我是电商糖果 无货源模式流行于14-15年,最早是在某宝、某东、多多这些平台 目前抖音小店无货源的情况: 抖音小店和其他传统电商平台不一样,抖音小店起店是很快的,基本上5-20天小店就可以稳定出单了。 现在直…

抖音小店开通后为什么不出单?新店一定要看看是不是这三个方面没做好

大家好,我是电商年年 想要做好抖音小店,找对方法很重要。很多人的抖音小店开通后迟迟不出单,其实主要有三个原因。 选品为王 做电商,产品才是第一位,其他都要往后靠。选品首先要确定类目,之前很多人都在…

关于抖音小店无货源,作为过来人,来给你推荐几个好做的类目

Hello这里是六一,一个在无货源模式下闯荡多年的电商人。 好的类目对于操作无货源来说也是一个关键点,类目选的没问题,那起点就比别人高,做起来容易得多。 上边在讲营业执照问题的时候建议新手把全类目都开通,但是在做…

抖音小店无货源怎么做?具体步骤讲解,经验分享

哈喽,大家好,我是布丁。 废话不多说,直接上干货。 抖音小店无货源是什么? 抖音小店就是在抖音上开一家小店,抖音小店是一个电商平台,无货源是一种操作模式。 无货源模式就是在网上采集其他店铺的商品&a…

抖音橱窗or抖音小店?这3点,新手开店必看!

不会吧不会吧,都2023了还有人分不清抖音橱窗和小店的区别?今天小编就带你了解一下,不再掉大坑。 1、性质不同 商品橱窗 它只是展示商品的一个窗口,是抖音的一个电商功能,主要通过短视频或者直播的形式推广商品&…