百度面经(知识图谱部)一面
1.自我介绍
介绍完了,打开共享,对着简历一点一点问
2.ffmpeg在项目中是怎么使用的
回答了ffmpeg在项目中使用的命令,用来干了什么
3.为什么使用toml配置,了解过yml配置吗,为什么不用常规的json配置
这个以前没有任何的面试官注意到这个,也是第一次被问,就现编了
4.项目的并发量上来了怎么办
回答了分布式的一系列相关(消息队列、负载均衡、分库分表等)
得亏之前面腾讯云智的时候被问到了,正好就准备了,不然ji了
5.把文件存在本地,数据量上来了怎么办
转存数据库,如果视频文件过大,用ffmpeg切片,然后用多线程传
6.视频合成会不会遇到什么问题
这个是我回答上一个问题时,提到了切片,当去数据库提取视频时,必然要合成,恰好面试官之前就遇到了这个合成的不稳定的一个问题,就问了
7.项目的日志是怎么建立的,有没有对日志进行分类、分期
这个是我的第二个项目搜索引擎,正好前几天看了webserver的日志实现,就把一些东西也答上去了
8.多进程、多线程的区别
答的不是很好,但最终还是落到点子上了,通信方式的不同
9.redis和MySQL的区别
从存储、使用方式来答的
10.对什么样的数据会使用redis
这就就经典了,列举了一些热点数据
11.二叉搜索树的概念、插入、删除
先讲了概念,讲到删除的时候,让我画个图,边画边讲
12.有使用过vim编辑器吗
搜索引擎就是在Linux上开发的,那这个肯定很了解了,还说了远程连接vscode的开发,面试官也说,他们自己用的是icoding(是vscode的百度版,就是再封装了一层)
13.在分布式的场景下,MySQL的事务会遇到什么问题,会用到什么锁,有没有思路
这个我是真没有了解过了
这是ai给的答案,就只答了第六点,诶
代码题:快乐数(LeetCode202)
直接在vs上写的题,用的记忆化搜索,不过是在while循环中
都没有运行,面试官看了大致思路对了,就过了,然后问了几个极端情况,如果出现一直递增且数据不重复怎么办
这个题之前做过,就记得有一组是死循环,现推没推出来
14.面试官问我有没有用过文心一言
我回答没有,一直用的gpt和claude(说完仔细一想这么一搞,不把面试官的工作给否定了吗),然后就说,因为文心一言毕竟才出的,还有些许bug待调,想等他迭代到一定程度的时候再去使用
说完,面试官就给我展示了,他们内部用的一些接口,很牛逼,可以直接根据文本生成对应的视频,还哭带语音解说,这可太nice了
总结:
这个岗位是可以转正的,实习满3个月,听到面试官说的最多的就是:对的,这点我很开心(感觉面试官还是对我很认可的),面试官基本没问八股,全是基于项目的场景问题,中间有点小插曲(没太弄懂共享,一换就调了一段时间)
面试官老有耐心了,无论哪卡壳了,都说慢慢来不着急,搞的我对这个部门很上头啊。