[2023年]-hadoop面试真题(一)
- (北京) Maptask的个数由什么决定?
- (北京) 如何判定一个job的map和reduce的数量 ?
- (北京) MR中Shuffle过程 ?
- (北京) MR中处理数据流程 ?
- (北京) 为什么说MR处理数据比较慢?
- (北京) 什么是分区器? 什么是分区?
- (北京) 在工作过中如何避免shuffle?
- (北京) 为什么mapjoin会快?
- (北京) 什么是数据倾斜 ,MR中如何发现?如何解决数据倾斜?
- (北京) 在开发时,自定义过分区器吗?
- (北京) MR中如何优化JDK自身的序列化?为什么要优化?