面试题

面试题

[蚂蚁金服] 诚招 Java /大数据研发,上海/北京/杭州, p6/7/8

招聘hbasegroup 发表了文章 • 0 个评论 • 231 次浏览 • 2019-11-12 17:56 • 来自相关话题

Java/大数据技术宅赶紧看过来~~ 简历请投递 qing.zhengjq@antfin.com ,微信 Asuka4J,团队 Lead 直接评估安排面试~~

我们所在大团队主要负责蚂蚁全站系统的“高可用(从线程级到 IDC 级的故障自动定位和恢复决策)”和“资损防控(所有业务资金流的实时自动核对和止损)”这两大领域。在庞大的系统规模、频繁的变更频率、错综复杂的业务流程>大背景下,可以预计这两项工作已经无法通过堆人的方式应对,即便是很有经验的专家。所以大方向是以数据驱动和智能化的思路破局,一方面需要构建夯实的数据基础设施,支撑全站全量数据的高可靠近线传输、存储与计算。另一方面则需要结合场景去运用业界较为前沿的算法理论经验,实现问题域的智能分析,达到人工辅助或自动决策。当下整个体系已有一定基础,同时也存在很大的探索空间,如果 1.你本善于工程,同时又期望探索数据和智能化的实际>应用,2.你本善于算法,但苦于没有大规模的场景去施展落地,我们觉得都是蛮好的一个尝试方向。

职位描述:

1. 负责蚂蚁金服数据基础设施的研发建设,包括基础的监控时序数据,资金流数据,系统变更数据等。
2. 对全链路稳定性和数据质量负责,进行实时监控,分析,最终提供保障数据的质量,包括低延时,高可用等指标。
3. 参与数据流建设,满足实时数据流上的各种复杂计算需求,包括图计算,多流合并,以及各种常见 transform 计算。
4. 对接数据平台上的各类技术风险防控业务方,满足不断发展的业务需求。
5. 对接各类数据源端系统,包括蚂蚁技术体系内部的各种队列,关系数据库,日志等系统。

职位要求:

1. 扎实的计算机专业基础,包括算法和数据结构,操作系统,计算机网络,计算机体系结构,数据库等。
2. 扎实的 Java 或相关编程语言基础(我们以 Java 为主),良好的编程素养,对代码有美感和极致的追求。
3. 理解实时流计算( 比如 Spark/Storm/Flink )或海量数据处理( 比如 Hadoop/HBase/Hive )相关经验优先考虑。
4. 掌握机器学习、数据挖掘或深度学习的原理和相关算法优先考虑。
5. 强烈的技术热情和工作责任感,热衷于创新和分享,逻辑清晰并具备批判性思维能力和习惯。
6. 计算机软件或相关专业毕业,本科或以上学历; 211/985 优先。

工作地点:

上海,上海中心大厦
北京,环球金融中心
杭州,黄龙国际大厦

编程语言:

Java

招聘范围:

社招( P6+ ~ P8 ) 查看全部

IMG_0136.JPG

Java/大数据技术宅赶紧看过来~~ 简历请投递 qing.zhengjq@antfin.com ,微信 Asuka4J,团队 Lead 直接评估安排面试~~

我们所在大团队主要负责蚂蚁全站系统的“高可用(从线程级到 IDC 级的故障自动定位和恢复决策)”和“资损防控(所有业务资金流的实时自动核对和止损)”这两大领域。在庞大的系统规模、频繁的变更频率、错综复杂的业务流程>大背景下,可以预计这两项工作已经无法通过堆人的方式应对,即便是很有经验的专家。所以大方向是以数据驱动和智能化的思路破局,一方面需要构建夯实的数据基础设施,支撑全站全量数据的高可靠近线传输、存储与计算。另一方面则需要结合场景去运用业界较为前沿的算法理论经验,实现问题域的智能分析,达到人工辅助或自动决策。当下整个体系已有一定基础,同时也存在很大的探索空间,如果 1.你本善于工程,同时又期望探索数据和智能化的实际>应用,2.你本善于算法,但苦于没有大规模的场景去施展落地,我们觉得都是蛮好的一个尝试方向。

职位描述:

1. 负责蚂蚁金服数据基础设施的研发建设,包括基础的监控时序数据,资金流数据,系统变更数据等。
2. 对全链路稳定性和数据质量负责,进行实时监控,分析,最终提供保障数据的质量,包括低延时,高可用等指标。
3. 参与数据流建设,满足实时数据流上的各种复杂计算需求,包括图计算,多流合并,以及各种常见 transform 计算。
4. 对接数据平台上的各类技术风险防控业务方,满足不断发展的业务需求。
5. 对接各类数据源端系统,包括蚂蚁技术体系内部的各种队列,关系数据库,日志等系统。

职位要求:

1. 扎实的计算机专业基础,包括算法和数据结构,操作系统,计算机网络,计算机体系结构,数据库等。
2. 扎实的 Java 或相关编程语言基础(我们以 Java 为主),良好的编程素养,对代码有美感和极致的追求。
3. 理解实时流计算( 比如 Spark/Storm/Flink )或海量数据处理( 比如 Hadoop/HBase/Hive )相关经验优先考虑。
4. 掌握机器学习、数据挖掘或深度学习的原理和相关算法优先考虑。
5. 强烈的技术热情和工作责任感,热衷于创新和分享,逻辑清晰并具备批判性思维能力和习惯。
6. 计算机软件或相关专业毕业,本科或以上学历; 211/985 优先。

工作地点:

上海,上海中心大厦
北京,环球金融中心
杭州,黄龙国际大厦

编程语言:

Java

招聘范围:

社招( P6+ ~ P8 )

互联网公司大数据面试题参考指南

sparkhbasegroup 发表了文章 • 0 个评论 • 1869 次浏览 • 2018-09-17 09:59 • 来自相关话题

以下面试题都是群里小伙伴提供的,现场真题(包含校招题)
1.网易大数据面试题
说说项目Spark哪部分用得好,如何调优Java哪部分了解比较好聊聊并发,并发实现方法,volatile关键字说说HashMap的底层原理为什么要重写hashcode和equals说说jvm各个垃圾收集器运用在什么情形jvm调优说说io为什么考虑转行呢?是因为原专业不好就业吗?

2.蚂蚁金服面试题
小文件的合并MR与Spark的区别关注哪些名人的博客对大数据领域有什么自己的见解平常怎么学习大数据的StringBuilder与StringBuffer的区别HashMap与Hashtable的区别谈谈你对树的理解数据库索引的实现jvm的内存模型jvm的垃圾收集器jvm的垃圾收集算法HDFS架构HDFS读写流程Hadoop3.0做了哪些改进谈谈YARN为什么项目选择使用Spark,你觉得Spark的优点在哪里了解Flink与Storm嘛,他们与Spark Streaming的区别在哪里1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来
 
3.美图面试题
为什么选择美图,你知道美图地点在哪里嘛介绍下你做的项目吧数据统一管理平台,我挺感兴趣的,你说说吧我大概知道是怎么回事了,java web这块你参与开发了吗你刚刚项目提到了元数据,你能说说hive的元数据管理嘛,对它了解嘛还是hive,你对hive有哪些原理性了解呢知道AST、operator tree这些长什么样吗那你的hive转mr过程是怎么了解的呢?除了谓词下推,还能说说其它的优化嘛?别说数据倾斜的调优jvm了解不,说下垃圾收集算法平常用java和scala语言哪个多点如果我现在要使用map集合,你觉得哪种适合多线程情况下进行访问如何去监控线程Spark 出现OOM,你觉得该怎么进行调优呢?不去动jvm的参数你觉得join该怎么优化你对未来的规划是什么?(五年内)你也就是走技术路线咯

4.​美图二面
ThriftServer的HA如何去实现,能说下实现的思路嘛说下Zookeeper的watch机制是如何实现的嘛?场景题:
     现在有1个client,2个server,当我动态加入一台机器,或者删除一台机器,或者某台机器宕机了,client该如何去感知到,说下实现思路(不使用Zookeeper),如何通信,说说具体实现?
 
5.七牛云面试题
快排hive和hdfs之间的联系inode和文件描述符linux指令如何创建文件http中header中放入key value 有什么变化系统调用和库函数区别http缓冲实现机智session cookie  区别进程间通信方式jsp本质http请求状状态get post put remove数据库join 数据库引擎hibernate和mybiters区别jvm垃圾回收hive和关系型数据库区别hive实现原理spark与mr的区别 查看全部
以下面试题都是群里小伙伴提供的,现场真题(包含校招题)
1.网易大数据面试题
  • 说说项目
  • Spark哪部分用得好,如何调优
  • Java哪部分了解比较好
  • 聊聊并发,并发实现方法,volatile关键字说说
  • HashMap的底层原理
  • 为什么要重写hashcode和equals
  • 说说jvm
  • 各个垃圾收集器运用在什么情形
  • jvm调优
  • 说说io
  • 为什么考虑转行呢?是因为原专业不好就业吗?


2.蚂蚁金服面试题
  • 小文件的合并
  • MR与Spark的区别
  • 关注哪些名人的博客
  • 对大数据领域有什么自己的见解
  • 平常怎么学习大数据的
  • StringBuilder与StringBuffer的区别
  • HashMap与Hashtable的区别
  • 谈谈你对树的理解
  • 数据库索引的实现
  • jvm的内存模型
  • jvm的垃圾收集器
  • jvm的垃圾收集算法
  • HDFS架构
  • HDFS读写流程
  • Hadoop3.0做了哪些改进
  • 谈谈YARN
  • 为什么项目选择使用Spark,你觉得Spark的优点在哪里
  • 了解Flink与Storm嘛,他们与Spark Streaming的区别在哪里
  • 1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来

 
3.美图面试题
  • 为什么选择美图,你知道美图地点在哪里嘛
  • 介绍下你做的项目吧
  • 数据统一管理平台,我挺感兴趣的,你说说吧
  • 我大概知道是怎么回事了,java web这块你参与开发了吗
  • 你刚刚项目提到了元数据,你能说说hive的元数据管理嘛,对它了解嘛
  • 还是hive,你对hive有哪些原理性了解呢
  • 知道AST、operator tree这些长什么样吗
  • 那你的hive转mr过程是怎么了解的呢?
  • 除了谓词下推,还能说说其它的优化嘛?别说数据倾斜的调优
  • jvm了解不,说下垃圾收集算法
  • 平常用java和scala语言哪个多点
  • 如果我现在要使用map集合,你觉得哪种适合多线程情况下进行访问
  • 如何去监控线程
  • Spark 出现OOM,你觉得该怎么进行调优呢?不去动jvm的参数
  • 你觉得join该怎么优化
  • 你对未来的规划是什么?(五年内)
  • 你也就是走技术路线咯


4.​美图二面
  • ThriftServer的HA如何去实现,能说下实现的思路嘛
  • 说下Zookeeper的watch机制是如何实现的嘛?
  • 场景题:

     现在有1个client,2个server,当我动态加入一台机器,或者删除一台机器,或者某台机器宕机了,client该如何去感知到,说下实现思路(不使用Zookeeper),如何通信,说说具体实现?
 
5.七牛云面试题
  • 快排
  • hive和hdfs之间的联系
  • inode和文件描述符
  • linux指令如何创建文件
  • http中header中放入key value 有什么变化
  • 系统调用和库函数区别
  • http缓冲实现机智
  • session cookie  区别
  • 进程间通信方式
  • jsp本质
  • http请求状状态
  • get post put remove
  • 数据库join 
  • 数据库引擎
  • hibernate和mybiters区别
  • jvm垃圾回收
  • hive和关系型数据库区别
  • hive实现原理
  • spark与mr的区别

互联网公司大数据面试题参考指南

sparkhbasegroup 发表了文章 • 0 个评论 • 1869 次浏览 • 2018-09-17 09:59 • 来自相关话题

以下面试题都是群里小伙伴提供的,现场真题(包含校招题)
1.网易大数据面试题
说说项目Spark哪部分用得好,如何调优Java哪部分了解比较好聊聊并发,并发实现方法,volatile关键字说说HashMap的底层原理为什么要重写hashcode和equals说说jvm各个垃圾收集器运用在什么情形jvm调优说说io为什么考虑转行呢?是因为原专业不好就业吗?

2.蚂蚁金服面试题
小文件的合并MR与Spark的区别关注哪些名人的博客对大数据领域有什么自己的见解平常怎么学习大数据的StringBuilder与StringBuffer的区别HashMap与Hashtable的区别谈谈你对树的理解数据库索引的实现jvm的内存模型jvm的垃圾收集器jvm的垃圾收集算法HDFS架构HDFS读写流程Hadoop3.0做了哪些改进谈谈YARN为什么项目选择使用Spark,你觉得Spark的优点在哪里了解Flink与Storm嘛,他们与Spark Streaming的区别在哪里1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来
 
3.美图面试题
为什么选择美图,你知道美图地点在哪里嘛介绍下你做的项目吧数据统一管理平台,我挺感兴趣的,你说说吧我大概知道是怎么回事了,java web这块你参与开发了吗你刚刚项目提到了元数据,你能说说hive的元数据管理嘛,对它了解嘛还是hive,你对hive有哪些原理性了解呢知道AST、operator tree这些长什么样吗那你的hive转mr过程是怎么了解的呢?除了谓词下推,还能说说其它的优化嘛?别说数据倾斜的调优jvm了解不,说下垃圾收集算法平常用java和scala语言哪个多点如果我现在要使用map集合,你觉得哪种适合多线程情况下进行访问如何去监控线程Spark 出现OOM,你觉得该怎么进行调优呢?不去动jvm的参数你觉得join该怎么优化你对未来的规划是什么?(五年内)你也就是走技术路线咯

4.​美图二面
ThriftServer的HA如何去实现,能说下实现的思路嘛说下Zookeeper的watch机制是如何实现的嘛?场景题:
     现在有1个client,2个server,当我动态加入一台机器,或者删除一台机器,或者某台机器宕机了,client该如何去感知到,说下实现思路(不使用Zookeeper),如何通信,说说具体实现?
 
5.七牛云面试题
快排hive和hdfs之间的联系inode和文件描述符linux指令如何创建文件http中header中放入key value 有什么变化系统调用和库函数区别http缓冲实现机智session cookie  区别进程间通信方式jsp本质http请求状状态get post put remove数据库join 数据库引擎hibernate和mybiters区别jvm垃圾回收hive和关系型数据库区别hive实现原理spark与mr的区别 查看全部
以下面试题都是群里小伙伴提供的,现场真题(包含校招题)
1.网易大数据面试题
  • 说说项目
  • Spark哪部分用得好,如何调优
  • Java哪部分了解比较好
  • 聊聊并发,并发实现方法,volatile关键字说说
  • HashMap的底层原理
  • 为什么要重写hashcode和equals
  • 说说jvm
  • 各个垃圾收集器运用在什么情形
  • jvm调优
  • 说说io
  • 为什么考虑转行呢?是因为原专业不好就业吗?


2.蚂蚁金服面试题
  • 小文件的合并
  • MR与Spark的区别
  • 关注哪些名人的博客
  • 对大数据领域有什么自己的见解
  • 平常怎么学习大数据的
  • StringBuilder与StringBuffer的区别
  • HashMap与Hashtable的区别
  • 谈谈你对树的理解
  • 数据库索引的实现
  • jvm的内存模型
  • jvm的垃圾收集器
  • jvm的垃圾收集算法
  • HDFS架构
  • HDFS读写流程
  • Hadoop3.0做了哪些改进
  • 谈谈YARN
  • 为什么项目选择使用Spark,你觉得Spark的优点在哪里
  • 了解Flink与Storm嘛,他们与Spark Streaming的区别在哪里
  • 1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来

 
3.美图面试题
  • 为什么选择美图,你知道美图地点在哪里嘛
  • 介绍下你做的项目吧
  • 数据统一管理平台,我挺感兴趣的,你说说吧
  • 我大概知道是怎么回事了,java web这块你参与开发了吗
  • 你刚刚项目提到了元数据,你能说说hive的元数据管理嘛,对它了解嘛
  • 还是hive,你对hive有哪些原理性了解呢
  • 知道AST、operator tree这些长什么样吗
  • 那你的hive转mr过程是怎么了解的呢?
  • 除了谓词下推,还能说说其它的优化嘛?别说数据倾斜的调优
  • jvm了解不,说下垃圾收集算法
  • 平常用java和scala语言哪个多点
  • 如果我现在要使用map集合,你觉得哪种适合多线程情况下进行访问
  • 如何去监控线程
  • Spark 出现OOM,你觉得该怎么进行调优呢?不去动jvm的参数
  • 你觉得join该怎么优化
  • 你对未来的规划是什么?(五年内)
  • 你也就是走技术路线咯


4.​美图二面
  • ThriftServer的HA如何去实现,能说下实现的思路嘛
  • 说下Zookeeper的watch机制是如何实现的嘛?
  • 场景题:

     现在有1个client,2个server,当我动态加入一台机器,或者删除一台机器,或者某台机器宕机了,client该如何去感知到,说下实现思路(不使用Zookeeper),如何通信,说说具体实现?
 
5.七牛云面试题
  • 快排
  • hive和hdfs之间的联系
  • inode和文件描述符
  • linux指令如何创建文件
  • http中header中放入key value 有什么变化
  • 系统调用和库函数区别
  • http缓冲实现机智
  • session cookie  区别
  • 进程间通信方式
  • jsp本质
  • http请求状状态
  • get post put remove
  • 数据库join 
  • 数据库引擎
  • hibernate和mybiters区别
  • jvm垃圾回收
  • hive和关系型数据库区别
  • hive实现原理
  • spark与mr的区别

[蚂蚁金服] 诚招 Java /大数据研发,上海/北京/杭州, p6/7/8

招聘hbasegroup 发表了文章 • 0 个评论 • 231 次浏览 • 2019-11-12 17:56 • 来自相关话题

Java/大数据技术宅赶紧看过来~~ 简历请投递 qing.zhengjq@antfin.com ,微信 Asuka4J,团队 Lead 直接评估安排面试~~

我们所在大团队主要负责蚂蚁全站系统的“高可用(从线程级到 IDC 级的故障自动定位和恢复决策)”和“资损防控(所有业务资金流的实时自动核对和止损)”这两大领域。在庞大的系统规模、频繁的变更频率、错综复杂的业务流程>大背景下,可以预计这两项工作已经无法通过堆人的方式应对,即便是很有经验的专家。所以大方向是以数据驱动和智能化的思路破局,一方面需要构建夯实的数据基础设施,支撑全站全量数据的高可靠近线传输、存储与计算。另一方面则需要结合场景去运用业界较为前沿的算法理论经验,实现问题域的智能分析,达到人工辅助或自动决策。当下整个体系已有一定基础,同时也存在很大的探索空间,如果 1.你本善于工程,同时又期望探索数据和智能化的实际>应用,2.你本善于算法,但苦于没有大规模的场景去施展落地,我们觉得都是蛮好的一个尝试方向。

职位描述:

1. 负责蚂蚁金服数据基础设施的研发建设,包括基础的监控时序数据,资金流数据,系统变更数据等。
2. 对全链路稳定性和数据质量负责,进行实时监控,分析,最终提供保障数据的质量,包括低延时,高可用等指标。
3. 参与数据流建设,满足实时数据流上的各种复杂计算需求,包括图计算,多流合并,以及各种常见 transform 计算。
4. 对接数据平台上的各类技术风险防控业务方,满足不断发展的业务需求。
5. 对接各类数据源端系统,包括蚂蚁技术体系内部的各种队列,关系数据库,日志等系统。

职位要求:

1. 扎实的计算机专业基础,包括算法和数据结构,操作系统,计算机网络,计算机体系结构,数据库等。
2. 扎实的 Java 或相关编程语言基础(我们以 Java 为主),良好的编程素养,对代码有美感和极致的追求。
3. 理解实时流计算( 比如 Spark/Storm/Flink )或海量数据处理( 比如 Hadoop/HBase/Hive )相关经验优先考虑。
4. 掌握机器学习、数据挖掘或深度学习的原理和相关算法优先考虑。
5. 强烈的技术热情和工作责任感,热衷于创新和分享,逻辑清晰并具备批判性思维能力和习惯。
6. 计算机软件或相关专业毕业,本科或以上学历; 211/985 优先。

工作地点:

上海,上海中心大厦
北京,环球金融中心
杭州,黄龙国际大厦

编程语言:

Java

招聘范围:

社招( P6+ ~ P8 ) 查看全部

IMG_0136.JPG

Java/大数据技术宅赶紧看过来~~ 简历请投递 qing.zhengjq@antfin.com ,微信 Asuka4J,团队 Lead 直接评估安排面试~~

我们所在大团队主要负责蚂蚁全站系统的“高可用(从线程级到 IDC 级的故障自动定位和恢复决策)”和“资损防控(所有业务资金流的实时自动核对和止损)”这两大领域。在庞大的系统规模、频繁的变更频率、错综复杂的业务流程>大背景下,可以预计这两项工作已经无法通过堆人的方式应对,即便是很有经验的专家。所以大方向是以数据驱动和智能化的思路破局,一方面需要构建夯实的数据基础设施,支撑全站全量数据的高可靠近线传输、存储与计算。另一方面则需要结合场景去运用业界较为前沿的算法理论经验,实现问题域的智能分析,达到人工辅助或自动决策。当下整个体系已有一定基础,同时也存在很大的探索空间,如果 1.你本善于工程,同时又期望探索数据和智能化的实际>应用,2.你本善于算法,但苦于没有大规模的场景去施展落地,我们觉得都是蛮好的一个尝试方向。

职位描述:

1. 负责蚂蚁金服数据基础设施的研发建设,包括基础的监控时序数据,资金流数据,系统变更数据等。
2. 对全链路稳定性和数据质量负责,进行实时监控,分析,最终提供保障数据的质量,包括低延时,高可用等指标。
3. 参与数据流建设,满足实时数据流上的各种复杂计算需求,包括图计算,多流合并,以及各种常见 transform 计算。
4. 对接数据平台上的各类技术风险防控业务方,满足不断发展的业务需求。
5. 对接各类数据源端系统,包括蚂蚁技术体系内部的各种队列,关系数据库,日志等系统。

职位要求:

1. 扎实的计算机专业基础,包括算法和数据结构,操作系统,计算机网络,计算机体系结构,数据库等。
2. 扎实的 Java 或相关编程语言基础(我们以 Java 为主),良好的编程素养,对代码有美感和极致的追求。
3. 理解实时流计算( 比如 Spark/Storm/Flink )或海量数据处理( 比如 Hadoop/HBase/Hive )相关经验优先考虑。
4. 掌握机器学习、数据挖掘或深度学习的原理和相关算法优先考虑。
5. 强烈的技术热情和工作责任感,热衷于创新和分享,逻辑清晰并具备批判性思维能力和习惯。
6. 计算机软件或相关专业毕业,本科或以上学历; 211/985 优先。

工作地点:

上海,上海中心大厦
北京,环球金融中心
杭州,黄龙国际大厦

编程语言:

Java

招聘范围:

社招( P6+ ~ P8 )

互联网公司大数据面试题参考指南

sparkhbasegroup 发表了文章 • 0 个评论 • 1869 次浏览 • 2018-09-17 09:59 • 来自相关话题

以下面试题都是群里小伙伴提供的,现场真题(包含校招题)
1.网易大数据面试题
说说项目Spark哪部分用得好,如何调优Java哪部分了解比较好聊聊并发,并发实现方法,volatile关键字说说HashMap的底层原理为什么要重写hashcode和equals说说jvm各个垃圾收集器运用在什么情形jvm调优说说io为什么考虑转行呢?是因为原专业不好就业吗?

2.蚂蚁金服面试题
小文件的合并MR与Spark的区别关注哪些名人的博客对大数据领域有什么自己的见解平常怎么学习大数据的StringBuilder与StringBuffer的区别HashMap与Hashtable的区别谈谈你对树的理解数据库索引的实现jvm的内存模型jvm的垃圾收集器jvm的垃圾收集算法HDFS架构HDFS读写流程Hadoop3.0做了哪些改进谈谈YARN为什么项目选择使用Spark,你觉得Spark的优点在哪里了解Flink与Storm嘛,他们与Spark Streaming的区别在哪里1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来
 
3.美图面试题
为什么选择美图,你知道美图地点在哪里嘛介绍下你做的项目吧数据统一管理平台,我挺感兴趣的,你说说吧我大概知道是怎么回事了,java web这块你参与开发了吗你刚刚项目提到了元数据,你能说说hive的元数据管理嘛,对它了解嘛还是hive,你对hive有哪些原理性了解呢知道AST、operator tree这些长什么样吗那你的hive转mr过程是怎么了解的呢?除了谓词下推,还能说说其它的优化嘛?别说数据倾斜的调优jvm了解不,说下垃圾收集算法平常用java和scala语言哪个多点如果我现在要使用map集合,你觉得哪种适合多线程情况下进行访问如何去监控线程Spark 出现OOM,你觉得该怎么进行调优呢?不去动jvm的参数你觉得join该怎么优化你对未来的规划是什么?(五年内)你也就是走技术路线咯

4.​美图二面
ThriftServer的HA如何去实现,能说下实现的思路嘛说下Zookeeper的watch机制是如何实现的嘛?场景题:
     现在有1个client,2个server,当我动态加入一台机器,或者删除一台机器,或者某台机器宕机了,client该如何去感知到,说下实现思路(不使用Zookeeper),如何通信,说说具体实现?
 
5.七牛云面试题
快排hive和hdfs之间的联系inode和文件描述符linux指令如何创建文件http中header中放入key value 有什么变化系统调用和库函数区别http缓冲实现机智session cookie  区别进程间通信方式jsp本质http请求状状态get post put remove数据库join 数据库引擎hibernate和mybiters区别jvm垃圾回收hive和关系型数据库区别hive实现原理spark与mr的区别 查看全部
以下面试题都是群里小伙伴提供的,现场真题(包含校招题)
1.网易大数据面试题
  • 说说项目
  • Spark哪部分用得好,如何调优
  • Java哪部分了解比较好
  • 聊聊并发,并发实现方法,volatile关键字说说
  • HashMap的底层原理
  • 为什么要重写hashcode和equals
  • 说说jvm
  • 各个垃圾收集器运用在什么情形
  • jvm调优
  • 说说io
  • 为什么考虑转行呢?是因为原专业不好就业吗?


2.蚂蚁金服面试题
  • 小文件的合并
  • MR与Spark的区别
  • 关注哪些名人的博客
  • 对大数据领域有什么自己的见解
  • 平常怎么学习大数据的
  • StringBuilder与StringBuffer的区别
  • HashMap与Hashtable的区别
  • 谈谈你对树的理解
  • 数据库索引的实现
  • jvm的内存模型
  • jvm的垃圾收集器
  • jvm的垃圾收集算法
  • HDFS架构
  • HDFS读写流程
  • Hadoop3.0做了哪些改进
  • 谈谈YARN
  • 为什么项目选择使用Spark,你觉得Spark的优点在哪里
  • 了解Flink与Storm嘛,他们与Spark Streaming的区别在哪里
  • 1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来

 
3.美图面试题
  • 为什么选择美图,你知道美图地点在哪里嘛
  • 介绍下你做的项目吧
  • 数据统一管理平台,我挺感兴趣的,你说说吧
  • 我大概知道是怎么回事了,java web这块你参与开发了吗
  • 你刚刚项目提到了元数据,你能说说hive的元数据管理嘛,对它了解嘛
  • 还是hive,你对hive有哪些原理性了解呢
  • 知道AST、operator tree这些长什么样吗
  • 那你的hive转mr过程是怎么了解的呢?
  • 除了谓词下推,还能说说其它的优化嘛?别说数据倾斜的调优
  • jvm了解不,说下垃圾收集算法
  • 平常用java和scala语言哪个多点
  • 如果我现在要使用map集合,你觉得哪种适合多线程情况下进行访问
  • 如何去监控线程
  • Spark 出现OOM,你觉得该怎么进行调优呢?不去动jvm的参数
  • 你觉得join该怎么优化
  • 你对未来的规划是什么?(五年内)
  • 你也就是走技术路线咯


4.​美图二面
  • ThriftServer的HA如何去实现,能说下实现的思路嘛
  • 说下Zookeeper的watch机制是如何实现的嘛?
  • 场景题:

     现在有1个client,2个server,当我动态加入一台机器,或者删除一台机器,或者某台机器宕机了,client该如何去感知到,说下实现思路(不使用Zookeeper),如何通信,说说具体实现?
 
5.七牛云面试题
  • 快排
  • hive和hdfs之间的联系
  • inode和文件描述符
  • linux指令如何创建文件
  • http中header中放入key value 有什么变化
  • 系统调用和库函数区别
  • http缓冲实现机智
  • session cookie  区别
  • 进程间通信方式
  • jsp本质
  • http请求状状态
  • get post put remove
  • 数据库join 
  • 数据库引擎
  • hibernate和mybiters区别
  • jvm垃圾回收
  • hive和关系型数据库区别
  • hive实现原理
  • spark与mr的区别


中国HBase技术社区微信公众号:
hbasegroup

欢迎加入HBase生态+Spark社区钉钉大群