在yarn上跑spark任务,NodeManager的Container频繁自杀

linefly 回复了问题 • 2 人关注 • 2 个回复 • 52 次浏览 • 1 天前 • 来自相关话题

spark dataset 聚合操作问题

Genieliu 回复了问题 • 1 人关注 • 1 个回复 • 39 次浏览 • 5 天前 • 来自相关话题

spark 数据倾斜解决思路?

回复

刘狗 发起了问题 • 1 人关注 • 0 个回复 • 106 次浏览 • 2019-03-20 18:28 • 来自相关话题

spark读取redis只能返回string类型的RDD,如果redis中存储protobuf序列化后的byte[],spark该怎么获取到结果的类型是byte[]的RDD

回复

刘狗 回复了问题 • 1 人关注 • 1 个回复 • 157 次浏览 • 2019-03-19 08:31 • 来自相关话题

在spark算子中开辟内存保存结果数据,这样做高效吗

muyuan 回复了问题 • 2 人关注 • 1 个回复 • 145 次浏览 • 2019-03-13 20:13 • 来自相关话题

hive 两个时间的时间差如何与7个工作日做比较?

回复

jinzhao 回复了问题 • 1 人关注 • 1 个回复 • 165 次浏览 • 2019-02-11 11:16 • 来自相关话题

structured streaming与kafka010整合的问题

回复

chensi 发起了问题 • 1 人关注 • 0 个回复 • 247 次浏览 • 2019-01-25 14:39 • 来自相关话题

spark-submit 提交的spark任务已经结束, 但是spark-submit没有结束

过往记忆 回复了问题 • 4 人关注 • 3 个回复 • 404 次浏览 • 2019-01-21 12:01 • 来自相关话题

请问,stremaming对接kafka,消费到的每批次的数据量由什么决定

回复

刘狗 发起了问题 • 1 人关注 • 0 个回复 • 241 次浏览 • 2019-01-17 15:37 • 来自相关话题

com.google.protobuf.LazyStringList faultCodes_ = com.google.protobuf.LazyStringArrayList.EMPTY;

回复

刘狗 发起了问题 • 1 人关注 • 0 个回复 • 174 次浏览 • 2019-01-11 10:53 • 来自相关话题

java.util.ConcurrentModificationException: KafkaConsumer is not safe for multi-threaded access

回复

刘狗 回复了问题 • 1 人关注 • 1 个回复 • 227 次浏览 • 2019-01-03 18:27 • 来自相关话题

如何保证sc读到的内容为空时,saveAsHadoopFile可以不生成空文件

过往记忆 回复了问题 • 2 人关注 • 1 个回复 • 217 次浏览 • 2018-12-29 10:15 • 来自相关话题

spark保存数据到Phoenix报错

回复

Marshal丶张 发起了问题 • 1 人关注 • 0 个回复 • 406 次浏览 • 2018-12-25 15:42 • 来自相关话题

关于kafka处理业务的消费者组规划和对资源的影响

回复

xumajie 发起了问题 • 1 人关注 • 0 个回复 • 175 次浏览 • 2018-12-25 12:05 • 来自相关话题

spark saveAsNewAPIHadoopDataset的方式入库hbase问题

Jepson 回复了问题 • 3 人关注 • 2 个回复 • 654 次浏览 • 2018-12-19 16:15 • 来自相关话题

yarn log打印日志中文显示问题

回复

刘狗 发起了问题 • 1 人关注 • 0 个回复 • 236 次浏览 • 2018-12-18 16:56 • 来自相关话题


中国HBase技术社区微信公众号:
hbasegroup

欢迎加入HBase生态+Spark社区钉钉大群