hbase rowcounter如何设置并行任务数

hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'tablename'
已邀请:

guokaiwhu - DBA@Netease

赞同来自:

可以指定-Dmapreduce.job.queuename = < Your Q Name which you have SUBMIT access>,使用独立的YARN集群资源来加快执行。

各鸥

赞同来自:

rowcounter是使用MR来计算表行数的,增加并行数就是增加map的数量,map的数量是根据hbase表的region数确定的,一个region一个map,可以重写TableInputFormat的getSplits方法增加map数

要回复问题请先登录注册


中国HBase技术社区微信公众号:
hbasegroup

欢迎加入HBase生态+Spark社区钉钉大群