HBase表热点

请教一个HBase表热点问题:假如有一个宽表,其中某一行的数据很大,有数百万列,数据量也已经超过了Region的大小,如果该行数据成为读写的热点,对于这种情况应该怎么处理?
已邀请:

vinci_v

赞同来自: RM_running

1. 一行数据的大小如果超过了regionSize,应该没有办法再对这行数据所在的region进行分裂,将读写负载分配到多个机器上
2. 如果该行数据成为读写热点,可以考虑调整表结构,避免出现该超大行

guokaiwhu - DBA@Netease

赞同来自:

能想到的,是先手动做split,然后分散到多个节点。

Jepson

赞同来自:

用Phoenix的salted表,可以解决

beyond

赞同来自:

这种就是hbase错误使用的结果,对于大的文件存放在hdfs,一行数据结果导致跨分区,这样的就是最初最在使用hbase的错误

要回复问题请先登录注册


中国HBase技术社区微信公众号:
hbasegroup

欢迎加入HBase生态+Spark社区钉钉大群