HBase怎样进行rowKey时间后缀的范围查询

rowKey的格式是:uid+时间戳,想通过scan+filter的方式将一个月的数据导入到Spark进行分析,filter应该怎么写?
已邀请:

ProgramGeek

赞同来自:

直接用Scan,强烈建议不要用Filter,使用Filter查询很慢,Scan能够支持通配符,你设计下start跟end即可~

wwqu1020

赞同来自:

问题已解决,自己实现了一个过滤函数。
使用通配符的Scan方法行不通,因为uid是rowkey的前缀,使用通配符对时间进行过滤的结果会出问题。
使用start跟end的方法也是一种方法,先把uid做到一张表里,然后读取每个uid,配合时间构造start跟end进行范围查询。

要回复问题请先登录注册


中国HBase技术社区微信公众号:
hbasegroup

欢迎加入HBase生态+Spark社区钉钉大群