yangjifei

yangjifei

士为知己者死

北京市 朝阳区 计算机软、硬件/互联网/IT

威望 : 1 积分 : 275 赞同 : 2 感谢 : 0

更多 »回复

1

可以将csv文件上传至hdfs,然后使用spark读取csv,创建rdd,再使用phoenix的spark驱动,批量保存数据到hbase中。 举例 第一种方式:saveRDDs [code]import org.apache.spark.SparkContex...

0

也可以调用MR: hbase org.apache.hadoop.hbase.mapreduce.RowCounter ‘tablename’

0

是否可以使用hbase shell脚本实现?

1

1、增加rdd的分区有几种方式:  (1)修改spark.default.parallelism的默认值    (2)repartition重分区   2、topic分区的最大数量<= min(单台kafka集群设备的core),因为有多少分区就有多大的...

0

spark hbase connector 1、github地址 :[url=https://github.com/hortonworks-spark/shc]shc[/url] 2、文章说明:[url=https://hortonworks.com/blog...

更多 »发问

没有内容

发问

回复

文章

最新动态

详细资料

个人成就:

威望: 1 积分: 275 赞同: 2 感谢: 0

最后活跃:
2019-04-03 18:04
更多 » 关注 200

acsql Jepson ProgramGeek beyond wpp

更多 » 4 人关注

Tiakon anbbrr Marshal丶张 tu

主页访问量 : 676 次访问

中国HBase技术社区微信公众号:
hbasegroup

欢迎加入HBase生态+Spark社区钉钉大群