hbase是一个分布式的、面向列的数据库,它可以存储海量的结构化或半结构化的数据。hbase中的数据是按照表的形式组织的,每个表由多个行和列组成。要查看hbase中表的结构和数据,我们可以使用hbase shell中的scan命令。
scan命令的基本语法是:
其中,table是要扫描的表名,OPTIONS是一些可选的参数,用来控制扫描的范围、数量、格式等。下面我们介绍一些常用的OPTIONS:
1.STARTROW和STOPROW:指定扫描的起始行键和结束行键,可以用来限制扫描的范围。例如:
这条命令会扫描test表中从row1到row5(包含)之间的所有行。
1.LIMIT:指定扫描的最大行数,可以用来控制扫描的数量。例如:
这条命令会扫描test表中最多10行数据。
1.COLUMNS:指定扫描的列或列族,可以用来过滤不需要的列。例如:
这条命令会扫描test表中只包含cf1:col1列和cf2列族的数据。
1.FILTER:指定一个过滤器,可以用来根据一些条件筛选数据。例如:
这条命令会扫描test表中只包含值为abc的数据。
1.TIMESTAMP:指定一个时间戳,可以用来查看某个时间点的数据。例如:
这条命令会扫描test表中在2021年6月1日0点0分0秒之前(不包含)写入的数据。
1.VERSIONS:指定一个版本数,可以用来查看多个版本的数据。例如:
这条命令会扫描test表中每个单元格最多3个版本的数据。
除了以上这些参数,还有一些其他的参数,如RAW、CACHE、REVERSED等,可以参考hbase官方文档进行了解。
使用scan命令时,我们还可以使用一些特殊符号来简化输入,如: