大数据课本:
HBase常用Shell命令
在使用具体的Shell命令操作HBase数据之前,需要首先启动Hadoop,然后再启动HBase,并且启动HBase Shell,进入Shell命令提示符状态,具体命令如下:
$ cd /usr/local/hadoop $ ./sbin/start-dfs.sh $ cd /usr/local/hbase $ ./bin/start-hbase.sh $ ./bin/hbase shell
1 在HBase中创建表
假设这里要创建一个表student,该表包含Sname
、Ssex
、Sage
、Sdept
、course
等字段。需要注意的是,在关系型数据库(比如MySQL)中,需要首先创建数据库,然后再创建表,但是,在HBase数据库中,不需要创建数据库,只要直接创建表就可以。在HBase中创建student表的Shell命令如下:
hbase> create 'student','Sname','Ssex','Sage','Sdept','course'
对于HBase而言,在创建HBasae表时,不需要自行创建行健,系统会默认一个属性作为行键,通常是把put命令操作中跟在表名后的第一个数据作为行健。
创建完student
表后,可通过describe
命令查看student
表的基本信息,命令如下:
hbase>describe 'student'
可以使用list命令查看当前HBase数据库中已经创建了哪些表,命令如下:
hbase> list
2 添加数据
HBase使用put命令添加数据,一次只能为一个表的一行数据的一个列(也就是一个单元格,单元格是HBase中的概念)添加一个数据,所以,直接用Shell命令插入数据效率很低,在实际应用中,一般都是利用编程操作数据。因为这里只要插入1条学生记录,所以,我们可以用Shell命令手工插入数据,命令如下:
hbase> put 'student','95001','Sname','LiYing'
上面的put命令会为student表添加学号为95001
、名字为LiYing
的一个单元格数据,其行键为95001
,也就是说,系统默认把跟在表名student后面的第一个数据作为行健。
下面继续添加4个单元格的数据,用来记录LiYing
同学的相关信息,命令如下:
hbase> put 'student','95001','Ssex','male' hbase> put 'student','95001','Sage','22' hbase> put 'student','95001','Sdept','CS' hbase> put 'student','95001','course:math','80'
3 查看数据
HBase中有两个用于查看数据的命令:
-
get命令:用于查看表的某一个单元格数据;
-
scan命令:用于查看某个表的全部数据。
比如,可以使用如下命令返回student表中95001行的数据:
hbase> get 'student','95001'
下面使用scan命令查询student表的全部数据:
hbase> scan 'student'
4 删除数据
在HBase中用delete以及deleteall
命令进行删除数据操作,二者的区别是:delete
命令用于删除一个单元格数据,是put的反向操作,而 deleteall
命令用于删除一行数据。
首先,使用delete命令删除student表中95001这行中的Ssex
列的所有数据,命令如下:
hbase > delete 'student','95001','Ssex'
然后,使用deleteall
命令删除student表中的95001
行的全部数据,命令如下:
hbase> deleteall 'student','95001'
5 删除表
删除表需要分两步操作,第一步先让该表不可用,第二步删除表。比如,要删除student
表,可以使用如下命令:
hbase> disable 'student' hbase> drop 'student'
6 查询历史数据
在添加数据时,HBase会自动为添加的数据添加一个时间戳。在修改数据时,HBase会为修改后的数据生成一个新的版本(时间戳),从而完成“改”操作,旧的版本依旧保留,系统会定时回收垃圾数据,只留下最新的几个版本,保存的版本数可以在创建表的时候指定。
为了查询历史数据,这里创建一个teacher表,首先,在创建表的时候,需要指定保存的版本数(假设指定为5),命令如下:
hbase> create 'teacher',{NAME=>'username',VERSIONS=>5}
然后,插入数据,并更新数据,使其产生历史版本数据,需要注意的是,这里插入数据和更新数据都是使用put命令,具体如下:
hbase> put 'teacher','91001','username','Mary' hbase> put 'teacher','91001','username','Mary1' hbase> put 'teacher','91001','username','Mary2' hbase> put 'teacher','91001','username','Mary3' hbase> put 'teacher','91001','username','Mary4' hbase> put 'teacher','91001','username','Mary5'
查询时,默认情况下回显示当前最新版本的数据,如果要查询历史数据,需要指定查询的历史版本数,由于上面设置了保存版本数为5,所以,在查询时制定的历史版本数的有效取值为1到5,具体命令如下:
hbase> get 'teacher','91001',{COLUMN=>'username',VERSIONS=>5} hbase> get 'teacher','91001',{COLUMN=>'username',VERSIONS=>3}
7 退出HBase数据库
最后退出数据库操作,输入exit命令即可退出,命令如下:
hbase> exit
注意,这里退出HBase数据库是退出HBase Shell,而不是停止HBase数据库后台运行,执行exit后,HBase仍然在后台运行,如果要停止HBase运行,需要使用如下命令:
$ bin/stop-hbase.sh
作业:使用Shell命令完成以下内容。(每道题目不仅要给出命令还要有运行结果截图)
- 创建《王者荣耀》游戏玩家信息表gamer,包含列族personalInfo(个人信息)、recordInfo(战绩信息)、assetsInfo(资产信息)。
create 'gamer', 'personalInfo', 'recordInfo', 'assetsInfo'
-
查看表的详细信息
describe 'gamer'
-
修改gamer表中recordInfo列族的TTL信息设置为180天。
alter 'gamer',{NAME=>'recordInfo',TTL=>'15552000'}
-
向gamer表添加数据
personalInfo | recordInfo | assetInfo | ||
nickname | gameID | ranking | integral | |
row-001 | QGhappy.Snow | 000000 | One | 10000 |
row-002 | XQMaster | 111111 | Two | 20000 |
put 'gamer','row-001','personalInfo:nickname','QGhappy.Snow'
put 'gamer','row-001','recordInfo:ranking','one'
put'gamer','row-001','assetsInfo:integral','10000'
put 'gamer','row-001','personalInfo:gameId','000000'
put 'gamer','row-002','personalInfo:nickname','XQMaster'
put 'gamer','row-002','recordInfo:ranking','two'
put 'gamer','row-002','assetsInfo:integral','20000'
put 'gamer','row-002','personalInfo:gameId','111111'
-
查询gamer表中所有数据
scan 'gamer'
-
查找gamer表中行键为row-001的所有单元
get 'gamer', 'row-001'
-
查找gamer表中行键为row-001,列键为personalInfo:nickname的单元
get 'gamer', 'row-001', {COLUMN => 'personalInfo:nickname'}
-
查找gamer表中行键为row-001,列族为personalInfo的单元
get 'gamer', 'row-001', {COLUMN => 'personalInfo'}
-
删除gamer表中行键为row-001,列键为personalInfo:nickname的单元数据
delete 'gamer', 'row-001', 'personalInfo:nickname'
-
删除gamer表中行键为row-001的一行数据
deleteall 'gamer', 'row-001'
-
删除gamer表中所有数据。
truncate 'gamer'
-
删除gamer表
disable 'gamer'
drop 'gamer'