hive简介
hive的设计思想(本质是一个翻译器)
上传安装包
解压,查看
运行hive(一定要启动hadoop,是有依赖关系的。)
测试启动方法,和建表
文件创建很上传到hdfs,直接上传到hive表的目录上去
创建一个文件,并在文件内写入数据。最后上传到hdfs
注意上传目录可以使用hive的目录
这样hive就有了这个文件
测试hive的查询
hive导入数据(load data 语句)
除了select * 以外其余的语句都会变成mapreduce。执行。
hive的表(内部表/外部表)
像我们自己用语句建立的表,存放在/user/hive/warehouse/**表,如此算是内部表。
例如下创建一个外部表
创建文件,做数据填充,检查数据
内部表和外部表的区别,内部表删除会直接删除,数据也会直接删除,但是外部表删除后只是把原数据库的的地址删除掉,但是hdfs的数据是不会删除的。
关联查询
结果如下
元数据库配置
这个元数据库是hive自带的,名字叫做derby数据库。只能单实例运行,如下
为了解决如果已经有客户端链接,就不能再次链接的问题,所以我们要求修改原数据库的配置
配置如下,进入conf文件夹,添加文件hive-site.xml
配置文件填充如下:切记将mysql的驱动配置一个到/lib下,否则mysql无法启动。
重启hive,将数据源改变为mysql。
看都看了,点个关注呗!