数据可视化-Zeppelin安装和连接HIVE

Zeppelin 安装

  1. zeppelin下载 官网地址:

点击这三个链接都是可以下载的,BACKUP SITES可能会快一点。

  1. 下载完后进行解压:
tar -zxvf zeppelin-0.10.0-bin-all.tgz
  1. 修改配置文件:
> cd conf
> mv zeppelin-env.sh.template zeppelin-env.sh
> mv zeppelin-site.xml.template zeppelin-site.xml

> vi zeppelin-site.xml

# 将默认的127.0.0.1改为0.0.0.0 否则默认情况下只能在本机访问zeppline
<property>
 <name>zeppelin.server.addr</name>
 <value>0.0.0.0</value>
 <description>Server binding address</description>
</property>
  1. 添加jar包 zeppelin默认是没有集合HIVE的依赖包,所以需要手动将依赖添加到interpreter/jdbc目录下。否则运行时会报错。
> cd interpreter/jdbc
> cp /data/soft/apache-hive-3.1.2-bin/lib/hive-jdbc*  .
> cp /data/soft/hadoop-3.2.0/share/hadoop/common/hadoop-common-3.2.0.jar  .
  1. 启动
>  bin/zeppelin-daemon.sh start
  1. 访问
http://127.0.0.1:8080/
  1. 停止
bin/zeppelin-daemon.sh stop

查询HIVE,生成报表

配置hive的基本信息

  1. 首先要配置hive的基本信息
  2. 搜索 jdbc,点击edit配置里面的基本信息: 注意:配置前要先启动hive的hiveserver2服务,否则zeppelin连不上hive
  1. 配置hive的相关信息
    default.url :jdbc:hive2://192.168.182.103:10000, 里面的ip是启动hiveserver2服务的机 器ip default.user:root, 用户名 default.password :密码,随便填即可 default.driver : org.apache.hive.jdbc.HiveDriver , hive驱动包
  1. 最后然后点击save即可。

hive连接的基本信息就配置完了。

接下去就是创建note,使用sql进行查询了。

查询

  1. 创建一个note,即工作台的概念。

弹出窗里:

    填写note 的名称, Default Interpreter 选中 jdbc 最后点击create
  1. 写sql查询 对于查询的结果,可以使用表格,图标等各种形式查看。
经验分享 程序员 微信小程序 职场和发展