hiveserver2(hiveserver2内存溢出)

本篇文章给大家谈谈hiveserver2,以及hiveserver2内存溢出对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。

本文目录一览:

Hive扩展功能(四)--HiveServer2服务

/br

/br稿散

从 Hive 2.0 版本开始衫大,为 HiveServer2 提供了一个简单的 WEBUI 界面,界面中可以直观的看到当前链接的会话、历史日志、配置参数以及度量或敬竖信息, 所以配置一个 HiveServer2 的UI端口

/br

/br

/br

连接hiveserver2-Hive用户配置

前几天初次接触Hive,需要连接hiveserver2进行一些操作,发现问题似乎并不是很简单,查了好多资料才解决了问题,特做记录。

操作之前做必要假设:

下面正式开始

其中, hadoopuser 为上面提到的运行Hadoop namenode进程的用户名。

使用beeline连接hiveserver2

这里的用户名 hive2 和密码 hive2 自然核逗乱便是前面在hive的配置文件 hive-site.xml 中配置的用户名和密码啦

先启动beeline

然后在beeline中连接hiveserver2:

接着输入hive用户名和密码即可。

怎么说呢,这篇博客质量非常一般,很不符合我追根问底的性格,不说为何直接给配置,但是为什么还要写出来呢?因为我发现盲目追求质量,对每一个概念指早都解释说明得比较清楚确实很花时间,所以导致我最近虽然有很多想写的但是却不敢写出来。一方面是怕自改档己写得不好,误导别人,一方面是确实没有太多时间打磨(也可能是我太懒了,蛤蛤蛤蛤)。

不过细细一想好像违背了自己当初记录工作、学习中的小事的初衷。所以我单方面决定以后的博客就随意一点啦,想写啥写啥(???),不过也会穿插一些经过自己仔细打磨的"私货"。

所以要是有哪里表述得不对的地方还请大家多多包含,也欢迎各位不吝赐教 :smile:

CDH Hive 配置HiveServer2

翻译: 

版本: 5.14.2

在使用HiveServer2之前,您必须进行以下配置更改。不这样做可能会掘悄导致不可预知的行为。

警告: HiveServer1在CDH 5.3起不推荐使用,并且将在未来的CDH版本中删除。HiveServer1的用户应该尽快升级到 HiveServer2 。

重要提示:这些数字只是一般性指导,可能会受到诸如列数,分区,复杂联接和客户端活动等因素的影响。根据您的预期部署,通过测试进行优化以达到您的环境的判吵渣最佳值。

有关为HiveServer2配置堆以及Hive Metastore和Hive客户端的信息,请参阅 Hive组件的堆大小和垃圾收集 以及以下视频:

解决HiveServer2服务崩溃问题

当您启动视频,请点击YouTube上在播放器窗口的右下角看它在YouTube上,你可以调整它的大小更清晰的观看。 (!--)

您必须正确配置并启用Hive的表锁管理器。这需要安装ZooKeeper并设置一个ZooKeeper集合; 请参阅 ZooKeeper安装 。

重要提示:如果不这样做将会阻止HiveServer2处理并发查询请求,并可能导致数据损坏。

通过设置属性启用锁管理器 /etc/hive/碰尺conf/hive-site.xml 如下所示(用实例中的实际ZooKeeper节点名替换):

重要提示:启用表锁管理器而不指定有效的Zookeeper法定节点列表将导致不可预知的行为。确保两个属性都已正确配置。

(如果您仍在使用HiveServer1,还需要上述设置。不推荐使用HiveServer1;尽快迁移到HiveServer2。)

如果ZooKeeper没有使用ClientPort默认值,你需要设置 hive.zookeeper.client.port 与ZooKeeper使用的值相同。检查/etc/zookeeper/conf/zoo.cfg 以找到ClientPort值。如果ClientPort 设置为除2181(默认值)以外的任何值,设置hive.zookeeper.client.port 。例如,如果ClientPort 设置为2222,设置 hive.zookeeper.client.port 也是2222:

HiveServer2和HiveServer1的连接URL格式和驱动程序类别不同:

HiveServer2可以 配置 为验证所有连接; 默认情况下,它允许任何客户端连接。HiveServer2支持 Kerberos 或 LDAP 身份验证; 配置属性为hive.server2.authentication 。您还可以配置 可插入身份验证 ,它允许您为HiveServer2使用自定义身份验证提供程序; 和 HiveServer2 Impersonation ,它允许用户以连接用户的身份执行查询和访问HDFS文件,而不是启动HiveServer2守护进程的超级用户。有关更多信息,请参阅 Hive安全配置 。

警告:由于并发和安全问题,HiveServer1和Hive CLI在CDH 5中不推荐使用,并且将在未来版本中删除。Cloudera建议您尽快迁移到 Beeline 和 HiveServer2 。如果您使用HiveServer2的Beeline,则不需要Hive CLI。

HiveServer2和HiveServer1可以在同一个系统上并发运行,共享相同的数据集。这允许您运行HiveServer1以支持使用本机HiveServer1 Thrift绑定的Perl或Python脚本。

默认情况下,HiveServer2和HiveServer1都绑定到端口10000,所以至少其中一个必须配置为使用不同的端口。您可以通过hive -site.xml中的hive.server2.thrift.port 设置HiveServer2的端口属性。例如:

您也可以通过设置这些环境变量来指定端口(以及HiveServer2的主机IP地址):

[img]

关于hiveserver2和hiveserver2内存溢出的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

标签列表