什么是hive(什么是hive的元数据)

本篇文章给大家谈谈什么是hive,以及什么是hive的元数据对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。

本文目录一览:

HIVE 是什么

就字面意改告思来说,hive 的本义是蜂巢或蜂群,常用来比喻像蜂巢一般熙熙攘攘的地方。至于是什么游戏会轮备员需要提供更多的内核桐明容才可以判定。

hive和mysql的区别是什么?

1、查询语言不同:

hive是hql语言,mysql是sql语句;

2、数据存储位置不同:

hive是把数据存储在hdfs上,而mysql数据是存仔橘数储在自己的系念首统中;

3、数据格式不同:

hive数据格式可以用户自定义,mysql有自己的系统定义格式;

4、数据更新不同:

hive不支持数据伍胡更新,只可以读,不可以写,而sql支持数据更新。

[img]

“hive”这个词语是什么意思?

hiven. 蜂巢; 蜂箱; 蜂群; 喧闹地区; vt. 使(蜂)入蜂箱; 贮(蜜)于蜂箱中; 储备,哗颤积累;

hivesn. 蜂巢; 蜂群; 医荨麻疹野嫌; 蜂颂芦手箱( hive的名词复数 ); 喧闹地区; v. 使(蜂)入

hivern. 养蜂人; 招蜂器;

Hives [人名] 海夫斯;

hive off (蜜蜂)分群;

Hive是什么,Hive与关系型数据库的区别

Hive与传统的关系型数据库有很多类似的地方,例如对SQL的支持。但是其基于HDFS与裤衫哗MapReduce的事实使得塌虚它与传统的数据库在很多方面有很大的不同,在一些特性的支持下也受到底层架构的限制,但是这些限制随着版本迭代正在胡行不断被消除,使得Hive看起来越来越像传统的数据库。

apache hive 是什么意思

Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的需求而产生和发展的。那么,到底什么是Hive,我们先看看Hive官网Wiki是如何介绍Hive的

The Apache HiveTM data warehouse software facilitates querying and

managing large datasets residing in distributed storage. Built on top of

Apache HadoopTM, it provides:

(1)、Tools to enable easy data extract/transform/load (ETL)

(2)、A mechanism to impose structure on a variety of data formats

(3)、Access to files stored either directly in Apache HDFSTM or in other

data storage systems such as Apache HBaseTM

(4)、Query execution via MapReduce

上面拍判英文的大致意思是:Apache Hive数据仓库软件提供对存储在分布式中的大型数据集的查询和管理,它本身是建立在Apache

Hadoop只上,主御穗要提供以下功能:它提镇贺卜供了一系列的工具,可用来对数据进行提取/转化/加载(ETL);是一种可以存储、查询和分析存储在HDFS(或者HBase)中的大规模数据的机制;查询是通过MapReduce来完成的(并不是所有的查询都需要MapReduce来完成,比如select

* from XXX就不需要;在Hive0.11对类似select a,b from

XXX的查询通过配置也可以不通过MapReduce来完成,具体怎么配置请参见本博客《Hive:简单查询不启用Mapreduce

hadoop和hive之间有什么关系?

hive是hadoop的延申。

hadoop是一个分布式的软件处理框架,hive是一个提供了查询功能的数据仓库,而hadoop底层的hdfs为hive提供了数据存储。

hive将用户提交的SQL解析成mapreduce任务供hadoop直接运行,结合两者的优势,进行数据决策。一个擅长大数据并行计算,一个支持SQL数据查询,方便是显而易见的。但hive只要还是读操作

有了Hive之后,人们发现SQL对比Java有巨大的优势。一个是它太容易写了。刚才词频的东西,灶举正用SQL描述就只有一两MapReduce写起来大约要几十上百行。

扩展资料:

它主要有以下几个优点 :

1、高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖 。

2、高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中 。

3、高效答数性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。

4、高容错性。Hadoop能够自动保存数隐悔据的多个副本,并且能够自动将失败的任务重新分配。

低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,hadoop是开源的,项目的软件成本因此会大大降低 。

Hadoop带有用Java语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。Hadoop 上的应用程序也可以使用其他语言编写,比如 C++ 。

关于什么是hive和什么是hive的元数据的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

标签列表