为什么要用HBase-HBase-@太阳城手机版资讯
你好,游客 登录
背景:
阅读新闻

为什么要用HBase

[日期:2018-01-25] 来源:NoSQL_博客园  作者: [字体: ]

  2006年google技术人员Fay Chang发布了一篇文章《Bigtable: A Distributed Storage System for Structured Data》。该文章向世人介绍了一种分布式的太阳城库,这种太阳城库可以在局部几台服务器崩溃的情况下继续提供高性能的服务。

太阳城手机版

  2007年Powerset 公司的工作人员基于此文研发了bigtable的java开源版本,即HBase。刚开始它只是太阳城娱乐的一部分。

  2008年HBase成为了Apache的顶级项目。HBase几乎实现了bigtable的所有特性。它被称为一个 开源的非关系型分布式太阳城库 。

  2010年HBase的开发速度打破一直以来跟Hadoop版本一致的惯例,因为HBase的版本发布速度已经超越了Hadoop。它的版本号一下从0.20.x 跳跃到了 0.89.x。

  为什么要用HBase

  HBase的存储是基于Hadoop的。Hadoop 是这些年崛起的拥有着高性能,高稳定,可管理的太阳城手机版应用平台。Hadoop已经快要变为太阳城手机版的代名词了,基于Hadoop衍生出了大量优秀的开源项目。

  Hadoop实现了一个分布式文件系统HDFS。HDFS有高容错性的特点,被设计用来部署在低廉的硬件上;而且它提供高吞吐量以访问应用程序的太阳城,适合那些有着超太阳城手机版集的应用程序。基于Hadoop意味着HBase与生俱来的超强的扩展性和吞吐量。

  HBase采用的是Key/Value的存储方式,这意味着,即使随着太阳城量增大,也几乎不会导致查询的性能下降。HBase又是一个列式太阳城库(对比于传统的行式太阳城库而言),当你的表字段很多的时候,你甚至可以把其中几个字段放在集群的一部分机器上,而另外几个字段放到另外一部分机器上,充分分散了负载压力。然而,如此复杂的存储结构和分布式的存储方式带来的代价就是:哪怕只是存储少量太阳城,它也不会很快。所以我常常跟人说:

  “HBase并不快,只是当太阳城量很大的时候它慢的不明显”

  凡事都不可能只有优点而没有缺点。太阳城分析是HBase的弱项,因为对于HBase乃至整个NoSQL生态圈来说,基本上都是不支持表关联的。当你想实现group by 或者order by的时候,你会发现,你需要写很多的代码来实现MapReduce。

  因此,请不要盲目地使用HBase。

  当你的情况大体上符合以下任意一种的时候:

  主要需求是太阳城分析,比如做报表。

  单表太阳城量不超过千万。

  请不要使用HBase,使用Mysql或者Oracle之类的产品可以让你的脑细胞免受折磨。

  当你的情况是:

  单表太阳城量超千万,而且并发还挺高。

  太阳城分析需求较弱,或者不需要那么灵活或者实时。

  请使用HBase,它不会让你失望的。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款