HBaseCon是Apache软件基金会官方授权,Apache HBase社区支持举办的技术会议,主要目的是分享,交流HBase这个开源分布式大数据存储的使用和开发以及发展。HBaseCon发起于2012年。为了满足中国用户和开发者的热情,HBaseCon从2017年开始每年在中国举行。今年的HBaseCon,由小米主办,作为HBase社区国内的主要贡献者,阿里巴巴联合小米等国内主流互联网企业一起协办了此次会议。2019年7月20日,HBaseConAsia2019在北京金隅喜来登酒店举行,并圆满落幕。
此次会议中,不仅有来自Cloudera、Intel、阿里、小米、华为等研发大厂给大家分享了在HBase内核方面的改进和优化,还有像Pinterest、滴滴、快手等一线互联网公司带来了HBase及大数据技术生态的最新洞察和行业实践。除此之外,金融,电信等行业的嘉宾们也给大家讲述了在传统行业中,HBase怎样助力业务腾飞。HBaseConAsia2019为广大HBase开发者以及使用者带来了一场优质的技术盛宴,此次大会一共吸引了超过500名参会者,共有超过2万余人从网上观看了大会直播,足以见证HBase社区在中国的火爆程度。
阿里云资深技术专家沈春辉给大家分享了在云上运行HBase的优势和技术趋势。阿里2010年就开始使用HBase,经过9年的发展,现在在阿里内部使用HBase的业务已经超过1000+,拥有了上万台的HBase集群规模。而近3年来,经过阿里深度定制的HBase版本,已经在阿里云上售卖,目前已经服务了1000+企业用户。而HBase上云,给用户带来最显著的优势就是极致的弹性和成本下降。
云上资源能够快速创建,以及近似无限的资源池能够帮助业务快速应对大型促销活动,突发流量以及异常流量。同时,云上计算与存储分离的架构,能够灵活配比各种业务所需要的存储类型和大小,降低存储成本。
HBase做为Hadoop生态的数据库,最大的优势就是可以和Hadoop生态体系下各种组件方便的结合。业务在使用HBase做存储时,通常也需要搭配计算组件,以及一些数据中间件。各大厂商围绕着HBase,组建了一系列大数据平台,满足不同业务的需求。比如在会上,阿里云技术专家李伟就给大家带来了阿里云HBase X-Pack 平台的架构。这是一套围绕HBase,集成Spark、Solr等技术的云上大数据平台,可以提供低成本的一站式存储、检索和计算能力。其中使用HBase存储在线数据,可以通过BDS系统把数据增强导出到Spark中做归档和离线分析,然后支持将计算结果通过BulkLoad技术高效回流到HBase,使得客户的在离线数据轻松打通,真正发挥企业的数据价值。
原生的HBase只有Rowkey索引,在面对一些复杂的查询时,需要用到一些二级索引的方案。另外,有些用户可能对关系型数据库的SQL语法比较熟悉,因此希望用SQL能够访问HBase。在面对这些需求时,一个选择就是Phoenix。Phoenix为HBase提供了SQL访问层和二级索引的能力。来自阿里云的技术专家张赟分享了阿里云HBase在Phoenix上做的一些改。一个最重要的变化是云HBase的Phoenix从以前的重客户端演变成了轻客户端,以便给用户提供更好的稳定性和可维护性。同时用户客户端的逻辑更轻,CPU的消耗也变少。
除了Phoenix,会上还有许多其他公司提出了自己的索引和SQL方案。比如华为认为Phoenix过重,在OLTP场景时性能不够好,同时在scale out时有瓶颈。因此他们自研了一套轻量级的SQL方案-Lemon SQL,相比Phoenix,他们的实现更加轻量级、性能更高、吞吐扩展也更强。
介于目前用户对索引和SQL的呼声越来越高,在第二天的开发者和HBase社区Committer&PMC会议上,大家也一致决定,会在后续的HBase版本中原生加入SQL和二级索引支持,大家敬请期待吧。
丰富多彩的HBase使用场景会上,来自各行各业的开发者们分享了他们使用HBase的场景。来自快手的工程师徐明为我们分享了 HBase 在快手的应用和实践。他们使用HBase+HDFS的方式来存储快手上的海量小视频。他们把视频文件直接存储在HDFS上,同时把索引数据存储在HBase里。另外,他们还对HBase的稳定性可用性做了大量优化,可以看到快手在HBase研发投入了非常大的力量。
这次HBaseCon的火爆程度,也说明了国内业界公司和开发者们对HBase热情和期望。HBaseCon大会不仅给HBase的使用者们带来了最新鲜的一手咨询,互通有无,吸收其他公司的先进经验,也是HBase使用者和开发者之间沟通的桥梁,能让开发者们看到业界动态,用户的需求,共同把HBase打造成一个更加易用,更高性能,更稳定的大数据存储。
最后目前,云HBase增强版已经在阿里云官网上线。云HBase增强版使用了阿里内部HBase分支,历经阿里巴巴近十年的大规模锤炼,在读写性能、延迟、存储成本、故障恢复、安全、易用性等方面对比社区版有质的突破。欢迎大家点击此处了解详情。
09-01 来源:网络
11-05 来源:网络
01-31 来源:网络
05-10 来源:网络
08-05 来源:网络
01-03 来源:未知
09-24 来源:未知
06-05 来源:网络
02-12 来源:未知
11-04 来源:网络