你好,游客 登录 注册 搜索
背景:
阅读新闻

Apache Kylin v1.6.0正式发布

[日期:2016-12-12] 来源:infoq.com  作者:史少锋 [字体: ]

Apache Kylin社区非常高兴地宣布,继1.5.0后的又一个主要发行版 v1.6.0于日前正式发布。

Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力,支持对超大规模数据进行秒级查询。

Apache Kylin v1.6.0带来了更可靠更易于管理的从Apache Kafka流中直接构建Cube的能力,使得用户可以在更多场景中更自然地进行数据分析,使得数据从产生到被检索到的延迟,从以前的一天或数小时,降低到数分钟。

全新的流式构建引擎

全新的Apache Kylin流式构建引擎是在Kylin v1.5的"可插拔 "架构下的一个完美实现︰ 将Kafka主题视为一种数据源,实现相应的适配器,将数据先抽取、转换和保存到 HDFS,接下来使用各种Kylin的构建引擎(MR/Spark等)对数据进行并行计算 。

Kylin将开始/结束消息的偏移量(offset)计入了每个Cube segment,并使用偏移量作为分区值,从而对于早到达和晚到达的消息最终都能够被检索到,从而保证了查询结果的准确性。

此外,Kylin ODBC Driver也发布了新的1.6版本,对Tableau、PowerBI和Cognos BI有了更好支持。

在这一版本中Apache Kylin社区一共解决了102个issue,包括Bug修复,功能增强及一些新特性等。主要issue有:

[KYLIN-1726] - 可伸缩的流式Cube构建

[KYLIN-1917] - TopN性能增强

[KYLIN-1919] - 支持Kafka的嵌入格式的JSON消息

[KYLIN-2012] - 可靠同步hive表模式更改

[KYLIN-2054] - 支持更多Kafka消息的时间戳格式

[KYLIN-2055] - 增加Boolean编码

[KYLIN-2070] - 支持多segment并行构建/合并/刷新

[KYLIN-2082] - 支持更新流式表模式和配置的修改

下载安装:

下载Apache Kylin v1.6.0源代码及二进制安装包,请访问下载页面。

升级:

此版本的元数据向前兼容,请参考[升级指南](https://kylin.apache.org/docs16/howto/howto_upgrade.html)进行升级

获得支持

升级和使用过程中有任何问题,请:

提交至Kylin的JIRA: https://issues.apache.org/jira/browse/KYLIN/

或者

发送邮件到Apache Kylin邮件列表: user@kylin.apache.org和dev@kylin.apache.org

感谢每一位朋友的参与和贡献!

作者介绍

史少锋,Kyligence技术合伙人&资深架构师 Apache Kylin核心开发者和项目管理委员会成员(PMC),专注于大数据分析和云计算技术。曾任eBay全球分析基础架构部大数据高级工程师,IBM云计算部门软件架构师;曾是IBM公有云Bluemix dev&ops团队核心成员,负责平台的规划、开发和运营。

本文永久更新链接地址http://www.linuxidc.com/Linux/2016-12/138224.htm

linux
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款