您当前的位置:首页>课程>揭秘Apache Kylin :Hadoop上的数据仓库

揭秘Apache Kylin :Hadoop上的数据仓库

浏览:2755
分享

Byron Li Read more

百林哲咨询(北京)有限公司专家团队成员

Kyligence  Inc 联合创始人兼CTO,专注于大数据分析,并行计算,数据索引,关系数学,近似算法,压缩算法等前沿技术。

简介

随着大数据领域开源工具的不断发展,越来越多的企业将数据平台搭建到Hadoop、Hive、Spark等。Apache Kylin作为Hadoop上的新型数据仓库。它在大数据上提供标准的SQL接口,能够提供亚秒级的查询速度和超大规模的并发性能。大数据直接对接在线应用重新成为可能,交互式的BI极大解放大数据生产能力。其中:Apache Kylin背后的技术原理为何? 企业如何根据自身情况使用开源软件Apache Kylin? 在最新的Apache Kylin版本中灵活查询(Ad-hoc Query)又是如何实现的? 实际操作中,如何让Apache Kylin替代传统的Hive和SparkSQL? 揭秘全球100多家公司是如何部署Apache Kylin?本次演讲理论结合实际案例,娓娓道来其背后的演变历史和设计考量。

目标
a)了解Hadoop上的新型数据仓库-Apache Kylin的工作原理 
b)如何使用经典Cube理论极大解放数据查询速度 
c)了解如何使用在线自助平台优化工具 
d)Apache Kylin最新功能-Snowflake雪花模型、Spark Cubing构建以及Streaming流式构建等
e)了解灵活查询的系统设计以及经典案例

课程时长

2天(12H)

受众人群

数据科学家、数据库管理员、分析师、高级工程师、系统架构师、项目经理,以及企业的CIO和CTO。

分享提纲

1.Apache Kylin的工作原理 1.1 如何提升查询速度
 1.2 无缝融合预计算和在线计算的实现
2.Apache Kylin亚秒级查询实践 2.1 SSB基准测试和TPC-H基准测试
   2.2 性能的优化以及最新的研发成果的使用 
3.灵活查询(Ad-hoc Query)的系统设计、工作原理和用户案例 
4.问题和解答




我要参加

可同时提交您的需求,我们会及时与您联系

预约内训

将课程带入到您的团队,为您的团队进行一对一辅导。

相关课程